Ich habe fast den ganzen Tag mit InvokeAI rumgespielt (Da verfliegt die Zeit, das sage ich euch...) und das ganze Geheimnis ist,
die berechnete Bildgröße so hoch wie möglich zu konfigurieren. Erst als ich das auf 1280x512 Pixel gesetzt habe, bekam ich das erste gute Ergebnis. Alles andere davor war nicht wirklich zu gebrauchen.
(Berechnungsdauer auf einer RTX2060 SUPER ca. 30 Minuten - 8 GB Video-RAM sind hierfür wohl das Minimum und genau das hat meine Karte)
Nachfolgend die zu diesem Bild gehörigen Metadaten für Invoke AI (Die Werte werden mit in die Extradaten des PNG Bilds geschrieben. Alle Werte sind wichtig, damit man be einer erneuten Berechnung auch dasselbe Bild erhält. Der "Seed" Wert steht Standardmäßig auf Zufall und wird bei jeder Berechnung neu berechnet. Man muss den also fix angeben, damit man dasselbe Ergebnis erhält:
Ergänzung:
Im nachfolgenden Abschnitt "controlnets" fehlt der passende "Processor" Modus mit dem Wert "Canny". Damit werden von der Eingabegrafik die "Outlines" (also die Konturen mit einem harten Kontrast) berechnet und als Eingabe für die AI genutzt, damit diese weiß, worauf sie sich beziehen soll.
{
"generation_mode": "sdxl_txt2img",
"positive_prompt": "16 bit pixelart, beach bedroom, nerd room, palm tapestry, floyd steinberg, pirates, monkey island style, guybrush, carribean",
"negative_prompt": "",
"width": 1280,
"height": 512,
"seed": 296104323,
"rand_device": "cpu",
"cfg_scale": 7,
"cfg_rescale_multiplier": 0,
"steps": 50,
"scheduler": "euler",
"model": {
"model_name": "juggernautXL_v7Rundiffusion",
"base_model": "sdxl",
"model_type": "main"
},
"controlnets": [
{
"image": {
"image_name": "cb6ecade-d172-4c40-992c-e03e21bd9676.png"
},
"control_model": {
"model_name": "controlnet-canny-sdxl-1.0",
"base_model": "sdxl"
},
"control_weight": 0.75,
"begin_step_percent": 0,
"end_step_percent": 1,
"control_mode": "more_prompt",
"resize_mode": "just_resize"
}
],
"positive_style_prompt": "",
"negative_style_prompt": ""
}
Downloads:- InvokeAI:
https://github.com/invoke-ai/InvokeAI/releases/ - Das Basisprogramm. Setzt Python 3.10.x voraus. Ohne 16 GB Arbeitsspeicher plus mindestens 8 GB Grafikkartenspeicher braucht ihr vermutlich gar nicht erst versuchen zu testen.
- juggernautXL_v7Rundiffusion:
https://civitai.com/models/133005/juggernaut-xl - Ein sogenanntes Model für die AI, die simpel ausgedrückt beschreibt, wie ein Bild auszusehen hat.
- controlnet-canny-sdxl-1.0:
https://models.invoke.ai/diffusers/controlnet-canny-sdxl-1.0 - Eine Art Erweiterung, die es ermöglicht bestimmte Teile eines vorhandenen Bilds als Eingabe für die AI zu nutzen. Das können Outlines, Farben, Tiefeninformationen usw. sein.
@Kaktus:
Vielen Dank für Deinen Anstoß - ich bin zwar fast verzweifelt und wollte schon schreiben, dass es hier einfach nicht funktionieren will aber dann habe ich als letztes mal die Ausgabeauflösung hochgeschraubt und jetzt bin ich ein wenig gehyped