Nach div. Tests zeigt sich, dass sich das aktuelle Qwen 2512 recht gut für Cartoons eignet. Es ist jetzt in der Lage einen 4 Panel Cartoon zu erzeugen. Zudem hat sich die Konsistenz der Charaktere deutlich verbessert.
Allerdings ändert sich der Stil immer wieder von Version zu Version. Im neuesten Release 2512 sieht es wieder anders aus als in der vorherigen Version. Diese soll eigentlich dazu dienen den Realismus der Bilder zu erhöhen, sowie dessen Fähigkeit Texte zu schreiben. Release 2511 brachte schon einiges an Bildbearbeitungsmöglichkeiten (z.B. Kamerapositionen ändern, Relighting), insbesondere mit speziellen Loras.
Auf Deutsch funktioniert das leider eher nicht. Aber immerhin gehen Comic Stil Elemente wie z.B. Sprech- und Gedankenblasen.
Sehr unübersichtlich wird es wenn man noch die verschiedenen Ausführungen der Modelle (quantisiert, etc.) nutzt oder mit div. LoRas arbeitet. Insgesamt ergibt sich so eine unüberschaubare Anzahl an möglichen Abläufen mit durchaus recht unterschiedlichen Ergebnissen.
Es bleiben nach wie vor die bekannten Probleme. Man muss immer wieder sehr viele Ausgaben produzieren bzw. Bilder nachbearbeiten, weil irgendetwas nicht korrekt erzeugt wurde. Das passiert bei den grossen Modellen genauso wie bei den quantisierten und/oder mit LoRas erweiterten Abläufen.

Da das Original Modell doch recht lange braucht, ist es immer wieder eine gute Idee die Beschleuniger LoRas zu nutzen. Die meisten templates (comfyui/wangp) kommen mit div. lightning LoRas, die die Erzeugung deutlich beschleunigen, allerdings oft auch mehr Fehler verursachen und vor allen Dingen meist den Cartoon Look entfernen, so dass die Bilder eher fotorealistisch werden.
Ein empfehlenswertes LoRa das den Cartoon Look behält, ist z.B. https://huggingface.co/Wuli-art/Qwen-Image-2512-Turbo-LoRA

