HowTo: Konsistente Charaktere mit Dall-E3

0
392

In Dall-E3 gibt es eine sehr gute Möglichkeit, fast perfekte konsistente Charakter in völlig unterschiedlichen Szenen zu generieren. Diese “character consistency” ist bisher eines der größten Probleme von KI Bildgeneratoren.

Ihr müsst dazu (in Chat GPT4 bzw. Microsoft Bing) ein Motiv beschreiben und Dall-E3 dabei vier unterschiedliche Bildwünsche mitgeben. Meint Person A in Situation A, in Situation B und so weiter. Verständlicher wird das sicher mit meinem Beispielprompt:

Please generate a photo montage in manga style of Captain Nemo, a tall man with short black hair, round glasses. Top-left shows him standing in his orange uniform in the command center of his spaceship in steampunk design. Top-right portrays him reading a book about the universe. Bottom-left captures him running away from a strange dragon like creature on a mars like planet. Bottom-right depicts him standing in his yellow spacesuit on a Venus like lava planet.

bzw. noch einmal mit der Vorgabe:

... photo montage in photorealistic pictures of Captain Nemo ...

Ansonsten fällt Euch sicher auf, dass die Bilder nicht immer treu den Vorgaben entsprechen bzw. es bei der fotorealistischen Variante sechs unterschiedliche Motive hat. Mehr zu Dall-E3, dem Textverständnis, dem Prompting in Dialogform sowie einem direkten Vergleich mit Midjourney habe ich ausführlich in einem separaten Beitrag beschrieben.

Achja, bei einem Gegenstand, einem UFO hat es nicht so gut funktioniert, das muss ich mir noch einmal näher vorknöpfen – bzw. dürft Ihr das natürlich auch 😉

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein