Freitag, Januar 17, 2025
StartAnwendungenMidjourneyKI Bilder mit der gleichen Person

KI Bilder mit der gleichen Person

KI Bilder mit der gleichen Person sind der ‚heilige Gral‘ der KI Bildgenerierung. Man möchte sich selbst oder einen generierten Charakter (Person, Maskottchen, Roboter…) in verschiedenen Szenen, Umgebungen und Aktionen erstellen. Anwendungen sind Werbung, Tutorials, Comics und überall dort, wo es ein cooles Storytelling braucht.

Da jedes KI Bild jedoch von Grund auf neu generiert wird bzw. die Programme nicht verstehen was sie generieren, sondern nur auf trainiertes Bildmaterial zurückgreifen – die Software weiß wie eine Hand aussieht, aber nicht wozu sie da ist. Daher kann sie auch nicht erkennen, ob sie anatomisch korrekt generiert wird oder nicht – sind Serien konsistenter Charaktere bisher noch nicht bzw. nur auf Umwegen und nicht perfekt möglich.

In dieser Übersicht zeige ich Euch, wie Ihr Euch mit den verschiedenen Programmen wie Midjourney, Leonardo AI, Stable Diffusion und Dall-E3 solchen Bildern zumindest nähern könnt.

UPDATE 1: Einen aktuellen (Sommer 2024) Vergleich der sogenannten Character Reference findet Ihr in unserem ausführlichen Artikel.

UPDATE 2: In Midjourney funktioniert die Character Reference Funktion immer noch nicht mit Fotos von Personen, dafür könnt Ihr mit dem neuen Editor eigene Fotos hochladen und die komplette Umgebung sowie auch Eure Kleidung neu generieren lassen.

UPDATE 3: Das Generieren eigener Modelle auf Basis von ein paar wenigen Fotos wird immer einfacher und benutzerfreundlicher. Aktuelle Infos erhaltet Ihr weiter unten in dem Abschnitt Flux eigene Modelle trainieren.

Update Oktober 2024: Midjourney Editor

Mit dem neuen Midjourney Editor könnt Ihr endlich auch eigene Fotos bearbeiten, yeah! Eine ausführliche Anleitung findet Ihr in unserem entsprechenden Artikel.

Midjourney Character Reference (–cref Parameter)

In Midjourney empfiehlt sich der folgende Workflow:

  • Bild eines Charakters generieren/ Foto eines Charakters suchen
  • Dieses Bild/ Foto als Vorlage nutzen und den Charakter mit anderen Gesichtsausdrücken und mit anderen Posen erstellen
  • Diese Bilder jeweils wiederum als Vorlage nutzen und mit Szenen kombinieren.

Verständlich? Nein, natürlich nicht 😉 Das Vorgehen im Detail mit vielen Beispielen erklärt findet Ihr daher hier:

Midjourney selbst hat das Thema konsistente Charaktere übrigens auf seiner Roadmap. Wie und wann das umgesetzt werden soll steht allerdings noch nicht fest.

Midjourney arbeitet übrigens daran, dass die Character Reference zukünftig sogar mit mehreren Personen (über Umwege funktioniert das sogar jetzt schon) auf einem Bild funktioniert bzw. an einer ganzen Storytelling Funktionalität.

Achja, falls Ihr zudem noch mit Eurem eigenen Gesicht arbeiten möchtet empfehle ich die Verwendung von InsightFaceSwap.

Stable Diffusion/ Flux eigene Modelle trainieren

Stable Diffusion ist sicher der mächtigste Bildgenerator, aber auch der komplizierteste. Mit lokaler Installation, Verknüpfungen, diversen Oberflächen und mehr ist die Installation wie auch die Nutzung der vielen Möglichkeiten eher etwas für IT-Nerds.

Praktischerweise ist Andreas ein solcher und arbeitet sich aktuell in Tools wie Fooocus und Odyssey ein. Demnächst werden wir hier also auch für Stable Diffusion Tipps zu konsistenten Charakteren hier geben.

UPDATE: Mittlerweile haben wir uns dem Thema Training eigener Modelle gewidmet und zeigen Euch in unserem entsprechenden Flux-Artikel, wie Ihr Euch selbst als KI-Version generieren könnt bzw. wie das neuerdings noch viel einfacher über die Plattform Krea klappt.

KI Bilder mit der gleichen Person
Hier habe ich mich selbst mit Flux generiert

Leonardo Character Reference und Modelltraining

Leonardo AI ist so etwas wie „Stable Diffusion für Arme“ 🙂 Im Ernst, Leonardo bietet eine sehr übersichtliche Oberfläche und greift auf viele Stable Diffusion Modelle, Funktionen und Parameter zu. So auch auf die Image Guidance genannten Möglichkeiten, Bilder als vielfältige Vorlagen (Image to Image, Edge to Image, Pose to Image) zu verwenden und sich mit deren Hilfe an konsistenten Bildern zu versuchen.

Seit einiger Zeit bietet Leonardo zudem eine Character Reference wie Midjourney an. Wir stellen Euch diese in diesem Artikel vor bzw. vergleichen wir hier die Ergebnisse mit Midjourney.

Zudem kann man auch mit Leonardo eigene Modelle trainieren. Ich habe das neulich einmal ausprobiert. Grundsätzlich funktioniert das ganz o.k., aber mit diversen Einschränkungen. Daher macht ein Training eigener Modelle mit Flux aus unserer Sicht deutlich mehr Sinn.

Dall-E3 (Bing)

In Dall-E3 (kann über Chat GPT wie auch Microsoft Copilot/ Bing genutzt werden) könnt Ihr konsistente Charaktere zumindest in einem Schwung erstellen. Meint einen Prompt, welcher eine Person in einem Bild in mehreren Szenarien generiert.

Die Bilder müsstet Ihr dann aber aus dem einen generierten Bild ausschneiden und vergrößern. Dafür gibt es mittlerweile eine große Anzahl an Upscalern bzw. könntet Ihr die Bilder auch mit Adobe Photoshop bearbeiten und erweitern.

Man kann in Dall-E3 zudem mit einem sogenannten seed arbeiten, die Methode werde ich mir demnächst in Ruhe anschauen und darüber schreiben.

Fazit

Es gibt viele gute Ansätze, um KI Bilder mit immer der gleichen Person zu generieren, aber noch keine ‚out of the box‘ Lösung. Das dürfte allerdings nur noch eine Frage der Zeit sein.

Kennt Ihr noch weitere oder alternative Ansätze, so schreibt uns diese sehr gerne in die Kommentare. Damit habt Ihr dann sogar die Chance, in einem der nächsten Newsletter erwähnt zu werden.

Mittlerweile gibt es immer bessere und einfachere Möglichkeiten Bilder mit der immer gleichen Person, sogar von Euch selbst zu generieren.

Während ich diese Zeilen schreibe, trainiere ich im Hintergrund übrigens mein erstes eigenes Videomodell mit Kling AI. Abonniere gerne unseren Newsletter und Du wirst als erster erfahren, wie das funktioniert!

RELATED ARTICLES

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein

Aktuell beliebt

Aktuelle Kommentare