Mittwoch, Mai 14, 2025
StartAnwendungenMidjourneyKI Bilder mit der gleichen Person

KI Bilder mit der gleichen Person

KI Bilder mit der gleichen Person sind der ‚heilige Gral‘ der KI Bildgenerierung. Man möchte Figuren mit dem eigenen Gesicht oder einen generierten Charakter (Person, Maskottchen, Roboter…) in verschiedenen Szenen, Umgebungen und Aktionen erstellen. Anwendungen sind Werbung, Tutorials, Comics und überall dort, wo es ein cooles Storytelling braucht.

Praktischerweise tut sich sehr viel in der Richtung und das Generieren von konsistenten Personen wird immer einfacher. Das habe ich zum Anlass genommen, den Artikel einmal wieder auf den aktuellsten Stand (Mai 2025) zu bringen.

Eigene Modelle trainieren (Konsistenz ca. 100%)

Die beste und genaueste Möglichkeit, eine (fiktive oder reale) Person mit KI zu generieren, ist das Trainieren eines eigenen Modells dieser Person. Was zu Anfang nur Nerds und IT-Profis vorbehalten war, ist mittlerweile dank Flux API und Plattformen wie Krea AI und Freepik fast schon zum Kinderspiel geworden.

Es reichen 15 bis 20 Smartphone-Bilder einer Person, um ein wirklich brauchbares Modell zu trainieren – wie wir Euch in unserem KI-Modelltraining Vergleich zeigen.

Diese Modelle sind jedoch auf Geschwindigkeit, und nicht unbedingt auf Qualität und Flexibilität trainiert. Heißt die Ergebnisse sind durchaus brauchbar, aber hier und da mit typischen Trainingsfehlern (z.B. dem ausgeprägten Flux-Kinn) versehen und nicht für jedes Motiv geeignet. Zudem räumen sich Krea wie auch Freepik umfangreiche Rechte an den hochgeladenen Trainingsbildern ein, so dass der DSGVO alle Haare zu Berge stehen. Diese Dienste solltet Ihr also nur für eigene Bilder oder Bilder nutzen, bei denen Ihr die entsprechenden Nutzungsrechte habt.

Für perfekte (und DSGVO konforme) Ergebnisse braucht es weiterhin ein aufwendiges, mehrstufiges Training mit Stable Diffusion oder Flux. Entweder lokal auf Eurem Rechner oder über einen professionellen (und DSGVO-konforme) Dienst wie Flaic.

KI Bilder mit der gleichen Person
Hier habe ich mich selbst mit Flux generiert

Character Reference in Chat GPT 4o Imaging (Konsistenz ca. 80 bis 90%)

Brandneu und heiß ist das neue Chat GPT 4o Imaging mit einer sehr guten Character Reference. Im einfachen Dialog kann man eine Person in verschiedenen Ansichten, mit unterschiedlicher Kleidung und in diversen Szenen generieren. Eine ausführliche Anleitung folgt demnächst.

Das funktioniert auch mit den Fotos realer Personen, wie ich es gleich einmal an mir selbst getestet habe. Die Konsistenz mit meinem realen Ich liegt gefühlt bei 80%, ist in sich aber stimmig und durchaus brauchbar erkennbar.

Sogar als knuddeligen Pixar-Character könnt Ihr Euch mit GPT-4o generieren 🙂

Midjourney Character (Omni) Reference (Konsistenz ca. 70 bis 80%, aber nicht mit realen Personen)

UPDATE: Midjourney hat heute (2. Mai) eine Omni Reference für die Version 7 vorgestellt. Damit kann man auf eine Person oder auch Objekt referenzierten. Andreas hat es schon für Euch getestet, wir werden den Artikel hier demnächst auch entsprechend anpassen – und natürlich testen, ob die Konsistenz evtl. sogar höher als die 70 bis 80% der Character Reference des 6er Modells liegen bzw. wie gut sie mit Fotos von realen Personen funktioniert, was endlich der Fall sein könnte!

Vor kurzem hat Midjourney die Version 7 veröffentlicht, allerdings noch ohne die Character Reference Funktionalität. Diese reichen wir nach, sobald sie zur Verfügung steht. Bis dahin erklären wir Euch kurz, wie Ihr den --cref Parameter unter Midjourney v6 nutzt:

In Midjourney empfiehlt sich der folgende Workflow:

  • Bild eines Charakters generieren bzw. Foto eines Charakters suchen
  • Dieses Bild / Foto als Vorlage nutzen und den Charakter mit anderen Gesichtsausdrücken und mit anderen Posen erstellen
  • Diese Bilder jeweils wiederum als Vorlage nutzen und mit Szenen kombinieren.

Verständlich? Nein, natürlich nicht 😉 Das Vorgehen im Detail mit vielen Beispielen erklärt findet Ihr daher hier:

Midjourney arbeitet übrigens daran, dass die Character Reference zukünftig sogar mit mehreren Personen (über Umwege funktioniert das sogar jetzt schon) auf einem Bild funktioniert bzw. an einer ganzen Storytelling Funktionalität.

ACHTUNG: Die Character Reference funktioniert nur mit in Midjourney generierten Personen und nicht mit einem Foto einer realen Person. Dafür müsstet Ihr den halbwegs brauchbaren Umweg über InsightFaceSwap nehmen.

Weitere Alternativen zu den genannten Tools

Leonardo Character Reference und Modelltraining

Leonardo AI ist so etwas wie „Stable Diffusion für Arme“ 🙂 Im Ernst, Leonardo bietet eine sehr übersichtliche Oberfläche und greift auf verschiedene Stable Diffusion Modelle, Funktionen und Parameter zu. So auch auf die Image Guidance genannten Möglichkeiten, Bilder als vielfältige Vorlagen (Image to Image, Edge to Image, Pose to Image) zu verwenden und sich mit deren Hilfe an konsistenten Bildern zu versuchen.

Seit einiger Zeit bietet Leonardo zudem eine Character Reference ähnlich wie Midjourney an. Wir stellen Euch diese in diesem Artikel vor bzw. vergleichen wir hier die Ergebnisse mit Midjourney & Co.

Zudem kann man auch mit Leonardo neuerdings auch eigene Modelle trainieren.

Fotos mit dem Midjourney Editor bearbeiten

Mit dem neuen Midjourney Editor könnt Ihr endlich auch eigene Fotos bearbeiten, yeah! Eine ausführliche Anleitung findet Ihr in unserem entsprechenden Artikel.

Experimentelles Stadium: Google Gemini Flash

Noch im experimentellen Stadium befindet sich Google Gemini 2.0 Flash, bietet aber auch die Möglichkeit, konsistente Charaktere zu generieren. Noch nicht perfekt, aber definitiv mit Potential!

Dall-E3 / Bing (nicht mehr aktuell)

In Dall-E3 (kann über Chat GPT wie auch Microsoft Copilot/ Bing genutzt werden) könnt Ihr konsistente Charaktere zumindest in einem Schwung erstellen. Meint einen Prompt, welcher eine Person in einem Bild in mehreren Szenarien generiert.

Die Bilder müsstet Ihr dann aber aus dem einen generierten Bild ausschneiden und vergrößern. Dafür gibt es mittlerweile eine große Anzahl an Upscalern bzw. könntet Ihr die Bilder auch mit Adobe Photoshop bearbeiten und erweitern.

Man kann in Dall-E3 zudem mit einem sogenannten seed arbeiten, die Methode werde ich mir demnächst in Ruhe anschauen und darüber schreiben.

Fazit

Mittlerweile gibt es immer bessere und einfachere Möglichkeiten Bilder mit der immer gleichen Person, sogar von Euch selbst zu generieren. Am Ende kommt es auf den gewünschten Einsatzzweck an, welches Tool für Euch das beste ist.

Mittlerweile lässt sich sogar ein eigenes Video-Modell trainieren.

Abonniere gerne unseren Newsletter und bleibe auf dem Laufenden, was das Generieren von KI-Bildern mit immer der gleichen Person betrifft!

RELATED ARTICLES

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein

Aktuell beliebt