Donnerstag, April 17, 2025
StartAnwendungenGoogleKonsistente Charaktere mit Google Gemini 2.0 Flash

Konsistente Charaktere mit Google Gemini 2.0 Flash

Gerade haben wir euch Googles neues experimentelles Modell Gemini 2.0 Flash vorgestellt – aber wir experimentieren weiter und finden direkt neue coole Features in der Wundertüte.

Google Gemini 2.0 Flash erstellt innerhalb von Sekunden konsistente Charaktere, die sich im Dialog weiter entwickeln und inszenieren lassen.

Portrait realistic photo of an old grumpy man with beard and double chin: Rotate this face into four positions: side, back, three-quarter, and facing upward.

Dieses Beispiel wurde in weniger als 4 Sekunden generiert:

Grumpy Old Man, generiert mit Google Gemini 2.0 Flash

Beeindruckend – aber können wir mit der gleichen Person weitere Bilder generieren?

show a full body shot of the same person with a white background

Das scheint schon mal zu funktionieren, jetzt platzieren wir ihn in einer Situation:

let him wear chequered pyjamas, he is standing on a dirty green lawn in front of his house

Hier nimmt die Qualität deutlich ab, hier wird nicht die Person inszeniert, sondern das letzte Bild bearbeitet, so dass die Szene sehr künstlich aussieht. Auch die Person hat gelitten: Er hat jetzt zwar Schlafanzug-Hosen an, aber sein rechtes Auge sieht jetzt sehr seltsam aus…

Zweiter Versuch: Hell’s Angle mit Tattoo

Im zweiten Versuch bin ich etwas weiter ins Detail gegangen, um die Konsistenz zu checken:

Portrait realistic photo of an old Hell’s Angels members with beard and a tattoo "bourn to ride" on his forehead: Rotate this face into four positions: side, back, three-quarter, and facing upward.

Und ja: Der Rechtschreibfehler im Tattoo ist Absicht…

Hell’s Angel, generiert mit Google Gemini 2.0 Flash

Hier wird wieder eine sehr realistische Person gezeigt, aber beim genaueren Hinsehen verrutscht das Tattoo etwas. Wenn wir diese Person jetzt in anderem Kontext platzieren, gibt es ein ähnliches Phänomen wie beim ersten Durchlauf: Der Gesamt-Look des Bilds wird künstlich und die Detail-Darstellung der Person leidet deutlich:

Soweit ein schneller Test – das Ergebnis entspricht den anderen Erfahrungen mit diesem Modell:

  • Sehr schnell
  • Ermöglicht sehr spannende Anwendungen
  • Ergebnisse lassen sich nicht wirklich verwenden – jedenfalls noch nicht!

Das Modell wird von Google selber noch als experimentell deklariert – wir schauen es uns auf jeden Fall erneut an, sobald es offiziell und als Produktiv-Version angeboten wird!

Sollen wir dich über Gemini 2.0 Flash auf dem Laufenden halten? Einfach unseren kostenlosen Newsletter abonnieren!

Weitere Beispiele

Andreas Jürgensen
Andreas Jürgensenhttps://www.ai-imagelab.de
Andreas ist Jahrgang 1966, in Schleswig-Holstein aufgewachsen und mittlerweile gut assimilierter Rheinländer – seit er zum Studium als Fotoingenieur nach Köln zog. Seit über 20 Jahren betreibt er zahlreiche Diskussionsforen rund um diverse Fotomarken.
RELATED ARTICLES

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein

Aktuell beliebt