Gerade haben wir euch Googles neues experimentelles Modell Gemini 2.0 Flash vorgestellt – aber wir experimentieren weiter und finden direkt neue coole Features in der Wundertüte.
Google Gemini 2.0 Flash erstellt innerhalb von Sekunden konsistente Charaktere, die sich im Dialog weiter entwickeln und inszenieren lassen.
Portrait realistic photo of an old grumpy man with beard and double chin: Rotate this face into four positions: side, back, three-quarter, and facing upward.
Dieses Beispiel wurde in weniger als 4 Sekunden generiert:

Beeindruckend – aber können wir mit der gleichen Person weitere Bilder generieren?
show a full body shot of the same person with a white background

Das scheint schon mal zu funktionieren, jetzt platzieren wir ihn in einer Situation:
let him wear chequered pyjamas, he is standing on a dirty green lawn in front of his house

Hier nimmt die Qualität deutlich ab, hier wird nicht die Person inszeniert, sondern das letzte Bild bearbeitet, so dass die Szene sehr künstlich aussieht. Auch die Person hat gelitten: Er hat jetzt zwar Schlafanzug-Hosen an, aber sein rechtes Auge sieht jetzt sehr seltsam aus…
Zweiter Versuch: Hell’s Angle mit Tattoo
Im zweiten Versuch bin ich etwas weiter ins Detail gegangen, um die Konsistenz zu checken:
Portrait realistic photo of an old Hell’s Angels members with beard and a tattoo "bourn to ride" on his forehead: Rotate this face into four positions: side, back, three-quarter, and facing upward.
Und ja: Der Rechtschreibfehler im Tattoo ist Absicht…

Hier wird wieder eine sehr realistische Person gezeigt, aber beim genaueren Hinsehen verrutscht das Tattoo etwas. Wenn wir diese Person jetzt in anderem Kontext platzieren, gibt es ein ähnliches Phänomen wie beim ersten Durchlauf: Der Gesamt-Look des Bilds wird künstlich und die Detail-Darstellung der Person leidet deutlich:

Soweit ein schneller Test – das Ergebnis entspricht den anderen Erfahrungen mit diesem Modell:
- Sehr schnell
- Ermöglicht sehr spannende Anwendungen
- Ergebnisse lassen sich nicht wirklich verwenden – jedenfalls noch nicht!
Das Modell wird von Google selber noch als experimentell deklariert – wir schauen es uns auf jeden Fall erneut an, sobald es offiziell und als Produktiv-Version angeboten wird!
Sollen wir dich über Gemini 2.0 Flash auf dem Laufenden halten? Einfach unseren kostenlosen Newsletter abonnieren!
Weitere Beispiele


