Donnerstag, April 17, 2025
StartAnwendungenGoogleGoogle Gemini 2.0 Flash Experimental

Google Gemini 2.0 Flash Experimental

Google hat mit Gemini 2.0 Flash Experimental ein neues Modell vorstellt, das nicht nur Texte und Bilder erzeugt, sondern auch in der Lage ist, im Dialog Bilder weiter zu bearbeiten und komplette Inhalte wie Photostories oder bebilderte Rezepte zu generieren. Eine weitere Stärke des neuen Modells ist die Generierung von Text-Elementen in KI Bildern.

Wer das Modell ausprobieren will, kann dies im Google AI Studio tun – aktuell sogar kostenlos. Dafür muss man im Menü auf der rechten Seite im Preview Bereich das Modell Gemini 2.0 Flash Experimental auswählen.

Modell Auswahl

Das User Interface schlägt direkt drei Anwendungsfälle vor:

Google Gemini 2.0 Flash Start-Optionen
  • Bildbearbeitung, die mit dem Bild eines Croissants startet
  • Foto-Story, die das herzerwärmende Abenteuer einer Baby-Ziege in Text und Bild erzeugt
  • Individuelle Geburtstagskarte, die die beeindruckenden Text-Fähigkeiten demonstriert.

Bevor wir auf die einzelnen Features eingehen, eine Vorbemerkung: Das Modell wird als „Experimental“ deklariert, was sich an einigen Stellen deutlich bemerkbar macht. Trotzdem sind viele Aspekte absolut beeindruckend:

Interaktive Bildbearbeitung

Das Gemini 2.0 Flash Experimental bietet die Möglichkeit, Bilder per Text-Eingabe zu bearbeiten. Um Elemente zu entfernen oder hinzuzufügen, muss man nicht wie in anderen Tools zu einem Editor greifen und Elemente grafisch maskieren, sondern kann einfache Text-Eingaben verwenden. Das ursprüngliche Bild bleibt wirklich erhalten, es werden nur einzelne Elemente verändert, hinzugefügt oder entfernt. Interessantes Detail: Das funktioniert auch mit hochgeladenen Bildern aus anderen Quellen!

Der erste Versuch mit einem Martini:

  • Das Bild des Martinis sieht erstmal super aus
  • Die hinzugefügte Olive ist am richtigen Platz, ist aber seltsam ausgeleuchtet.
  • Den Martini in eine ansprechende Bar-Atmosphäre geht aber gründlich daneben…

Als zweites Beispiel haben wir ein kleines Café umarrangiert. Das Entfernen und Hinzufügen von Elementen funktioniert (auch wenn sich die KI bei den Kundinnen verzählt), das Umstyling ist etwas unvollständig:

Wie gesagt: Das funktioniert auch mit hochgeladenen Bildern:

Foto-Stories & Rezepte

Ganze Geschichten mit Hilfe bestehender Tools zu erzählen (aka „Storytelling“), gehört nach wie vor zu den größten Herausforderungen für KI Tools. Neben einer interessanten Geschichte sollten die Bilder den gleichen Stil haben und die handelnden Personen oder Figuren konsistent dargestellt werden.

Wir haben das in zwei Varianten getestet:

  1. Foto-Story über den Alltag einer Klinikärztin
  2. Rezept für Linguine mit Jakobsmuscheln und Garnelen`

Die Ergebnisse gibt das Google Modell als formatierten Text und Bild aus. Ein Layout oder PDF gibt es leider auch auf Anfrage nicht, aus diesen Daten lässt sich aber in wenigen Minuten PDFs generieren.

Story Telling mit Google Gemini Flash

Das Story Telling Feature haben wir mit diesem Prompt getestet:

Erstelle eine Fotostory über den typischen Tag einer junge Krankenhaus-Ärztin. Bitte gestalte die Bilder fotorealistisch.

In der Fotostory fällt auf, dass die Protagonistin zumindest einigermaßen konsistent bleibt, genauso wie der fotografische Stil. Was nicht so gut läuft:

  • Die Ärztin wechselt öfters die Kleidung
  • Beim Essen geht ein Finger verloren
  • Das Patientengepräch mit „besorgten älteren Herrn und dessen Tochter“ findet mit einer älteren Frau statt

Und schließlich bricht die Story ab, als die KI ein Bild generieren soll, bei der die Ärztin einen Bauch abtastet. Hier greift wohl ein Filter, um nicht zu viel nackte Haut zu zeigen…

Über die Qualität des Ergebnisses lässt sich streiten, sie würde aber in vielen Yellow Press Zeitschriften nicht direkt auffallen (jedenfalls nicht negativ).

Rezept erstellen: Linguine à la Google

Gleiches gilt für das Rezept: Aus dem Prompt…

Generate a full recipe for a pasta dish Linguine with scallops and prawns with ingredients, instrutions and images of each step.

… wird in weniger als einer Minute ein komplettes, einigermaßen sinnvolles Rezept mit Zutatenliste, genauer Anleitung in Einzelschritten und Bildern generiert.

Hier die beiden vollständigen generierten Stories zum Download:

Wenn die Kinderkrankheiten bei der Bildgenerierung ausgebügelt sind, wird diese Funktion in der Praxis viele Anwendungsfälle finden.

Text-Generierung

Texte in KI Bildern sind immer eine Herausforderung, speziell wenn sie etwas länger sind, nicht in Englisch sind oder sogar Umlaute enthalten.

Hier ist Gemini 2.0 Flash Experimental absolut beeindruckend, wenn auch nicht fehlerfrei.

Als weiteren Test haben wir einen Retro-Computermonitor generiert:

Show a old computer screen with green computer text "follow the white rabbit"

Sogar deutsche Umlaute werden zuverlässig umgesetzt, erst am „ß“ scheitert die KI.

Was kann Gemini 2.0 Flash Experimental?

Wie der Name sagt, ist das neue Google Modell noch experimentell und hat noch einige Makel, vor allem in der Bildqualität und bei der Umsetzung komplexer Prompts ist noch viel Luft nach oben. Was uns aber beeindruckt sind die Text-Fähigkeiten und die Funktion, um Fotostories zu erzeugen.

Bilder per Text-Dialog ist ein interessanter Weg, um Zugangsschwellen für Nutzer abzubauen, die vor einem grafischen Editor zurückschrecken. Nach Google Whisk ist dies ein weiterer innovativer Ansatz von Google, um Alternativen zum reinen Text-Prompt und grafischen Editor zu bieten.

Da sich Gemini 2.0 Flash auch per API einbinden lässt, werden auf dieser Basis sicher interessante Anwendungsfälle entstehen.

Interesse daran, wie sich Google Gemini, andere Modelle und die Anwendungsfelder entwickeln? Dann solltest du unseren Newsletter abonnieren!

Andreas Jürgensen
Andreas Jürgensenhttps://www.ai-imagelab.de
Andreas ist Jahrgang 1966, in Schleswig-Holstein aufgewachsen und mittlerweile gut assimilierter Rheinländer – seit er zum Studium als Fotoingenieur nach Köln zog. Seit über 20 Jahren betreibt er zahlreiche Diskussionsforen rund um diverse Fotomarken.
RELATED ARTICLES

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein

Aktuell beliebt