Donnerstag, Februar 22, 2024
StartAnwendungenLeonardo.AILeonardo Image Guidance einfach erklärt - Teil #1 Image to Image

Leonardo Image Guidance einfach erklärt – Teil #1 Image to Image

Mit einem Prompt lässt sich ein Bild schon ganz gut beschreiben: Motiv, Perspektive, Licht und vieles mehr. Trotzdem kann ein Text, und gerade ein Prompt kann nicht beliebig lang sein, niemals genau das beschreiben, was wir uns darunter genau im Kopf vorstellen. KI generierte Bilder sind somit häufig auch noch ein Stückchen Überraschungsei.

Einigen Bildgeneratoren kann man daher noch visuelle Vorgaben wie z.B. eine konkrete Bildvorlage zusätzlich zu einem Prompt mitgeben. In Leonardo nennt sich das grundsätzlich eine Image Guidance (Anleitung zum Bild) bzw. ein konkretes Bild als Vorlage ein Image to Image (Bild zum Bild). Ein Prompt “joshua tree with a colorful red glowing rock formation at dusk” lässt der KI z.B. einen viel größeren Gestaltungsspielraum als meine Fotovorlage (aufgenommen am Whitney Pocket in Utah, USA).

Ihr könnt in Leonardo AI jedoch nicht nur ein Image to Image Referenzbild nutzen, sondern in einem bezahlten Account weitere Referenzbilder. Mit diesen könnt Ihr auf zusätzliche Image Guidance Optionen wie Depth to Image, Edge to Image, Pose to Image und Text Image Input zugreifen. Dadurch erhaltet Ihr eine ganz neue Kontrolle über die Tiefe, Kanten- und Linienführung, Posen von Personen und mehr eines zu generierenden Bildes.

Einschub für “Nerds” 🙂 : Image Guidance basiert auf der ControlNet genannten Finetuning-Methode für Stable Diffusion. Mit via ControlNet vortrainierten Modellen ermöglicht wird die oben genannte bessere Kontrolle ermöglicht. Dem ursprünglichen Modell werden zusätzliche Bedingungen hinzugefügt, das Modell an sich bleibt jedoch gleich. Es werden sozusagen Feinabstimmungen vorgenommen.

Image Guidance verwenden:

Beschäftigen wir uns zuerst damit, wie man Image Guidance generell verwendet:

Die Option Image Guidance findet Ihr neben dem Generierungsverlauf.

Wenn Ihr darauf klickt, öffnet sich der Image Guidance Tab. Dort könnt Ihr ein bzw. als Premium User mehrere Bilder hochladen.

Klickt auf das Upload-Feld, wählt die gewünschte Bildreferenz auf Eurem Rechner aus und ladet das Bild hoch.

Hier könnt Ihr in der kostenlosen Version nur Image to Image bzw. als Premium-User zwischen den unterschiedlichen ControlNet-Optionen wählen.

Über den Schieberegler bestimmt Ihr jetzt noch die Stärke der Gewichtung zwischen 0.10 und 0.90, je höher der Wert, desto mehr orientiert sich Leonardo an der Vorlage.

Als nächstes gebt Ihr Euren Prompt ein und wählt das gewünschte Modell bzw. den gewünschten Stil – mehr dazu findet Ihr demnächst in einem ausführlichen deutschen Leonardo Tutorial.

Zum Schluss ändert Ihr ggfs. noch die sonstigen Parameter wie Anzahl der zu generierenden Bilder, die Maße, PhotoReal oder Alchemy Einstellungen usw. auf der linken Seite des Bildschirms – auch dazu lest Ihr demnächst mehr in einem Tutorial.

Jetzt braucht Ihr nur noch oben rechts auf Generieren zu klicken und Leonardo beginnt mit der Erstellung des Bildes. Der Generate-Button zeigt dabei auch gleich an, wie viele Token dabei verbraucht werden.

Image to Image:

Schauen wir uns jetzt doch einmal an, welchen Effekt die Image Guidance hat bzw. wie sich die Gewichtungen auswirken. Ich werde das an unterschiedlichen Motiven zeigen.

Wir beginnen mit dem oben gezeigten Bild von dem Joshua Tree aus den USA.

Originales Foto

Alle Bilder sind mit dem Leonardo Diffusion XL Modell im Stil Photography und dem Prompt “joshua tree with a colorful red glowing rock formation at dusk” gerechnet. Man sieht dabei schön, dass sich der Wert nicht auf die Qualität des Bildes, sondern nun auf die Vorlagentreue auswirkt. Es lohnt sich also mit den unterschiedlichen Gewichtungen zu experimentieren, da jedes Bild an sich seine Berechtigung hat.

Man kann das Bild zudem noch um weitere Motive ergänzen.

Spannend ist es aber auch, dass man überhaupt nicht mit einem direkt zu dem Motiv passenden Prompt arbeiten muss, sondern mit anderen Prompts/ Motiven interessante Bilder generieren lassen kann.

Image to Image ist somit zum einen eine prima Möglichkeit, Eure Bilder besser zu kontrollieren wie auch um sehr kreative Ideen umzusetzen.

Schauen wir uns ein weiteres Beispiel von einem Portrait eines Astronauten, welches ich in Midjourney generiert und ihm anschließend mit InsightFaceSwap mein Gesicht verpasst habe.

Originales Midjourney Bild

portrait of an astronaut, round glasses, short stubble black hair, bright yellow space suit, on a dunescape moonscape landscape --ar 3:2

Auch diese Bilder sind mit dem Leonardo Diffusion XL Modell im Stil Photography gerechnet.

Das reine Bild aus Leonardo mit dem gleichen Prompt ohne Vorlage sieht übrigens so aus.

portrait of an astronaut, round glasses, short stubble black hair, bright yellow space suit, on a dunescape moonscape landscape 

Und hier noch einmal zwei Beispiele mit einem anderen Prompt.

Generell habe ich dabei übrigens den Eindruck, dass die Bilder etwas weicher als die Vorlage aus Midjourney wirken und Leonardo somit ein klasse Tool ist, um Midjourney Bildern den letzten Schliff zu verpassen.

So oder so ist die Image to Image Funktion von Leonardo AI ein weiteres fantastische Werkzeug in der KI generierten Bilderwelt.

Die oben zusätzlich genannten Image Guidance Möglichkeiten stellen wir Euch in separaten Beiträgen vor:

Und Midjourney Usern erklären wir in diesem Beitrag, wie man mit Midjourney Bilder als Vorlage nutzen kann.

RELATED ARTICLES

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein

Aktuell beliebt

Aktuelle Kommentare