In diesem Gastbeitrag verrät uns der renommierte People- und Modefotograf Martin Dürr, woher er die Inspiration für seine KI-Portraits nimmt und wie er diese möglichst fotorealistisch generiert. Viel Spaß wünschen wir Euch damit.
Inhalte
Was fasziniert mich an KI?
KI und die Möglichkeit damit realistische Bilder zu erstellen hat mich sofort fasziniert, weil das Thema nahe an meiner langjährigen Tätigkeit im Bereich 3D ist. Auch hier wurden fotorealistische Bilder rein mit der Hilfe von Software erstellt. Damals allerdings mit viel mehr Aufwand, Zeit und Kosten, jedoch mit einer höheren Präzision und Kontrolle. Als Fotograf wie auch Künstler bin ich zudem an einem Mix aus Real- und KI-Bild interessiert.
Die KI hat dabei in den letzten Monaten enorme Fortschritte gemacht, wir sind aber noch weit davon entfernt, Bilder zu generieren, die 100% dem entsprechen, was wir uns vorgestellt haben. Für den Künstler stellt sich natürlich die Frage, ob das überhaupt sein muss.
Alles beginnt dabei mit einem Prompt. Dabei fühlen sich einige vermutlich an ihre eigene Schulzeit zurückerinnert, in der man im Deutsch-Unterricht beim Thema Bildbeschreibung exakt das machen musste, was heute KI-Programme automatisch erledigen, nämlich den Bildinhalt bis ins kleinste Detail beschreiben. Und das weniger in einer prosaischen, sondern in einer verständlichen Form.
Meine Herangehensweise
Wie gehen wir nun vor, um das Bildergebnis zu bekommen, welches wir uns vorgestellt haben? Bevor wir diese Frage näher erläutern, müssen wir noch ein paar Dinge im Vorfeld klären.
Die Vorgehensweise hängt meines Erachtens davon ab, ob wir einen konkreten Auftrag verfolgen oder ob wir einfach nur kreativ sein wollen. Während die exakte Umsetzung eines Briefings sehr viel Zeit (und damit auch Kosten) in Anspruch nimmt, können wir den kreativen Weg entspannter angehen.
Ich arbeite dabei hauptsächlich mit Midjourney, da es bislang im realistischen Bereich mehr als überzeugen konnte. Einige Midjourney-Bilder optimiere ich anschließend noch entweder mit dem Programm Krea AI oder Stylar.
Wo finde ich meine Inspiration für Portraits?
Als erstes stellt sich die Frage, welches Motiv will ich überhaupt generieren. Häufig habe ich dazu nur eine grobe Idee im Kopf, die ich gerne konkretisieren möchte. Dazu lasse ich mich auf unterschiedliche Art und Weise inspirieren wie z.B. auf Instagram, Pinterest, aber auch in Zeitschriften wie Vogue oder Harpers Bazar. Ebenso auf Kunstausstellungen oder Museumsbesuchen. Ich habe hier oft einen Hang zu plakativen wie auch zu abstrakten Motiven (inhaltlich wie optisch).
Eine tolle Inspirationsquelle ist auch Midjourney selber. Die Midjourney Webseite bietet eine sogenannte Explore Funktion an – alternativ kann man sich auch Bilder in den öffentlichen Discord-Channeln anschauen. Hier sieht man Ergebnisse anderer Anwender, die einen öffentlichen Account haben. Diese Bilder sind daher auch einsehbar und man kann sogar die entsprechenden Prompts kopieren und selbst für eine eigene Bildgenerierung verwenden. Es ist somit möglich, das Grundgerüst eines vorhandenen Prompts zu nutzen und selbst nur noch Feinheiten zu ändern.
Eine andere Methode ist die /describe Funktion von Midjourney. Damit kann man Fotos wie auch Bilder von Midjourney analysieren und sich mögliche Prompts dazu nennen lassen, wie ich hier an dem Beispiel eines meiner eigenen Fotos zeige.
Midjourney schlägt vier verschiedene Prompts vor, die wir auch alle gleich generieren lassen können. Wir haben selbstverständlich auch die Möglichkeit. Midjourney nochmal einen Durchlauf machen zu lassen.
Ich habe mir einmal alle vier Prompts ohne Änderung generieren lassen:
Ein Anfang ist also schon mal gemacht. In meinen Augen ist aus dem 1. Set und dem 2. Set die Nähe zum Original am größten. Bevor wir hier weitermachen, nehmen wir aber einen dieser Prompts und versuchen ihn so zu verändern, dass er vielleicht noch näher an das Original kommt:
cinematic, portrait photography, an attractive young woman, with short black hair, wearing a hat and jewelry, in the style of maximalist, unapologetic grit, intense close-ups, light gold and crimson, mediterranean-inspired, symmetrical asymmetry, 2020, Kodak Color Gold, Filmgrain, shot by Erik Madigan Heck –style raw --ar 51:64 --v 6.0
Das sieht schonmal nicht schlecht aus. Falls uns das rechte untere Bild gut gefallen würde, könnten wir noch via dem Vary (Region) Inpainting aus der normalen Halskette eine Kette mit Kreuz machen, so wie unserer Vorlage.
Einzig die Wahl des Fotografen „Erik Madigan Heck“ als Referenz ist nicht perfekt, denn er ist bekannt für seine starken, gesättigten Farben, wie man in diesem Beispiel auch sehr gut sieht.
Wie erhalte ich ein möglichst fotorealistisches Portrait?
Ansonsten ist es übrigens ein sehr probates Mittel, bestehende Fotografen als „Look“-Referenz zu benutzen. Das führt außerdem häufig dazu, dass das menschliche Gesicht und insbesondere die Haut sehr fotorealistisch dargestellt werden.
Zusätze wie „cinematic“, „photography“ und auch die Wahl des Filmmaterials/ Foto-Equipments helfen, die Bilder realistischer erscheinen zu lassen und reduzieren so den künstlichen KI-Look. Auch ist es möglich und häufig sinnvoll, Midjourney noch die Art und Weise der Unschärfe im Portrait oder auch das Licht-Setting mitzugeben. Je mehr wir selbst definieren, desto mehr Kontrolle haben wir über das Bild und überlassen weniger dem Zufall, also Midjourney.
Was wir in diesem Beispiel noch nicht Weise festgelegt haben, ist die Person an sich, also Informationen zu Ethnie, Emotion sowie Aktion. All das könnten wir natürlich auch in einen Prompt packen wie auch die Art und Weise der Unschärfe im Portrait. Wollen wir hier mehr Einfluss, müssen wir ihn exakt definieren (Objektiv, Blendenöffnung etc.).
In Midjourney Version 5.2 gab es noch die Möglichkeit, über einen sogenannten Style Tuner einen ganz eigenen individuellen Stil anzulegen. Dies funktioniert leider nicht mehr in Version 6, wobei ich nicht ausschließen möchte, dass es dazu noch ein Update geben wird.
Ihr könnt allerdings weiterhin mit einem kleinen Trick auf den Style Tuner zugreifen, indem Ihr Midjourney wieder auf die Version V5.2 umstellt. Allerdings wird dann natürlich auch das ganze Bild mit der Version 5 und nicht der Version 6 generiert.
Kann ich mit KI meinen eigenen fotografischen Stil umsetzen?
Eine Frage, die mir auch oft gestellt wird, ist: „Wie kann ich meinen fotografischen Stil in KI Bildern generieren?“. Besser sollte man vielleicht sagen, wie kann ich meinen fotografischen Stil auf KI-Bilder übertragen?
Hier bietet Midjourney mit der Version 6 eine Möglichkeit, das schnell und unkompliziert zu erledigen. Und zwar mit der sogenannten Style Reference, dem –sref Parameter.
Was macht diese Style Reference? Ähnlich wie der Style Tuner „kopiert“ er charakteristische Stilelemente aus einem Bild und überträgt diese auf ein anderes Bild. Dabei kann ich auch meine eigenen Fotos als Stilreferenz nutzen.
Aus meiner Sicht eröffnet diese Funktion neue ungeahnte Möglichkeiten. Daher zeige ich Euch hier einige meiner Beispiele für den Einsatz der Style Reference.
Die erste Stil-Vorlage ist dieses Foto:
…welches ich auf diesen Prompt anwende:
fashion shooting in the New York the subway, superb looking Elisabeth Olsen in beautiful fur outfit, für hat, dramatic lighting, detailed, cinematic still, fog, HD, shot by Irving Penn, --chaos 15 --ar 2:3 --sref URL_Stilvorlage
Der Prompt ist nicht wirklich perfekt aufgebaut von der Reihenfolge wie auch der Formulierung, deshalb gehen bei der Umsetzung auch einige Teile verloren wie z.B. der Nebel. Allerdings überträgt die Style Reference auch immer ein paar Motiv-Elemente und nicht nur rein den Stil (Update: mit der kürzlich vorgestellten Style Reference 2.0 ist das etwas besser geworden, aber immer noch nicht perfekt), was das Ergebnis damit auch immer ein wenig unvorhersehbar macht.
Die nächste Vorlage ist folgendes Foto:
… mit diesem Prompt:
fashion shooting in the New York the subway, superb looking Elisabeth Olsen in beautiful fur outfit, für hat, dramatic lighting, detailed, cinematic still, fog, HD, shot by Irving Penn, --chaos 15 --ar 2:3 --sref URL_Stilvorlage
Hier noch eine dritte, dieses Mal völlig andere Stil-Vorlage:
mit dem Prompt:
fashion shooting in the New York the subway, superb looking Elisabeth Olsen in beautiful fur outfit, für hat, dramatic lighting, detailed, cinematic still, fog, 8k, HD, shot by Irving Penn, --ar 2:3 --v 6.0 --c 15 --sref URL_Stilvorlage
Stil-Vorlage Nr. 4 ist mein Foto von Simon, einem Profi-Koch und mehrfach ausgezeichneten Muai Thai Kämpfer:
ergibt mit dem Prompt:
full figured Cuban gang member with tattoos, black and white photograph by Irving Penn, high definition, 50mm, the tattoos are symmetrical, --chaos 15 --ar 2:3 --sref URL_Bildvorlage
Hier sieht man, wie gut Midjourney die in der Vorlage vorhandenen Lichtverhältnisse auf die neuen Bilder überträgt.
Welche anderen Tools außer Midjourney nutze ich?
Auch wenn ich vorrangig mit Midjourney arbeite, so generiere ich doch immer mal wieder Bilder auch mit anderen Applikationen, zumindest solche, in denen man auch Referenzbilder nutzen kann.
In Stylar (wie auch in Leonardo AI mit der Image Guidance) z.B. kann man ein Bild hochladen und ein neues Bild erstellen, welches Grundzüge des vorhandenen Bildes übernimmt. Mittels eines Schiebereglers kann man die Stärke der Angleichung kontrollieren (zusätzlich ist die Vergabe neuer Prompts möglich).
Links seht Ihr meine Vorlage, rechts das Ergebnis mit dem zusätzlichen Prompt: pink fur, pink hair
Und hier noch einmal die ganz oben gezeigte allererste Vorlage links mit einer 80%igen Übereinstimmung in der Mitte sowie 100%igen Übereinstimmung rechts, mit Stylar generiert.
Grenzen und Einschränkungen
Wie bei den meisten KI-Applikationen gibt es bei Midjourney Einschränkungen zum Schutz der Community. Was in der Regel sinnvoll ist, treibt mittlerweile aber Blüten, die es manchem Anwender erschweren, entsprechende Ideen in die KI-Realität umzusetzen. Als Fashion Fotograf oder Designer kommt man schnell an seine Grenzen, wenn man Textilien mit Transparenz oder Vinyl, Lack herstellen möchte. Ebenso sind ganze Begriffsgruppen wie z.B. Lingerie blockiert.
Es gibt noch AI Modelle die dies erlauben, aber deren Realitätsgrad ist oft weit entfernt von dem, was Midjourney bietet.
Blick in die Zukunft
Auch wenn ich selbst in einer Branche tätig bin, die stark durch KI betroffen ist, bringt es meines Erachtens wenig, KI generell zu verdammen. Entweder man gehört zu denjenigen, die sie als Promptograf geschickt nutzen, oder man macht sich Gedanken darüber, wie man sich als Fotograf im Zeitalter von KI so positioniert, dass man auch weiterhin damit Geld verdienen kann.
Im Großen und Ganzen erinnert mich die Situation an die Einführung von DTP (Desktop Publishing) in den Jahren 1985/1986. Bis zu diesem Zeitpunkt benötigte man professionelle Satzstudios, die einem Layout, Satz und andere typografische Arbeiten abnahmen. Dann plötzlich war es möglich, selbst Layouts zu generieren, Satzfahnen zu erstellen oder gar Schriften zu entwerfen. Die Satzstudios verschwanden quasi über Nacht, welche bis zu diesem Zeitpunkt die Topverdiener der Medien Branche waren.
Im Bereich KI wird es wahrscheinlich erstmal eine Schwemme an mehr oder weniger guten Inhalten geben, bis sich der Markt konsolidiert und die aus der Fotografie-Branche stammenden Profis übernehmen.
Ich sehe mich in erster Linie als “Bildgestalter” (in der Vergangenheit, jetzt und in der Zukunft), aus welcher Quelle das Medium kommt, ist für mich erst einmal sekundär. Das kann eine Illustration sein, ein 3D Rendering, eine Fotografie oder nun eben auch ein Bild, das mit künstlicher Intelligenz erzeugt worden ist. Der Inhalt und die Darstellung sind entscheidend.
Mehr über Martin Dürr
Mehr über Martin und seine fantastischen Foto- wie KI-Arbeiten findet Ihr hier:
Kennt Ihr weitere Promptografen, von denen Ihr Euch einen Gastbeitrag wünscht? Nennt sie uns gerne in den Kommentaren.