Jump to content

Tipp: Kombination von Pan und Zoom Out für Bilder mit mehreren Motiven


Recommended Posts

Midjourney tut sich häufig mit mehreren gleichberechtigten Motiven in einem Bild schwer. Ein Motiv wird meist warum auch immer mehr gewichtet und besser dargestellt als ein weiteres Motiv. 

Für solche Bildideen kann die Kombination aus den neuen Pan wie auch Zoom Out Funktionen Abhilfe schaffen wie ich Euch an folgendem Beispiel zeige:

Meine Bild-/Story-Idee sind runde Raumschiffe, welche die Erde überfallen und dabei silberne Kugeln auf die Erde fallen lassen - was die Kugeln dann auf der Erde anstellen muss ich mir noch überlegen, vielleicht schlüpfen ein paar Aliens, vielleicht kriecht eine silbrige Flüssigkeit hinaus, mal schauen, auf jeden Fall gibt es viel Zerstörung und Apokalypse 🙂 

Alle meine Bildversuche mit einem Prompt in die Richtung “round spaceship drops silver balls over a city” sind gnadenlos gescheitert. Entweder erhielt ich große Kugeln oder ein hübsches Raumschiff aber niemals beides in Kombination. Ich habe dann versucht, den Prompt mit /shorten zu analysieren (das hat zumindest ergeben, dass balls falling besser als drops balls ist) und mit Weights zu optimieren; ich habe es mit den Begriffen balls, bows, sphere, drops versucht; ich habe den Prompt mehrfach umgestellt - ohne Erfolg.

Daher habe ich anschließend in einem neuen Versuch zuerst einmal nur die auf eine Stadt fallende Kugeln generiert:

Prompt: satellite view of tiny silver chrome balls falling from the sky down to manhattan, scifi atmosphere

image.jpeg
image.jpeg
 

Als nächstes war es meine Idee, mit einem Custom Zoom Out das Raumschiff über die Kugel-Szenerie zu setzen:

Zoom Out Prompt: satellite view of tiny silver chrome balls falling from a round SciFi ufo with a smooth reflecting chrome surface down to manhattan, scifi atmosphere

image.jpeg
image.jpeg
 

Hm, das war immer noch nicht das, was ich mir vorgestellt habe. Also habe ich es mit der Pan Funktion und dem Ufo probiert:

Pan Prompt: satellite view of a round SciFi ufo with a smooth reflecting chrome surface, scifi atmosphere

image.jpeg
image.jpeg
image.jpeg

Ha, nun stimmte die Richtung! Allerdings war teilweise nur ein angeschnittenes Ufo zu sehen und auch das Bildformat passte noch nicht - Pan erweitert ein Bild ja nur in eine Richtung. Daher habe ich auf das Pan-Ergebnis noch einen Custom Zoom Out mit dem Bildverhältnis 3:2 angewendet:

Zoom Out Prompt: satellite view of a SciFi ufo with a smooth reflecting chrome surface above manhattan, scifi atmosphere

Et voila, jetzt kommt das Ergebnis endlich meiner ursprünglichen Bildidee sehr nahe.

image.jpeg
image.jpeg
image.jpeg
  • Thanks 1
Link to comment
Share on other sites

Tolle Idee! Richtig klasse! Vielleicht wird es so auch einfacher, zwei verschiedene Personen in einer Szene zu verankern. Zwar können sie dann noch nicht richtig miteinander interagieren (Händchen halten, Ohrfeige geben oder ähnliches), aber immerhin hat man sie dann mal zusammen auf dem Bild. Am Rest kann man dann meistens arbeiten. Danke für den Tipp! Werde ich demnächst mal testen.

Link to comment
Share on other sites

vor 12 Stunden schrieb Zauberfrau:

Vielleicht wird es so auch einfacher, zwei verschiedene Personen in einer Szene zu verankern.

Sollte eigentlich bzw. werde ich auch einmal ausprobieren. Hatte aus Spaß schon öfters so Dinge wie Darth Vader spielt Poker mit Spiderman ausprobiert. Aber entweder war Darth Vader oder Spiderman korrekt dargestellt, beide auf einem Bild hatte nie geklappt. In dem Fall kann die Interaktion ja dann auch über die Pokerkarten erfolgen. Händchen hallten klappt natürlich nicht, wobei mit "Person sitzt an Tisch und hält eine Hand" könnte man auch das probieren.

Link to comment
Share on other sites

Man könnte den Link des Bildes kopieren (also Bild in Discord anklicken, dann links unten "im Browser öffnen" wählen und die anschließende URL kopieren) und ein neues /imagine damit starten (finde ich meist erfolgreicher als Bilder ständig zu variieren), wobei noch zusätzlich genau das beschrieben wird, was man haben möchte. Funktioniert eigentlich ganz gut. Vielleicht mit mehreren Variationen, aber irgendwann ist eigentlich immer was dabei.

Link to comment
Share on other sites

😂 Der Spider-Trooper oben rechts ist ja genial!

Nee, aber mit den unteren beiden Bildern könnte man arbeiten. Oder weitere Variationen anstoßen. Dass Midjourney sie jetzt mit niedlichen Cupcakes an den Tisch setzt, ist zwar witzig, aber ärgerlich für den, der gerne ein Pokerspiel hätte. Da ist der Bot wirklich oft zu verträumt. Vielleicht wird es irgendwann mal notwendig werden,  dem Bot unmissverständlich klarmachen zu können, wo er Freiheiten hat und wo nicht.

Link to comment
Share on other sites

Ach Mensch, es könnte so schön sein ...

Ich wollte jetzt auch mal zwei Personen auf ein Bild mit dieser Methode packen. Eine lange Durststrecke...

zauberfrau_mystic_young_native_woman_slightly_smiling_shaman_22_7bace0e5-06c7-48cb-9f89-d532e94e6a23.thumb.png.3373b9798acfebfd15fda58d85269f1f.pngzauberfrau_native_canoe_colorful_natural_material_mystic_lying__f543b60a-011d-46a9-831e-07e6dbfc0bb6.thumb.png.ae0da4e3f6626865756b1c00546edb23.png

 

 

 

 

 

 

 

 

 

Ich wollte diese Dame in das nebenstehende Boot setzen. Das hat in recht kurzer Zeit sogar mit diesem Prompt https://s.mj.run/OULfCNiQNqc A young Celtic woman with red hair sits in a colorful canoe https://s.mj.run/nON7Gjo7ECI on a small river through a dense forest at night. Photorealistic funktioniert:

zauberfrau_A_young_Celtic_woman_with_red_hair_sits_in_a_colorfu_cbd28eda-2f89-43a0-8d4c-b828ef8caff2.thumb.png.67b19200114f500e77ae1e8d018b1815.pngLeider sieht sie ein wenig anders aus, was ich schade fand. Aber gut. Ein anderes Bild habe ich nicht bekommen, auf dem das Boot nur halb zu seen war. Deshalb war ich schon ganz zufrieden.

 

 

 

 

 

 

Nächster Schritt:

 

zauberfrau_much_older_face_old_woman_graceful_native_celtic_whi_9d80a8d2-2628-4988-ad85-5078768b556e.thumb.png.bc0df1f02346a00f953a25f954ceba5b.pngDiese Dame, die Schamanenmeisterin, dahinter. Es ergaben sich leider damit Probleme beim Größenverhältnis, deshalb habe ich das Bild einmal mit Zoom Out 1.5 geändert.

 

 

 

 

 

 

 

 

zauberfrau_much_older_face_old_woman_graceful_native_celtic_whi_5fb6727c-90e0-40ad-94ed-9a85ec67ba40.thumb.png.6e3cfe480eee5cd4bc9a2da546d4e6b5.pngMit nebenstehendem Bild habe ich mir vielen Fehlschlägen genau ein Bild mit PAN konstruieren können, was mir annähernd gefallen könnte.

Der Promt war beim Aufruf von PAN in https://s.mj.run/GIeP3A4ohn0 an old woman celtic shaman also sits in the canoe behind the young woman. She holds a paddle. photorealistic geändert worden.

 

 

 

 

 

 

 

zauberfrau_an_old_woman_celtic_shaman_also_sits_in_the_canoe_be_09667001-cb33-47c5-b6de-1b1f48a1edf7.thumb.png.764c1ae1c1e6850ffa98be7951a86674.png

Allerdings ist hier auch noch viel Luft nach oben! Die rechte Seite ist viel zu dunkel, was bei diesen Zoom-Funktionen ein generelles Problem zu sein scheint. Zumal sitzt die alte Dame immer noch nicht soooo super im Boot (in den anderen Bildern sitzte sie jedoch definitv auf dem Wasser neben dem Boot). Aber gut, es ist ein Anfang.
Nach der "Quadratur" habe ich versucht, Varianten zu erzeugen, da das ja mit dem obigen Format nicht möglich ist (nach einer Pan-Anwendung gibt es keine Varaianten-Buttons). Leider kommen dann nur noch zwei richtig junge Frauen ins Boot. Also kein Mutter-Tochter-Verhältnis. Wieder nix.

Was ich überhaupt nicht geschafft habe: Den Frauen ein Paddel in die Hand zu drücken. Da war Midjourney tatsächlich sehr beratungsresistent.

 

Edited by Zauberfrau
Link to comment
Share on other sites

Cool, das mit dem Paddel könnte demnächst mit Inpainting gehen, das wäre in der Tat noch einmal eine deutliche Verbesserung. Zudem muss die "dunkle Seite" von Zoom Out und Pan definitiv noch gelöst werden. Ich habe es da auch schon mit bright lighting oder --no dark versucht, ohne Erfolg.

Du zeigst mit Deinem Beispiel aber sehr schön, was aktuell schon in der Kombi mehrerer Methoden möglich ist - und, dass auch KI Bilder zu generieren am Ende Arbeit und nicht nur ein simple Texteingabe ist.

  • Thanks 1
Link to comment
Share on other sites

Ich denke schon lange, dass KI-Bilder -Erstellen auch eine Art von Kunst ist. Denn es ist tatsächlich oft nicht leicht, ein Bild, was man in seinem Kopf direkt vor Augen hat, mit Midjourney darstellen zu lassen. Die Kunst ist, anhand der eigenen Fantasy den "Code" (Prompt) so zu erstellen, dass wirklich das Bild rauskommt, nach dem man gesucht hat. 🫠

Natürlich kann man dem Bot auch ein Dadaistisches Gedicht füttern und abwarten, was passiert. Aber das dann als Kunst zu verkaufen, finde ich schon dreist. EAV dichtete ja schon: "er komponiert und ich sitz daneben und warte, was passiert". So natürlich nicht. 🫣

Link to comment
Share on other sites

Da brat mir einer einen (veganen) Elch (Störche habe ich gerade nicht zur Hand)! Ich habe mit dem Bild oben mal weiterexperimentiert.

Und vor allem noch mit dem folgenden hier, was eine Raumkrümmung zu beinhalten scheint:

zauberfrau_an_old_woman_celtic_shaman_also_sits_in_the_canoe_in_088a74f1-a003-4990-87ee-91e42bd961a3.thumb.png.e28d36f1039ed2b49e61d0d9c442c40e.png

 

 

 

 

 

 

 

 

Ist jetzt  nicht so überragend. Aber die Varationen vom Typ Strong, waren echt Hammer! Ist zwar immer noch nicht das Wunschbild dabei, aber trotzdem sind sie schon sehr schön:

 

zauberfrau_an_old_woman_celtic_shaman_also_sits_in_the_canoe_in_e2890173-2a1e-43da-ae4e-fe49b1c143db.thumb.png.cb7528235b80be3adfb554395bce3c53.pngzauberfrau_an_old_woman_celtic_shaman_also_sits_in_the_canoe_in_f0245018-4bac-470b-9c1f-1672876537a9.thumb.png.e3ff5740480020aeeb957c09208606d9.pngzauberfrau_an_old_woman_celtic_shaman_also_sits_in_the_canoe_in_fc2a50b0-73aa-40d8-948d-d5b015555e5b.thumb.png.1cfd27a5c75c3dc11a353a24a8e2135a.pngzauberfrau_an_old_woman_celtic_shaman_also_sits_in_the_canoe_in_4834611f-db9f-4976-820b-c904407b54ac.thumb.png.40c99e249696079df07fe54c48d7883d.png

zauberfrau_an_old_woman_celtic_shaman_also_sits_in_the_canoe_in_d918b2dc-563d-4f88-8ba3-b8ac256975a3.thumb.png.a58f2e1a27adeceba83fc62593ae3da3.pngzauberfrau_an_old_woman_celtic_shaman_also_sits_in_the_canoe_in_4e4a1e5c-7d7c-4802-b9d5-312336133ba8.thumb.png.ee341c2206382ce3a58e6fd33bc6a782.png

zauberfrau_an_old_woman_celtic_shaman_also_sits_in_the_canoe_in_48a87bc6-7557-4fcd-aa25-b23b253876dc.thumb.png.147a2a2e0d10d12481a5b40868b3cfb8.pngzauberfrau_an_old_woman_celtic_shaman_also_sits_in_the_canoe_in_d017800e-1e9c-4ffe-bbbf-8cf17eaa87ed.thumb.png.59a279fb4146c33e2292232eebf8c342.pngzauberfrau_an_old_woman_celtic_shaman_also_sits_in_the_canoe_in_cff5d12e-da6f-4aa8-ada6-efedd8709117.thumb.png.f13bf7492f2055718e19079e359330f6.png

zauberfrau_an_old_woman_celtic_shaman_also_sits_in_the_canoe_in_32e88f90-a2b0-4beb-b0d9-9cdb30ed5a8e.thumb.png.288b1cc2d6548a5097eb3b48cc11dbe5.pngzauberfrau_an_old_woman_celtic_shaman_also_sits_in_the_canoe_in_8de25845-1ac4-441d-afb4-6cbd76f1c54a.thumb.png.e21ff22f21357cc49b25d76e02c6077f.png

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Das Lieblingsbild aber ist für mich aktuell dieses hier:

zauberfrau_an_old_woman_celtic_shaman_also_sits_in_the_canoe_in_2d874bef-deb0-4f4a-af85-0eb695d2dc2f.thumb.png.918385ce9ddd0242e5373e8988cac7dd.png

 

Die ältere Schamanin hat einen gütigen Gesichtsausdruck und ihre - etwas verunsichert dreinblickende - Novizin trägt einen Kranz im Haar. Die beiden sind ja unterwegs zu einer sehr schwierigen Prüfung, in der die Novizin endgültig zur Schamanin geweiht werden soll. Irgendwie mag ich das Bild. Auch wenn meine Vorstellungen doch anders ausgesehen haben.

Link to comment
Share on other sites

Vor allem fand ich erstaunlich, dass die beiden Personen nicht vermischt wurden, sondern immer separat blieben. Leider wurde die ältere Dame in manchen Bildern zum langhaarigen Bärtigen. Diese Bilder habe ich natürlich aussortiert. Sie sahen ziemlich schräg aus. Zudem hatte ich bei den Strong-Variationen den Prompt so gelassen, wie ich ihn für PAN geändert hatte. Dass die junge Frau dabei fehlte, hat den Bot nicht gejuckt. Er hat sie trotzdem immer abgebildet. Ich glaube (bin mir nicht mehr ganz sicher, ob das bei dieser Session war), dass das Verändern des Prompts bei den Variationen nicht so erfolgreich war und die KI mehr verwirrt hat. Aber das müsste man nochmal testen (zeitlich im Moment bei mir nicht drin).

Link to comment
Share on other sites

Danke, klingt nach einer weiteren guten Idee falls man mal nicht weiterkommt. Also Pan und/oder Zoom und/oder Strong (mit Remix), ggfs. wie weiter oben geschrieben dann ein solches Ergebnis als Basis bzw. Vorlage für einen Prompt nehmen. Ich packe das gleich mal unter den Prompt Tipp der Woche 🙂

  • Like 1
Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...