Jump to content

Lokale AI-Bildgeneratoren


Protesio

Recommended Posts

Hallo zusammen,

nun habe ich auch endlich mal Zeit hier zu schreiben und vor allem mich auch näher mit dem Thema KI-Bildgeneratoren zu befassen. Dabei bin ich nun schon mehrfach auch über das Thema lokaler Varianten gestoßen, die man also daheim auf seinem PC/Mac ausführen kann.

Ich bin grade dabei das zum Laufen zu bringen und die ersten noch nicht vorzeigbaren Ergebnisse sind vorhanden. Sobald hier mal was Vorzeigbares rauskommt werde ich das gerne auch hier posten. 

Bin beeindruckt, dass das auch auf meinem doch recht betagten Rechner funktioniert, wenn auch etwas langsam.

 

Es gibt eine Fülle von verschiedenen Modellen jeder Couleur die man herunterladen kann z.B. auf civitai.com

Als Ausgangsbasis nutze ich Stable Diffusion 1.5 das man ja kostenlos bei Github bekommen kann https://github.com/AUTOMATIC1111/stable-diffusion-webui

Ich weiß nicht ob man auch schon Stable Diffusion 2.0 nutzen kann. Die ganzen Modelle zielen wohl auf 1.5 ab aber die Fülle ist so unübersichtlich groß, dass ich hier sicher schon was übersehen habe.

 

Habt ihr selbst schon "offline" Erfahrungen gesammelt?

Edited by Protesio
Link to comment
Share on other sites

Danke für den Input. Ich muss gestehen, dass ich mich bisher i.w. auf Midjourney konzentriere, u.a. auch weil es recht einfach zu bedienen ist. Stable Diffusion ist ja schon etwas komplizierter mit aber dem Vorteil, dass es deutlich mehr Möglichkeiten bietet, insbesondere im Hinblick auf konsistente Bilder. Nutzt Du SD 1.5 am Mac oder PC?

Link to comment
Share on other sites

Für den Mac gibt es im App Store "Draw Things". Es basiert auf Stable Diffusion 2.1 und bietet einige Einstellmöglichkeiten. Die Ergebnisse finde ich ziemlich durchwachsen, um mal höflich zu bleiben... Anders ausgedrückt: Ich habe es mir als "unbrauchbar" gemerkt und wieder runter geworfen. 

Dennoch hier mal drei Beispiele, dann könnt Ihr Euch die Zeit sparen:

Nikon D3, 200 mm f:2, young female, leaning against a wodden, soft light, tank top,ultra high resolution photograph, gritty black and white, minimal depth of field, natural textured skin, freckles, finest details, sharp focus, no contrast.png

Modern color photograph, young business woman, serious look, ultra high resolution photograph, finest details, sharp focus, no contrast.png

Modern color photograph, sporty middle aged male, serious look, ultra high resolution photograph, finest details, sharp focus, no contrast.png

Edited by Mattes
Link to comment
Share on other sites

Ich habe nun einiges mit Stable Diffusion aus meinem Link oben experimentiert. Wichtig ist das Model das man dazu nutzt. Ich habe viel mit dem "analog Madness" von civitai.com herumprobiert nun. Da kommen teils schon sehr gute Ergebnisse raus, teils auch ziemlicher Mist vor allem wenn man etwas komplexere Dinge haben will wie hier z.B.

Die Dame sollte doch nur eine Katze auf der Schulter haben aber stattdessen hat sie noch einen Katzenpelz und Katzenohren bekommen sowie eine verunstaltete Katze im Hintergrund 😄

image.thumb.png.328a81b53bac99537e6ef3f76ed08b05.png

 

Wenns dann nur eine Frau sein soll geht das schon besser:

00099-2624640074.thumb.png.5a3e70947920832aba466b78dfba79fb.png

  • Like 1
  • Haha 1
Link to comment
Share on other sites

Ich glaube dieses Problem haben aktuell noch alle Generatoren, also dass einige Elemente aus den Prompts überhaupt nicht übernommen oder anders interpretiert werden. Plus Physiognomie, auf dem unteren Bild frage ich mich, wo genau der linke Arm endet? Hast Du schon einmal mit Midjourney gearbeitet, nur interessehalber wegen der Möglichkeit eines direkten Vergleichs? Oder nenne doch gerne einmal Deinen Prompt, dann gebe ich den mal in Midjourney ein.

Link to comment
Share on other sites

Midjourney habe ich schon getestet bevor es dann kostenpflichtig wurde. Aktuell habe ich außer "rumspielen" noch keine Verwendung für die Bilder und daher auch keinen kostenpflichtigen Account.

Prompt von der Dame mit Katze war: 

Zitat

 

positiv: realistic full body portrait of 25 year old european woman, nerdy look with glasses, dark hair, in the streets of new york, (1cat sitting on her shoulder:1.5), looking into the camera, eye focus

negativ: Watermark, Text, censored, deformed, bad anatomy, disfigured, poorly drawn face, mutated, extra limb, ugly, poorly drawn hands, missing limb, floating limbs, disconnected limbs, disconnected head, malformed hands, long neck, mutated hands and fingers, bad hands, missing fingers, cropped, worst quality, low quality, mutation, poorly drawn, huge calf, bad hands, fused hand, missing hand, disappearing arms, disappearing thigh, disappearing calf, disappearing legs, missing fingers, fused fingers, abnormal eye proportion, Abnormal hands, abnormal legs, abnormal feet, abnormal fingers

 

 

Und die sitzende Dame: 

Zitat

 

positiv: masterpiece, realistic (full body:1.3) portrait of 25 year old european woman, nerdy look with glasses, dark hair, times square at night, sitting, looking into the camera, eye focus

negativ: (worst quality, low quality:1.2), photoshop, airbrush, disfigured, ugly, old, monotone, animal ears

 

 

Zusammenfassend kann man sagen bei 10 Bildern kommt 2-3 mal was richtig übles raus, 1 mal was richtig gutes und der Rest ist brauchbar. Meine besten Bilder kann ich hier nicht zeigen, da ich auch ein wenig mit NSFW Content herumgespielt habe wenn das ganze schon unzensiert ist 😄

Was ich interessant finde ist, dass die freien Varianten so schnell aufholen. Und das kann fast jeder mit nem halbwegs guten Rechner erstellen (Bei meinem betagten Ryzen 7 2700X mit Geforce 1080ti dauert ein Bild hochskaliert auf 1024*1024 ca 30-40s). Auf meinem M1 Macbook gehts etwas langsamer aber auch problemlos. Das Modell ist grade mal 2GB groß und das Programm an sich 6GB. Also Peanuts.

Da steckt echt ne pfiffige Community dahinter. Wenn das so weitergeht können sich die etablierten kostenpflichtigen bald warm anziehen.

  • Like 1
  • Thanks 1
Link to comment
Share on other sites

  • 2 weeks later...

Tolle Ergebnisse, Protesio.

Ich muss meine erste Einschätzung auch revidieren, nachdem ich mich etwas ausführlicher mit "Draw Things" befasst habe. Mit dem richtigen Modell bekommt man wirklich gute Resultate.

Grüße
Matthias

Link to comment
Share on other sites

Es hängt auch wirklich stark vom Prompt ab und dann ist es auch noch so, dass manche Prompts je nach Modell unterschiedlich gut funktionieren, und noch zig weitere Einflussfaktoren.

Aber unbestritten ist, dass man hier ebenfalls sehr gute Bilder bekommen kann mittlerweile und das unzensiert, kostenlos und offline.

Und wenn man dann mal 6-12 Monate in die Zukunft denkt dann wird das sicher noch deutlich besser werden.

  • Like 1
Link to comment
Share on other sites

Das denke ich auch. Wir sind ja bei allen diesen Dingern noch ziemlich am Anfang, was die Verfügbarkeit für die Allgemeinheit betrifft. Lokale Installationen werden eh der Weg der Zukunft sein, weil viele Anwendungen - gerade in Unternehmen - sonst nicht funktionieren werden.

  • Like 1
Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...