Odyssey ist eine App für den Mac, mit dem man Stable Diffusion auf dem eigenen Rechner installieren kann, ohne die Befehlzeile zu nutzen zu müssen oder kryptische Fehlermeldungen interpretieren muss.
Die Entwicklung des Programms steht noch am Anfang und hat kleinere Hakeligkeiten, aber es lassen sich schon einfach Bilder generieren und komplexe Workflows bauen – die über das reine Erzeugen von KI Bildern hinaus geht.
Inhalte
Stable Diffusion für den Mac
Wenn es um die Frage nach den besten Programmen geht, mit dem man KI Bilder generieren kann, wird neben Midjourney und Dall·E immer auch Stable Diffusion genannt.
- Wichtigster Vorteil: Stable Diffusion ist Open Source und benötigt relativ wenig Ressourcen, so dass es sich auch auf handelsüblichen PCs und Macs betreiben lässt.
- Größter Nachteil: Um Stable Diffusion mit den Standard-Oberflächen Automatic1111 oder ComfyUI auf dem eigenen Rechner zu installieren, muss man die Befehlszeile nutzen und über zumindest grundlegende IT Kenntnisse verfügen.
Diesen Nachteil will die neue App Odyssey beseitigen – zumindest für den Mac.
Die Grundidee von Odyssey
- Installation wie von anderen Programmen gewöhnt
- Bedienung über eine angepasste Programmoberfläche
- Organisation als Workflow, ähnlich wie von ComfyUI gewöhnt
… und all das, ohne die Befehlszeile nutzen zu müssen.
Im Programm selber sind schon einige Workflows vordefiniert, mit denen man experimentieren und sie für eigene Zwecke anpassen kann. Ergänzt wird dies durch eine Dokumentation und einige Beispielvideos auf der Website.
Installation
Geht man auf die Odyssey Website, wird man zunächst aufgefordert, sich auf der Warteliste einzutragen. Dies ist aber mittlerweile obsolet, da man einfach auf die nicht verlinkte Download Seite wechseln kann. Der Download umfasst gut 500 MB, was erstmal verwundert – die notwendigen Modelle haben schon mehrere Gigabyte. Installer anklicken, Programm in den entsprechenden Ordner ziehen – fertig ist die Installation.
Erster Start
Beim ersten Start wird klar, warum der erste Download vergleichsweise klein war: In einem Dialogfeld werden zahlreiche Modelle angeboten, die installiert werden müssen, um die Standard-Workflows zu nutzen. Neben ca. 10 verschiedenen Modellen zur Bildgenerierung stehen auch vier Sprachmodelle (LLMs – Large Language Modells) zur Auswahl, die schon darauf hindeuten, dass sich Odyssey auch für andere Zwecke als Bildgenerierung einsetzen lässt.
Bilder generieren mit Odyssey
Sind die notwendigen Modelle installiert, lässt sich die eigentliche Programm-Oberfläche aufrufen. Zum Start lassen sich Vorlagen nutzen, die auf Standard-Aufgaben zugeschnitten sind:
- Text-to-Image
- Logos, QR Codes oder Grafiken in Bilder einbetten
- Einzelne Objekte, Hintergründe entfernen oder ändern
- Bilder hochskalieren
Ein einfacher Workflow, um Bilder zu generieren, lässt sich mit einem Klick auf das entsprechende Template installieren. Er besteht aus Bausteinen für
- Texteingabe Prompt
- Texteingabe Negativ-Prompt
- Stable Diffusion Node
- Images Node, um die generierten Bilder anzuzeigen
Was mit den Workflows möglich ist, zeigt der Blick ins rechte Menü. Hier stehen Bausteine („Nodes“) zur Verfügung, die verwendet werden können:
- Erzeugen von Tiefenprofilen („Depth Map“)
- Ermittlung von dominanten Farben in einem Bild
So können Infos aus Bildern extrahiert werden, die dann als Vorgabe für neue KI Bilder dienen können. Hier ein Beispiel, in dem aus einem echten Foto die Strukturen und ein Tiefenprofil generiert werden, die zusammen mit einem Text-Prompt die Vorlage für eine Stable Diffusion Node ist – deren Ergebnis wiederum um den Faktor 4x hochskaliert wird:
Die Nodes beschränken sich nicht nur auf KI Funktionen, sondern bearbeiten auch Bilder: Beschnitt, Skalieren etc.
Richtig spannend wird es, wenn die Workflows sich nicht nur auf den lokalen Rechner beschränken, sondern auch per API mit externen Dienstleistern kommunizieren:
- ChatGPT, um die ganze KI Power anzuzapfen
- Stability AI, um Bilder deutlich schneller zu generieren.
Für die Nutzung der APIs werden natürlich Kosten fällig. Apropos Kosten:
Was kostet Odyssey?
Das Programm lässt sich für 14 Tage kostenlos testen, danach muss eine Lizenz erworben werden. Entweder zahlt mal $ 11,99 monatlich oder erwirbt für $ 119 einmalig die Lizenz, in der ein Jahr lang Updates enthalten sind.
Fazit
Man merkt Odyssey manchmal an, dass es noch eine frühe Version ist (aktuell Version 1.0 (7). Neu geöffnete Projekte haben übergroße Fenster und oft ist nicht direkt klar, wie Workflows getriggert werden.
Aber schon in der aktuellen Version zeigt sich ein mächtiges Tool, um Workflows zu erstellen – nicht nur für Stable Diffusion-basierte Projekte, sondern auch für die Einbindung anderer externer Modelle – wie ChatGPT oder Stability AI.
Die einfache Installation und die grafische Oberfläche machen diese Tools und Workflows auch für User verfügbar, die vor dem Umgang mit Befehlszeile und Python Skripten zurückschrecken.
Wir reden ja öfter über Workflows und was man miteinander kombinieren kann – hier könnten Odyssey für Mac User eine tolle Oberfläche sein, um verschiedene Tools zusammenzubringen.