Apple hat gestern (10. Juni 2024) auf der Entwicklerkonferenz WWDC die Pläne vorgestellt, wie Künstliche Intelligenz in alle Apple-Betriebssysteme, wie z.B. iOS, iPadOS und MacOS integriert werden soll.
Unter dem Motto „Artificial Intelligence for the rest of us“ wurde über ca. 40 Minuten zahlreiche Funktionen der „Apple Intelligence“ vorgestellt:
Wichtige Themen dabei waren systemweite Unterstützung von Sprachtools und persönlicher Kontext und Erleichterungen im Alltag, aber auch das Thema Bildgenerierung nahm einen großen Bereich ein.
Inhalte
Bemerkenswert, dass photorealistische Bilder nicht angeboten werden – sei es, weil Apples Modelle (oder die von Technologiepartnern) nicht die entsprechenden Fähigkeiten besitzen oder weil Apple das Thema „Fake Bilder“ weiträumig umschiffen möchte.
Genmojis: Individuelle Emojis auf Abruf
Trotz der bereits bestehenden gigantischen Riesenauswahl fehlt manchmal das eine passende Emoji. Hier sollen in Zukunft „Genmojis“ (Generated Emojis) helfen. Einfach in der Chat-App eine Beschreibung eintragen und direkt werden dir mehrere Alternativen angeboten. Demonstriert wurde die Funktion mit einem surfenden T-Rex und einem Smiley mit Gurkenmaske. Alternativ lassen sich Genmojis auch auf Basis von Profilbildern generieren.
Apple Image Playground: KI Bilder in Anwendungen
Eine weitere Funktion ist der Apple Image Playground, die es erlaubt, in verschiedenen Anwendungen direkt und spielerisch KI Bilder zu generieren, z.B. in…
- Messages (Chat)
- Keynote (Präsentationen) oder
- Pages (Textverarbeitung)
Zusätzlich wird es eine eigene Playground App geben
Man kann vorgeben…
- ein Thema (wie Geburtstag, Disco oder Feuerwerk)
- Kostüme und Accessoires
- ein Ort (Strand, Unterwasser, Vulkan)
Die entsprechenden Begriffe werden dem „Playground“ hinzugefügt und direkt generiert die KI eine entsprechende Vorschau. So entstehen spontan Bilder, die sich in Chat-Kommunikationen verwenden kann. Hat man speziellere Vorstellungen, lassen sich dem Playground genauere Textbeschreibungen oder Stilvorgaben (Sketch, Illustration oder Animation) oder Profilbilder aus dem Adressbuch mitgeben.
Image Wand
Eine weitere vorgestellte Funktion ist der „Image Wand“, was man vielleicht ungelenk mit „Bilder-Zauberstab“ übersetzen kann. Dieser Zauberstab, der z.B. in der Werkzeugpalette der Notizen-App zur Verfügung steht, verwandelt rohe Skizzen in Bilder. Dafür kringelt man die Skizze ein, die sich dann in einen Image Playground verwandelt (s.o.), der schon mit Stichwörter aus dem Kontext ergänzt wurde.
KI Bildbearbeitung in der Fotos App
Aber auch das Thema Bildgenerierung wurde ausführlich behandelt. Die FOTOS App bietet jetzt eine Clean Up Funktion, mit der sich per KI aus Bilder unerwünschte Elemente entfernen lassen. Einzelne Bilder und Videos lassen sich jetzt deutlich einfacher finden, indem sie in natürlicher Sprache beschrieben werden – auch in größeren Medienbibliotheken.
Immer wieder betont: Datenschutz und Privatsphäre
Ein Aspekt, der in der gesamten Keynote immer wieder betont wurde: Wie wichtig Datenschutz und Privatsphäre beim gesamten Projekt „Apple Intelligence“ ist.
Bilder und Videos werden nicht mit Apple oder anderen Parteien geteilt, alle KI Funktionen werden nach Möglichkeit auf den Apple Geräten durchgeführt („On Device Processing“) und nur bei Bedarf einzelne Funktionen an eine „Private Cloud“ ausgelagert.
KI Bilder für den Alltag – nicht für die Profis
Mit abschließenden Urteilen müssen wir uns zurückhalten, bislang kennen wir nur die eine Präsentation und können weder die Bedienung noch die Qualität der Bildergebnisse wirklich beurteilen. Wo Bilder gezeigt werden, ist Fotorealismus kein Thema – der spielerische Charakter erinnert stark an Dall-E. ChatGPT aus dem gleichen Hause (OpenAI) wird in die neuen Betriebssysteme integriert, vielleicht steht auch Dall-E als Technologie hinter „Apple Intelligence“?
Der Anspruch ist jedenfalls „AI for the rest of us“ – für den Alltag, für schnelle und witzige Kommunikation und Illustration, aber nicht für fotorealistische Motive für professionelle Ansprüche.
All diese Technologien sind aktuell noch nicht verfügbar – daher konnten wir sie natürlich noch nicht ausprobieren und praktische Erfahrungen sammeln. Ab Herbst werden die Betaversionen von iOS 18 und macOS Sequioa verfügbar sein – dann können wir auch testen, wie gut die Bildgenerierung in der Praxis funktioniert.
Apple ist schon immer bekannt dafür, nicht die ersten zu sein, die auf bestimmte neue Technologien zu sein – aber diejenigen, die das Potential für einen breiten Markt erschließen. Daher erwarten wir keine Konkurrenz für Midjourney oder Stable Diffusion, sondern einfach zu benutzende Werkzeuge, mit denen sich für den täglichen Gebrauch individuelle Emojis, Illustrationen oder kleine witzige Bilder generieren lassen. Mit aller Vorsicht formuliert: Fotorealistische Qualität oder professionelle Funktionen erwarten wir nicht – aber einfach zu benutzende Tools, die KI generierte Bilder für jedermann im Alltag verfügbar machen und damit auch für mehr Akzeptanz für diese Technologie sorgen.