Midjourney ist bekannt als eines der besten Tools, um Bilder zu generieren. Jetzt folgt mit Midjourney Video der nächste Schritt: Nutzer können aus ihren (und sogar aus hochgeladenen) Bildern animierte Videos erstellen. Damit öffnet Midjourney nicht nur die nächste kreative Tür, sondern sendet auch ein klares Signal: Die Vision von Midjourney geht weit über Bilder hinaus – es geht um KI-generierte Welten in Echtzeit.
Aber jetzt bleiben wir erst einmal in der Jetzt-Zeit und schauen uns an, wie Midjourney Video funktioniert und wie es sich schlägt.
Inhalte
Midjourney Video auf einen Blick
Die wichtigsten Informationen im Überblick:
- Nutzer können ab sofort über den
Animate
Button Bilder animieren („Image-to-Video“). Die entsprechenden Prompts für die gewünschte Bewegung werden entweder imAuto Mode
automatisch generiert oder können imManual Mode
selbst bestimmt werden. - Zwei Bewegungsmodi stehen jeweils zur Auswahl:
Low Motion
für ruhige undHigh Motion
für dynamische Szenen. - Es lassen sich auch Bilder animieren, die nicht mit Midjourney generiert wurden, indem man sie über den Image-Button links oben in der Promptzeile hochlädt und als Startbild (Starting Frame) definiert (detaillierte Anleitung weiter unten).
- Jeder Video-Job liefert vier Clips à 5 Sekunden. Die Kosten für ein Video-Job sind etwa 8x so hoch wie für einen Bild-Auftrag.
- Jedes Video ist zunächst 5 Sekunden lang, kann aber bis zu viermal um jeweils 4 Sekunden verlängert werden – also auf bis zu 21 Sekunden.
- Der Zugang ist zunächst nur über das Web-Interface und nicht über Discord verfügbar.
- Ein Video-Releax-Modus für „Pro“-Abonnenten wird getestet.
Hintergrund: Warum Midjourney jetzt Videos macht
Auf den ersten Blick wirkt der neue Video-Workflow wie eine Erweiterung der bestehenden Bildfunktionen. Doch hinter dem Schritt steckt eine strategische Vision: Midjourney will ein System entwickeln, das in Echtzeit offene Welten simulieren kann – ähnlich einem Computerspiel, aber KI-generiert, dynamisch, interaktiv und visuell beeindruckend.
Dazu braucht es mehrere technologische Komponenten:
- Bildmodelle, wie wir sie schon von Midjourney kennen
- Videomodelle, die aus statischen Szenen Bewegung erzeugen – jetzt vorgestellt
- 3D-Modelle, die perspektivisches Bewegen im Raum ermöglichen – in Planung
- Echtzeitfähigkeit
Das neue Videomodell ist also ein weitere logischer Schritt in Richtung dieser Vision für die Zukunft.
Ein erster Schritt in diese Richtung war übrigens Midjourney Patchwork, das zuletzt ein wenig in Vergessenheit geriet. Wir sind uns aber sicher, dass Midjourney Video dort auch demnächst Einzug halten wird.
Anleitung: So funktioniert der Midjourney Video-Workflow
Der neue Video-Modus ist nahtlos in das bestehende Midjourney Web-Interface integriert. Wer bereits mit Prompts Bilder erstellt hat, wird sich schnell zurechtfinden.
Schritt 1: Bild generieren oder hochladen
Erstelle wie gewohnt ein Bild über einen Textprompt.

Alternativ kannst du ein eigenes Bild hochladen. Ziehe es einfach in die Prompt-Leiste und markiere es als „Starting Frame“.

Schritt 2: „Animate Image“-Funktion nutzen
Nach der Bildgenerierung erscheint rechts unten nun die neue Option „Animate Image“.

Hier gibt es zwei Möglichkeiten:
Auto
: Midjourney erstellt selbst einen Bewegungsprompt.Manual
: Du gibst selbst einen Bewegungsprompt ein, z. B. „quick zoom out
“ oder „clouds moving fast
“.

Darüber hinaus kannst du auswählen, wieviel Bewegung im Bild sein soll:
Low Motion
– geeignet für ruhige Szenen mit subtiler Dynamik. Die Kamera bleibt oft statisch, das Motiv bewegt sich sanft.High Motion
– alles bewegt sich, inklusive Kamera. Ideal für Action oder dramatische Szenen. Nachteil: In komplexen Szenen kann es zu Artefakten oder unsauberen Übergängen kommen.
Schritt 3: Video verlängern
Gefällt dir eine der Varianten, kannst du das Video bis zu viermal um jeweils etwa 4 Sekunden verlängern – so dass sich Videos von bis zu 21 Sekunden generieren lassen.
Für die Verlängerung kann man erneut wählen, ob…
- … der Prompt automatisch generiert wird oder manuell vorgegeben wird
- … viel oder wenig Bewegung im Video zu sehen sein soll

Schritt 4: Export
Fertige Videos können als H.264-Kodierte MP4-Datei heruntergeladen (derzeit allerdings nur mit 480p) und weiterverwendet werden – ob für Social Media, kreative Projekte oder einfach zum Teilen in der Community.
Mittlerweile gibt es dafür zwei Download-Button. Zum einen den bekannten Button (Download Video für Social Media) sowie daneben einen neuen Button, um das Raw Video zu laden. Beide Videos haben die gleiche Auflösung, das Raw Video jedoch die größere Dateigröße.
Was kostet Midjourney Video?
Midjourney hat den Anspruch treu, KI-Werkzeuge bezahlbar anzubieten. Für ein Video werden etwa achtmal so viele „Fast Minutes“ benötigt wie für ein Bild. Damit ist Midjourneys neues Angebot laut eigenen Angaben mehr als 25-mal günstiger als aktuelle Wettbewerber – ein beachtlicher Schritt in Richtung Demokratisierung hochwertiger Videokreation.
Unsere Einschätzung
Der allererste Eindruck mit 2D, 3D, stilisierten Bildern…
… ist nach ein paar ersten schnellen Tests, dass
- es mit fotorealistischen Motiven gut funktioniert, aber nicht auf dem Niveau wie z.B. von Kling AI
- es richtig gut mit 2D-Animationen, nicht-fotorealistischen Bildern und Midjourney Style Codes funktioniert, sehr konsistent mit flüssigen Animationen
Der zweite Eindruck mit fotorealistischen Motiven…
… ist nach einem ersten Test mit unserem bisherigen Testsieger Kling AI 2.1, dass – ach seht einfach selbst:
Die groben Rahmenbedingungen dazu sind:
- Midjourney Video : günstiger, liefert direkt vier Varianten pro Bild , aktuell nur 480p, keine Audio-/LipSync-Optionen
- Kling 2.1: deutlich hochwertigere Auflösung , professionellere Kontrolle & Features , aber zu einem höheren Preis
Unsere finale Einschätzung zu Midjourney Video…
… muss noch ein wenig warten, bis wir weitere Vergleiche zu anderen KI Video Tools haben bzw. auch in Bezug auf nicht-fotorealistische Motive. Bisher aber können wir sagen, dass Midjourney Video auf Anhieb ein sehr ernstzunehmender Player für KI-Video zu sein scheint.
Es bleibt auf jeden Fall spannend zu sehen, wie sich die Technologie in den kommenden Monaten weiterentwickelt – und welche kreativen Möglichkeiten sich daraus ergeben. Klar ist: Midjourney bleibt in Bewegung. Im wahrsten Sinne des Wortes.
Sollen wir dich über uns Tests mit Midjourney Video auf dem Laufenden halten? Dann abonniere unseren Newsletter!
Ich muss ehrlich sagen, dass mich die Animationen bei meinen erstellten Bildern, echt erstaunt haben. Die Erkennung und Animationen entsprechender Elemente im Bild sind wesentlich besser als bei Kling und stellenweise auch wesentlich flüssiger. Es werden kaum erdachte Dinge ins Bild gebracht. Am Besten finde ich allerdings, dass keine komplett neue Animation erstellt wird. Die Qualität im Export ist natürlich leider noch ziemlich gering. Aber für den ersten Schritt umso erstaunlicher.
Wenn diese Funktion weiter vortwärts gebracht wird und dann, wie im Artikel erwähnt, auch im Patchwork eingebunden wird, dann wird das den Markt bestimmt nochmal einen neuen drive verpassen. Ich bin da echt gespannt.
Vor allem die Vision, welche man bei Midjourney verfolgt, klingt spannend und lässt mich hoffen, dass Patchwork eben genau die Plattform sein wird, mit welcher man dann alle Sachen umsetzen will.