ElevenLabs ist eine KI-Anwendung für Text-to-Speech. Damit werden Texteingaben in eine natürlich und menschlich klingende Sprache umgesetzt. Dabei könnt Ihr entweder eine der Stimmen-Vorlagen wählen oder ElevenLabs mit Eurer eigenen Stimme trainieren. Und das in mittlerweile fast 30 Sprachen. Vor kurzem eingeführt wurde zudem die Text-to-Sound Funktion, damit könnt Ihr Euch per Prompt Geräusche generieren lassen.
ElevenLabs bietet eine kostenlose Variante mit reduziertem Funktionsumfang, sowie kostenpflichtige Pläne von 5 Dollar bis 330 Dollar an.
Ganz neu ist die Variante Video-to-Sound bzw. Video-to-Sounds-Effects. Dazu ladet Ihr ein Video bei ElevenLabs hoch und erhaltet nach kurzer Wartezeit vier vertonte Vorschläge. Bei mir war bei 10 Videos nur ein Video dabei, bei dem mir keiner der vorgeschlagenen Sounds gefallen hat. Ich kann mir aber vorstellen, dass die Funktion noch um die Möglichkeit eines beschreibenden Prompts ergänzt wird.
Wenn Ihr das Tool auch einmal testen möchtet, es ist aktuell noch kostenlos!, ruft Ihr die entsprechende Webseite auf.
Dort ladet Ihr Euer Video hoch…

…wartet kurz und erhaltet vier alternative Sound-Vorschläge.
Diese könnt Ihr Euch direkt auf der Webseite, Ihr müsst auf den jeweiligen Sound klicken, anhören und bei Gefallen über den entsprechenden Download-Button herunterladen.

Dabei wird das vertonte Video, und nicht nur der Sound geladen. Zur Demo habe ich ein paar Videos genommen, die ich mit MidJourney sowie Leonardo AI Motion erstellt hatte.
.
Aus meiner Sicht wirklich brauchbar und zeigt sehr gut, dass auch das Thema KI-Video immer ‚erwachsener‘ wird und sich langsam in Richtung produktivem Einsatz entwickelt.