Sora: OpenAIs innovative KI-Technologie zur Videoerstellung

Download: ChatGPT-Playbook
Philipp Becker
Philipp Becker

Aktualisiert:

Veröffentlicht:

OpenAI hat mit ChatGPT einen Meilenstein in der Künstlichen Intelligenz gesetzt. Keine drei Jahre später kommt der nächste große Release: Das Text-zu-Video-Modell Sora wurde Ende Dezember 2024 vorgestellt und ist seit Ende Februar 2025 auch endlich in der DACH-Region verfügbar. Ein paar wenige Sätze reichen und das KI-Model erstellt täuschend echte Videos. OpenAI setzt hiermit ganz klar neue Maßstäbe in der Welt der Videoproduktion.

Video-Kamera und Roboter symbolisierend für Sora von OpenAI

→ Kostenloser Leitfaden: 84 ChatGPT-Prompts für Marketer [Jetzt herunterladen]

Ich habe mir genauer angeschaut, was Sora alles kann und muss sagen: Ich bin beeindruckt. Wie das KI-Video-Tool funktioniert, wer es nutzen kann und was das für die Filmindustrie bedeutet, erkläre ich Ihnen in diesem Artikel.

Inhaltsverzeichnis

Sora kann sogar noch mehr als nur Videos aus Prompts generieren. Wie Open AI auf seiner Website bekannt gab, kann das Tool auch Videos aus Bildern erstellen oder bestehende Videos verlängern, mehrere Videos remixen und nach und nach anpassen oder fehlende Sequenzen ergänzen.

OpenAI zufolge ist „Sora in der Lage, komplexe Szenen mit mehreren Charakteren, spezifischen Bewegungsmustern und genauen Details des Motivs sowie des Hintergrunds zu generieren. Das Modell versteht nicht nur, wonach der Nutzende in seinem Prompt gefragt hat, sondern auch, wie Dinge in der physischen Welt existieren."

Wie funktioniert Sora?

Sora funktioniert als eine Art Kombination aus Text- und Videogenerator, genauer gesagt ist die Video-KI ein Diffusionsmodell. Diese Art von KI ist besonders gut darin, realistische Bilder und Videos mit feinen Details zu erzeugen. Sie nimmt Korrekturen Schritt für Schritt vor, weshalb Sora so gut darin ist, hochwertige und flüssige Videos zu generieren. Ich stelle mir die Funktionsweise in etwa wie eine:n Bildhauer:in vor: Es gibt zunächst einen diffusen Steinblock, der nach und nach zu einer detaillierten Skulptur geformt wird.

Zusätzlich nutzt Sora die sogenannte Transformer-Architektur. Diese hilft der KI, ein Video nicht einfach nur aus Einzelbildern zusammenzusetzen, sondern die Zusammenhänge zwischen den einzelnen Bildausschnitten („Patches“) zu verstehen. Dadurch entstehen besonders flüssige und realistische Bewegungen.

Die technologische Grundlage dafür stammt aus OpenAIs bekannten GPT-Modellen, die normalerweise für Texte verwendet werden. Statt Wörter vorherzusagen – wie bei ChatGPT – sagt Sora voraus, wie sich das Video entwickeln sollte.

Über welche Funktionen verfügt Sora?

Sora entwickelt sich stetig weiter und lernt anhand der Eingaben unentwegt dazu. Einige Funktionen bleiben über die Veränderungen hinweg allerdings immer bestehen und machen das Tool für mich daher so besonders:

  • Text zu Video: Wie bereits erwähnt, erstellt Sora aus einfachen Texteingaben realistische Videos. Mehrere Sequenzen, Kamerawinkel und Perspektiven werden – je nach Prompt – in einem einzigen Video zusammengefügt.
  • Sprachverständnis: Sora liest quasi zwischen den Zeilen. Das Tool verfügt über die Fähigkeit, Texte und Eingaben zu analysieren und in einem zweiten Schritt zu interpretieren. Nuancen innerhalb der Texte werden herausgefiltert, sodass das Video am Ende Ihren Erwartungen entspricht.
  • Verbesserungen: Sie können generierte Videos so verbessern, dass sie letztlich genau Ihren Erwartungen entsprechen. Fortschrittliche Bearbeitungswerkzeuge, Filter oder kreative Übergänge lassen jedes Video perfekt erscheinen.
  • Verschiedene Stile: Egal, was Sie in das Textfeld eingeben und wie Ihr Befehlt lautet – Sora kann Ihren Wunsch erfüllen. Von realistischen Nachahmungen bis hin zu Comics oder stilisierten Kunstwerten.

Ein eigenes Video mit dem Videogenerator Sora erstellen

So erstellen Sie Schritt für Schritt ein Video in Sora:

Grafik mit Schritt-fuer-Schritt-Anleitung, wie man mit Sora Videos erstellen kann

Schritt 1: Erstellen Sie sich einen Account und melden Sie sich bei Sora an

Rufen Sie die Seite „https://openai.com/sora“ auf und melden Sie sich über das „Log in“-Feld an. Geben Sie in der Registrierungsmaske Ihre E-Mail-Adresse sowie ein Passwort ein. Bestätigen Sie Ihre E-Mail-Adresse, sodass Ihr Konto verifiziert wird.

Schritt 2: Sora einen Befehl erteilen

Der Startbildschirm von Sora ist mit vielen Videos gespickt. Am unteren Bildrand sehen Sie ein Chatfenster, in das Sie Ihren Text eingeben. Bevor Sie den Text abschicken, haben Sie die Möglichkeit, einen Stil zu wählen und das Seitenverhältnis des Videos zu bestimmen. Stellen Sie dann ein, welche Auflösung und Länge es haben soll. Das Fragezeichen am rechten Rand der Toolleiste zeigt Ihnen, wie viele Credits Sie verbrauchen, wenn Sie das Video „in Auftrag“ geben. Mit dem Klick auf den kleinen Pfeil ändert sich die Ansicht und das Video wird kreiert.

Schritt 3: Passen Sie Ihr Video an

Sora erstellt Ihnen nun mehrere Versionen. Fahren Sie mit der Maus über die verschiedenen Videos, spielen diese automatisch ab. Mit einem Klick auf Ihren Favoriten öffnet sich der Bearbeitungsmodus. Dort können Sie:

  • den Prompt ändern,
  • den Clip zuschneiden,
  • über den „Remix“-Button neue Wünsche und Änderungen hinzufügen,
  • das Video mit einem anderen zusammenlegen („Blend“) oder
  • das Video in eine unendlich lange Sequenz („Loop“) umwandeln.

Gefällt Ihnen das Video? Am oberen, rechten Bildrand sehen Sie ein Herzchen-Icon. Speichern Sie Ihr Video, um es später noch einmal zu bearbeiten, teilen Sie es auf Ihrem Feed oder laden Sie es herunter.

Quelle: YouTube - OpenAI

Falls Sie mehrere Videos oder komplexere Videos miteinander verbinden möchten, sollten Sie die „Storyboard“-Möglichkeit nutzen. Dort können Sie eine gesamte Szene beschreiben – Charaktere, Aktionen, Änderungen innerhalb des Videos oder bestimmte Stile. In den verschiedenen Karten, die beim Klicken auf die Timeline auftauchen, beschreiben Sie nun die verschiedenen Szenen.

OpenAI beschreibt den Vorgang in einem Video:

Quelle: YouTube - OpenAI

Mit Prompts kreiert: Beispiele für Videos mit Sora

Auf der Website von OpenAI finden Sie dutzende Videos, die mit Sora erstellt wurden – ohne nachträgliche Anpassung, wie das Unternehmen wissen lässt. Auf YouTube hat OpenAI zudem einige Clips veröffentlicht, welche KI-generierte Videos zeigen. Ein Highlight, das ich sehr beeindruckend finde, ist ein knapp zweiminütiges Video, indem Regisseur Wayne Price einen Text des Poetry-Slammers und Songwriters IN-Q visualisiert:


Quelle: YouTube - OpenAI

Das wohl bekannteste Video von Sora ist bereits fast ein Jahr alt und wurde mit der ersten Version (Launch im Februar 2024) veröffentlicht:

Quelle: YouTube - OpenAI

Das gezeigte Mammut-Video entstand aus dem folgenden Prompt: „Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.“

Ganz so lang müssen die Sätze nicht einmal sein, um beeindruckende Ergebnisse zu erhalten. Aus dem Prompt „A litter of golden retriever puppies playing in the snow. Their heads pop out of the snow, covered in.“ erstellt Sora folgendes Video:

Quelle: YouTube - Newsshooter

Seit dem Release gibt es etliche Clips, die mit Sora kreiert wurden. Im Tool selbst finden Sie ebenfalls Inspiration und Videos mit den entsprechenden Prompts.

Die gezeigten Beispiele erinnern an künstlerische Kreationen. Doch so weit muss es gar nicht gehen: Sora kann Ihnen auch im Alltag helfen, etwa als strategisches Marketing-Tool. Sie möchten eine reine Video-Kampagne bei Instagram schalten und auf Ihre Markenbotschaft eingehen – beispielsweise auf die Nachhaltigkeit, Innovation oder den Lifestyle-Hintergrund Ihrer Marke? Dann könnten Sie darüber nachdenken, kurze Clips oder eine animierte Reise durch eine fiktive Welt zu erstellen und so das Storytelling zu Ihrer Marke aufbauen.

Gleiches geht natürlich auch als innovativer Beginn Ihres nächsten Newsletters – wieso nicht einmal mit einem Video starten? Entscheidend für den Erfolg sind dabei präzise Prompts, die den Stil und Ton treffen, damit das Video Ihren Wünschen entspricht.

Gerade beim Einsatz von KI-Tools wie Sora lohnt es sich, eine klare Strategie für die Texterstellung zu haben. Eine fundierte Einführung in die richtige Nutzung von ChatGPT & Co. bietet beispielsweise das kostenlose ChatGPT Playbook von HubSpot, das Tipps zur Formulierung von Prompts gibt und zum Beispiel auch dabei hilft, Betreffzeilen zu formulieren, um die Öffnungsrate Ihrer Mails zu erhöhen.

ChatGPT-Playbook

Entdecken Sie die vielfältigen Einsatzmöglichkeiten von ChatGPT in Ihren Marketing- und Vertriebsstrategien.

  • Konkrete Marketing-Anwendungen mit ChatGPT
  • Optimierung und Automatisierung von Marketingprozessen
  • Nutzung von ChatGPT für effektive Kommunikation
  • 84 kostenlose ChatGPT-Prompt-Vorlagen

Sora von OpenAI: Wie hoch sind die Kosten?

Wer Sora nutzen möchte, benötigt ein bezahltes ChatGPT-Abonnement, das ab 20 US-Dollar monatlich beginnt. Open AI veröffentlicht seinen KI-Videogenerator also zwar als „Standalone“-Tool, es lässt sich aber nicht separat erwerben.

In folgenden beiden Abo-Modellen von ChatGPT ist Sora enthalten:

Paket Preis ANZAHL der Videos max. Auflösung Videolänge
ChatGPT Plus 20 US-Dollar/Monat bis zu 50 Videos (1.000 Credits) bis zu 720p maximale Länge 5 Sekunden
ChatGPT Pro 200 US-Dollar/Monat bis zu 500 Videos (10.000 Credits) bis zu 1080p maximale Länge 20 Sekunden

Zudem kann ich in der Pro-Version auch das Wasserzeichen entfernen, wenn ich ein Video downloade – das ist in der Plus-Version leider nicht möglich. Ich persönlich finde es etwas schade , dass in der günstigeren Variante von Sora nur fünfsekündige Videos möglich sind.

Wie gut ist Sora?

Die Technologie scheint auch nach der Testphase noch nicht perfekt ausgereift zu sein. Wie ich im Online-News-Magazin Bloomberg las, waren sich die dortigen Expert:innen einig, dass Sora in seiner ersten Version aus dem Februar 2024 „not ready for prime time“ war.

Der bekannte YouTube Marques Brownlee aus den USA hat die neueste Version des Tools bereits ausführlich getestet. Er merkt ebenfalls an, dass Sora noch nicht perfekt sei, gerade bei Bewegungen mehrerer Objekte im Bild – beispielsweise Beinen von Menschen oder Tieren.

Ich kann mich gut erinnern, dass Füße und Hände auch bei den ersten KI-Bildgeneratoren ein großes Problem waren und teilweise noch sind. Es verwundert daher nicht, dass auch Sora damit zu kämpfen hat. Brownlee kommt letztlich zum Fazit, dass Sora ein „mächtiges Tool in den Händen von Millionen von Menschen ist“, und deutet damit an, dass die realistischen Videos auch eine Gefahr darstellen können.

Quelle: YouTube - MKBHD

Was sind die Grenzen und Herausforderungen von Sora?

Dass die Funktionsweise von Sora noch nicht hundertprozentig perfekt ist, zeigt schlicht der Blick auf das ein oder andere bereits veröffentlichte Video. Dem ist sich OpenAI allerdings auch bewusst.

Das Unternehmen selbst gibt in einem Blogartikel preis, dass die neueste Version – Sora Turbo – zwar besser und schneller als die erste Generation aus dem Februar 2024 ist, aber noch immer mit vielen Herausforderungen kämpft: „Sora erzeugt oft unrealistische physikalische Effekte und hat Probleme mit komplexen Handlungen über lange Zeiträume“, erklärt der US-Konzern.

Folgende Schwächen hat das Tool laut OpenAI:

  • Die Physik einer komplexen Szene, beispielsweise der Zusammenhang von Ursache und Wirkung. Ein Beispiel: Jemand beißt in einen Keks, welcher danach aber keine abgebissene Stelle aufweist.
  • Verwechslung räumlicher Details in einem Prompt – beispielsweise rechts und links oder vorwärts und rückwärts.
  • Schwierigkeiten bei Ereignissen, die in einem bestimmten Zeitfenster mit klarer Abfolge stattfinden.

Zudem sind die Ergebnisse aktuell auf 20 Sekunden begrenzt. Spannend ist, dass in der allerersten Sora-Version 60-sekündige Videos gab. Es bleibt abzuwarten, ob sich das in den kommenden Monaten noch ändert – oder es beispielsweise Optionen gibt, gegen Aufpreis längere Videos zu generieren.

Das Ziel sei es, der Gesellschaft mit der breiten Veröffentlichung des KI-Videogenerators nun Zeit zu geben, zu testen und gemeinsam auch gewisse Sicherheiten und Verantwortlichkeiten im Umgang mit den Möglichkeiten zu entwickeln. Genau diesen Punkt der Ethik sehe auch ich noch etwas bedenklich.

Welche Bedenken gibt es gegenüber dem Videogenerator Sora?

Sekundengrenzen und Herausforderungen sind das eine – die Fragen nach der Ethik das andere. Denn: Deepfakes (realistisch wirkende Inhalte, die durch KI abgeändert werden) gibt es schon jetzt und mit Sora lassen sich auch gänzlich neue fiktive Videos produzieren. Und das mit nur einigen wenigen Sätzen. Logisch also, dass Expert:innen schon seit der ersten Ankündigung von Sora im Februar 2024 über Risiken und die Gefahr der Verbreitung falscher Informationen mittels KI-Videos diskutieren.

In einem Interview hebt Sabrina Heike Kessler vom Institut für Kommunikationswissenschaft und Medienforschung der Universität Zürich diese Zweifel noch einmal hervor: „KI-generierte Videos können Realität und Fiktion ununterscheidbar machen. So haben sie das Potenzial, Fehlinformationen zu verbreiten und damit die Meinungsbildung negativ zu beeinflussen.“

OpenAI griff diese Bedenken bei der Vorstellung von Sora bereits auf. Sogenannte „Red Teamers“ seien damit beschäftigt zu kontrollieren, dass beispielsweise kein Hass- und Fake-Content entsteht. Das Unternehmen arbeitet also aktiv daran, Missbrauch zu verhindern.

Dafür sollen unter anderem neue Tools entwickelt, als auch „bestehende Sicherheitsmethoden“ von Dall-E-3 verwendet werden. Zudem wolle man jeden Prompt auf Eingaben überprüfen, die den OpenAI-Richtlinien widersprechen. Gleiches gilt auch für die generierten Videosequenzen. Auch der EU AI Act, welcher Künstliche Intelligenz europaweit regulieren soll, bildet eine gute Grundlage.

Eine weitere wichtige Maßnahme zur Transparenz ist die Implementierung von C2PA-Metadaten, die jedes Sora-generierte Video eindeutig kennzeichnen und dessen Herkunft nachvollziehbar machen. Darüber hinaus werden sichtbare Wasserzeichen standardmäßig in die Videos integriert. OpenAI hat auch ein internes Suchtool entwickelt, das technische Merkmale des generierten Contents nutzt, um ihre Herkunft zu überprüfen.

OpenAI schließt seine Ausführungen zum Thema mit der folgenden Aussage ab: „Wir blocken bereits heute besonders schädliche Formen des Missbrauchs, etwa Prompts zum sexuellen Missbrauch von Kindern und sexuelle Deepfakes.“ Der Konzern hoffe, mit der laut seiner Aussage noch immer „frühen Version von Sora“ Menschen auf der ganzen Welt zu ermöglichen, neue Formen der Kreativität zu erforschen, Geschichten zu erzählen und die Grenzen dessen zu erweitern, was mit Video-Storytelling möglich sei.

Der Weg zu Artificial General Intelligence

OpenAI sieht sein neues Video-Modell selbst als großen Schritt in Richtung AGI, also der Allgemeinen Künstlichen Intelligenz (Artificial General Intelligence). Noch existiert AGI nur rein hypothetisch. Per Definition ist die Erfindung ein künstliches, äußerst autonomes System, welches gleiche oder sogar bessere kognitive und intellektuelle Fähigkeiten wie wir Menschen besitzen soll. Da Sora die reale Welt mithilfe seiner zugrundeliegenden Techniken bereits selbst analysieren, verstehen und simulieren kann, sprechen viele Expert:innen von einem großen Durchbruch.

Auch OpenAI-CEO Altman ist sich dessen bewusst. Im Podcast des KI-Forschers Lex Fridman sprach Altman über die Technologie und ließ Vorsicht verlauten: „Ich wollte sagen, und das glaube ich immer noch, dass es wichtig ist, dass weder ich noch irgendeine andere Person die totale Kontrolle über OpenAI oder über AGI haben.“ Er sei davon überzeugt, dass ein gutes Verwaltungssystem die Grundlage sein müsse.

Sora: Gibt es KI-Alternativen?

Ich finde, es ist schon deutlich zu sehen, wie gut Sora als KI-Videogenerator funktioniert. Wenn ich an frühere Text-to-Video-Tools denke, hebt sich Sora davon doch ab. Allerdings – was zu erwarten war – schläft die Konkurrenz nicht, wie Veo 2 von Google zeigt.

Veo 2, nur zwei Wochen nach dem Release von Sora in einer neuen Version veröffentlicht, zeigt ebenfalls beachtliche Leistungen. Vergleichen Sie am besten selbst – das ist ein offizielles Compilation-Video von Google:


Quelle: YouTube Google DeepMind

Einem weiteren KI-Videogenerator, der vor der Veröffentlichung von Sora als einer der besten auf dem Markt galt, ist Runway Gen-4. Vor etwa einem Jahr veröffentlichte das Unternehmen seine dritte Version, Ende März 2025 folgte nun die vierte Generation, wie es in einer Ankündigung heißt. Das Tool muss sich meiner Meinung nach als Sora-Alternative nicht verstecken, wie das folgende Video zeigt:


Quelle: YouTube - Runway

Runway ermöglicht es, verschiedene Stile zu adaptieren, allerdings überzeugt mich vor allem die Detailtiefe der vierten Generation. Denn: Runway schafft es, Charaktere und Objekte über mehrere Szenen hinweg zu erstellen, ohne dass sie sich signifikant verändern. Mich überzeugt besonders die Option, zum Beispiel ein Foto eines Objekts in einem bestimmten Setting hochzuladen, welches in einem nächsten Schritt von der KI in ein Video umgewandelt wird.

Einen Haken gibt es allerdings: Runway soll laut Medienberichten angeblich YouTube- und Netflix-Videos für sein Training genutzt haben, was bei mir logischerweise Fragen der ethischen Standards und des Urheberrechts aufwirft und aktuell noch in Klärung ist.

Verändert Sora die Filmindustrie?

Die Technologie gibt großen Freiraum für die kreative Freiheit und lässt die Grenzen zwischen Realität und virtueller Welt verschwimmen – das birgt enorme Chancen, auch für Werbetreibende.

Bisher ist, wie auch bei ChatGPT davon auszugehen, dass sich die Video-KI durchsetzt und noch weiter entwickeln wird. Das könnte auch einen Wendepunkt für die Filmindustrie und damit einhergehende Berufe bedeuten. Mit Tyler Perry (unter anderem Regisseur und Produzent) gibt es bereits einen bekannten Player aus der Branche, der eine geplante, 800 Millionen schwere Studioexpansion aufgrund der Sora-Ankündigung pausiert hat.

Perry erzählte dem Magazin Hollywood Reporter außerdem, dass er bereits im vergangenen Jahr Hinweise auf die Entwicklung erhalten hatte – bei der Vorstellung war er dennoch überrascht von der Qualität. Er bezeichnet Sora als „atemberaubend“, außerdem gehe er davon aus, dass KI-Videogeneratoren „jeden Winkel der Industrie berühren könnten“. Dennoch äußerte er als Profi deutlich seine Bedenken, was Sora für die Jobs in der Filmbranche bedeuten könnte.

An anderer Stelle kann Sora allerdings ein Gewinn sein: Denken Sie beispielsweise an neue Marketingkampagnen im Social-Media-Bereich oder einfache Erklär- oder Image-Videos für Ihre Website. Was das betrifft, kann ich mir sehr gut vorstellen, dass Sora durch die Einfachheit seiner Bedienoberfläche ein hilfreiches Tool sein kann, um schnelle Ergebnisse zu erhalten.

Fazit: Sora – Revolution oder Risiko?

Wie sich Sora nach dem DACH-Launch entwickelt und welche Auswirkungen folgen, bleibt abzuwarten – dafür ist noch zu wenig Zeit verstrichen. Ich gehe davon aus, dass OpenAI das Tool – ähnlich wie bei ChatGPT – mit rasanter Geschwindigkeit weiterentwickelt. Die Qualität und Realitätsnähe der generierten Videos setzen neue Maßstäbe, und das Tool eröffnet kreativen Köpfen sowie Unternehmen ganz neue Möglichkeiten.

Besonders für Marketing-Teams mit begrenzten Budgets oder knappen Produktionszeiten kann Sora eine wertvolle Ergänzung sein. Das haben bereits 58 Prozent der Marketer:innen erkannt: Sie nutzen generative KI bereits, um Konzepte zu entwickeln und Ideen im Content-Bereich auszuarbeiten.

Doch es gibt auch Herausforderungen: Bewegungsfehler, unrealistische physikalische Effekte und ethische Fragen rund um Deepfakes und Falschinformationen sind nicht zu unterschätzen. Was bedeutet das konkret? Nutzen Sie Sora gezielt, aber bewusst. Testen Sie das Tool für Social-Media-Clips, Kampagnen-Teaser oder personalisierte Videobotschaften, aber achten Sie auf Qualitätssicherung und Glaubwürdigkeit. Gerade im professionellen Marketing bleibt der menschliche Faktor unerlässlich – sei es für kreative Konzeptentwicklung, strategische Planung oder die finale redaktionelle Kontrolle.

Kostenloser Download: ChatGPT-Playbook

Themen: ChatGPT

Verwandte Artikel

Boosten Sie Ihr Business mit konkreten Anwendungen, Wachstumsstrategien, Optimierungen & Vorlagen für ChatGPT!

KOSTENLOS HERUNTERLADEN