KI Video Prompts
KI · VIDEO

Das Geheimnis guter KI-Video-Prompts

Entdecken Sie, warum JSON-Prompts der Schlüssel zur Produktion cinematischer Videos mit Veo 3 und Flora sind — mit voller Kontrolle, ohne Überraschungen und zu einem Bruchteil der traditionellen Kosten.

27. Apr. 2026·8 Min. Lesezeit

Die KI-Videogenerierung hat 2026 einen enormen Sprung gemacht. Tools wie Veo 3 von Google DeepMind oder Kling AI können 4K-cinematische Clips mit nativem Audio in Sekunden produzieren. Aber es gibt ein Problem, das niemand erwähnt: Die meisten Ergebnisse sind mittelmäßig, weil die Prompts vage sind.

Das Geheimnis liegt nicht im Modell. Es liegt darin, wie Sie mit ihm sprechen. Und die wirkungsvollste Art, mit einem Videomodell zu kommunizieren, ist nicht Freitext — es ist strukturiertes JSON. Hier erfahren Sie warum und wie.

Die komplette Pipeline: Von Text zu 4K-Video

So funktioniert der Produktionsfluss mit flora.ai, Veo 3 und Flux Pro

01

Text Prompt

flora.ai

Beschreibt die Szene in natürlicher Sprache: Stil, Dauer, Stimmung, Kamerabewegung. Der Ausgangspunkt von allem.

"cinematic spot bei Sonnenaufgang, Drohnenaufnahme, goldene Stunde, 30s"
02

JSON Builder

Strukturierte Kontrolle

Der Text-Prompt wird in ein strukturiertes JSON mit Szenen, Audio, Ausgabeformat und Stilparametern umgewandelt.

{ scenes, audio, output: "4K" }
03

Veo 3 · Video

Google DeepMind

Das Videomodell empfängt das JSON und generiert die cinematische Sequenz mit nativem Audio, Bewegung und Beleuchtung.

model: veo-3 · output: mp4 · 4K
04

Flux Pro · Bild

Stilreferenz

Flux Pro generiert cinematische Referenzframes, die den visuellen Stil und die Farbpalette des endgültigen Videos leiten.

Stilreferenz · cinematischer Frame
05

Output · mp4

Finaler Export

Das Endergebnis: ein 4K-Video mit synchronisiertem Audio, bereit zur Veröffentlichung auf jeder Plattform.

✓ 4K · 30s · Audio · flora.ai Export

Warum der JSON-Prompt alles verändert

Ein Freitext-Prompt lässt zu viel der Interpretation des Modells überlassen. Ein JSON-Prompt gibt Ihnen die volle Kontrolle über jeden Parameter.

Wenn Sie "ein cinematisches Video bei Sonnenaufgang" schreiben, trifft das Modell Hunderte von Entscheidungen für Sie: Dauer, Kamerabewegung, Audiotyp, Szenenrhythmus, Farbpalette. Das Ergebnis kann gut sein — oder völlig anders als vorgestellt.

Mit einem JSON-Prompt gehört jede dieser Entscheidungen Ihnen. Sie definieren Szenen, Kamera, Beleuchtung, Audio und Ausgabeformat. Das Modell führt genau das aus, was Sie ihm sagen.

Ergebnis: reproduzierbar und vorhersehbar

Dasselbe JSON generiert konsistente Ergebnisse. Sie können iterieren, einen Parameter anpassen und genau sehen, was sich ändert.

prompt.json
{
  "project": {
    "style": "cinematic",
    "duration": 30
  },
  "scenes": [
    {
      "camera": "drone",
      "lighting": "golden hour"
    }
  ],
  "audio": {
    "music": "orchestral"
  }
}
Freitext-Prompt
  • Unvorhersehbare Ergebnisse
  • Schwer präzise zu iterieren
  • Modell trifft Entscheidungen für Sie
  • Generisches Audio standardmäßig
Strukturierter JSON-Prompt
  • Volle Kontrolle über jeden Parameter
  • Reproduzierbare Ergebnisse
  • Präzise und effiziente Iteration
  • Audio und Szenen von Ihnen definiert

5 Schlüssel für Video-Prompts, die funktionieren

Die häufigsten Fehler und wie man sie vermeidet

Kamerabewegung definieren

Geben Sie immer den Aufnahmetyp an: Drohnenaufnahme, Tracking Shot, Nahaufnahme, Weitwinkel. Ohne dies wählt das Modell generische Standardeinstellungen.

Richtig"Drohnenaufnahme umkreist das Motiv bei goldener Stunde"
Vermeiden"eine Aufnahme des Motivs"

Beleuchtung spezifizieren

Die Beleuchtung definiert die gesamte Stimmung des Videos. Goldene Stunde, blaue Stunde, Studioleuchten, bewölkt — jede erzeugt eine radikal andere Atmosphäre.

Richtig"goldenes Gegenlicht, warme Töne, Linsenreflexion"
Vermeiden"gute Beleuchtung"

Audio im JSON einschließen

Veo 3 generiert natives Audio. Wenn Sie es nicht im JSON angeben, fügt das Modell generischen Umgebungsklang hinzu. Definieren Sie Musikgenre, Tempo und Soundeffekte.

Richtig{ "audio": { "music": "orchestral", "sfx": "wind" } }
VermeidenKein Audio-Feld einschließen

Stilreferenzen mit Flux Pro verwenden

Erstellen Sie vor der Videogenerierung einen Referenzframe mit Flux Pro. Dies verankert den visuellen Stil und verhindert unerwartete Interpretationen durch Veo 3.

RichtigFrame generieren → als style_reference im JSON verwenden
VermeidenNur auf Text zur Stildefinition vertrauen

Dauer pro Szene kontrollieren

Setzen Sie nicht die gesamte Dauer in ein einzelnes Feld. Teilen Sie das JSON in Szenen mit individuellen Dauern für volle Kontrolle über Tempo und Erzählung.

Richtig{ "scenes": [{ "duration": 8 }, { "duration": 12 }] }
Vermeiden{ "duration": 30 } // keine Szenen

Reales Beispiel: Cinematischer Werbespot

Ein 30-Sekunden-Spot für eine Luxusuhrmarke, vollständig mit KI produziert

Cinematischer KI-Spot - reales Beispiel

Der Kunde benötigte einen 30-Sekunden-Spot für eine neue Uhrenkollektion. Traditionelles Budget: €15.000–€25.000 (Filmteam, Locations, Postproduktion). Mit der KI-Pipeline: €180 an Modellguthaben und 4 Stunden Arbeit.

Der Schlüssel war die Strukturierung des JSON mit 4 verschiedenen Szenen: Drohnenöffnung, Uhrendetailaufnahme, Lifestyle-Szene und Logo-Abschluss. Jede Szene mit eigener Beleuchtung, Kamerabewegung und Dauer.

Einsparung: 99% der traditionellen Kosten

Von €20.000 auf €180. Kein Filmteam, keine Locations, keine Produktionstage.

KI-Videogenerierungs-Workflow

Der Stack 2026

Das komplette Ökosystem für KI-Videoproduktion

flora.ai

Haupt-Orchestrator

Plattform, die alle Modelle verbindet und die komplette KI-Videoproduktions-Pipeline verwaltet.

Veo 3

Videogenerierung

Google DeepMinds Modell für cinematische Videogenerierung mit integriertem nativem Audio.

Flux Pro

Visuelle Referenz

Hochqualitätiger Bildgenerator zum Erstellen von Referenzframes, die den visuellen Stil des Videos leiten.

Kling AI

Video-Alternative

Alternative zu Veo 3 mit exzellenter Kamerabewegungskontrolle und zeitlicher Kohärenz.

Runway Gen-4

Bearbeitung & Verfeinerung

Ideal zum Bearbeiten generierter Clips, Hinzufügen von Effekten und Verfeinern von Details im Endvideo.

99%

Kostenreduzierung vs. traditionelle Produktion

4h

Durchschnittliche Produktionszeit für einen 30s-Spot

4K

Native Ausgabeauflösung mit Veo 3

Mögliche Iterationen ohne zusätzliche Drehkosten

Fazit

KI-Videogenerierung ist keine Magie — es ist Prompt-Engineering. Der Unterschied zwischen einem mittelmäßigen Ergebnis und einem professionellen cinematischen Spot liegt darin, wie Sie die Anweisungen strukturieren.

JSON-Prompts geben Ihnen die Kontrolle, die Freitext-Prompts einfach nicht bieten können. Kombiniert mit einer gut definierten Pipeline — flora.ai als Orchestrator, Veo 3 für das Video, Flux Pro für visuelle Referenzen — können Sie cinematische Inhalte zu einem Bruchteil der traditionellen Kosten produzieren. Die Zukunft der Videoproduktion ist bereits hier.

Möchten Sie KI-Videoproduktion in Ihrem Unternehmen implementieren?

Bei AFENIX helfen wir Marken und Agenturen, KI-Video-Pipelines zu integrieren und Produktionskosten um bis zu 99% zu senken, ohne cinematische Qualität zu opfern.

Kostenlose Beratung anfragen