Du hast 30 Sekunden. Mehr nicht. So lange dauert es im Durchschnitt, bis ein Zuschauer entscheidet, ob er dein Erklärvideo weiterschaut oder wegklickt. Diese 30 Sekunden entscheiden über Erfolg oder Misserfolg deiner gesamten Videoproduktion – und alles steht und fällt mit dem Skript. Der richtige Einstieg entscheidet, ob sich ein Video für das Publikum lohnt – bereits die ersten Sekunden sind für die Weiter- oder Wegklickrate maßgeblich.
Ein gutes Erklärvideo-Skript ist wie ein gut choreografierter Tanz zwischen Information und Emotion. Es muss komplexe Inhalte verständlich machen, ohne zu langweilen. Es soll überzeugen, ohne aufdringlich zu wirken. Und es muss das alles in wenigen Minuten schaffen.
Die Anatomie eines wirksamen Erklärvideo-Skripts
Vergiss die klassische Drei-Akt-Struktur aus Hollywood-Filmen. Erklärvideos funktionieren anders. Hier geht es um Problem-Agitation-Lösung – oder wie ich es gerne nenne: den PAL-Ansatz.
Problem (0-15 Sekunden): Du packst das Problem deiner Zielgruppe an der Wurzel. Nicht drumherum reden, nicht höflich anklopfen. Direkt rein in die Schmerzpunkte. “Deine Kunden verstehen nicht, was du anbietest – und kaufen deshalb bei der Konkurrenz.”
Agitation (15-45 Sekunden): Jetzt reibst du Salz in die Wunde. Aber elegant. Du zeigst die Konsequenzen auf, machst das Problem greifbar. “Während du erklärst, scrollt dein potenzieller Kunde schon weiter. Zeit ist Geld – und du verlierst beides.”
Lösung (45 Sekunden bis Ende): Hier kommt deine Lösung ins Spiel. Nicht als Wundermittel verkauft, sondern als logische Konsequenz. Du zeigst, wie das Problem gelöst wird, baust Vertrauen auf und führst zum Call-to-Action.
Diese Struktur funktioniert, weil sie der natürlichen Aufmerksamkeitskurve folgt. Menschen sind evolutionär darauf programmiert, bei Problemen hellhörig zu werden. Du nutzt das.
Tonalität: Der unsichtbare Überzeugungshelfer
Die Tonalität entscheidet darüber, ob dein Publikum dir zuhört oder abschaltet. Und hier liegt der erste große Fehler vieler Unternehmen: Sie denken, sachlich sei immer richtig.
Bullshit.
Für B2B-Software-Lösungen? Ja, sachlich funktioniert. Für Fintech-Startups, die Vertrauen aufbauen müssen? Auch sachlich, aber mit einer Prise Empathie. Für Consumer-Apps, die das Leben vereinfachen sollen? Hier darf es gerne unterhaltsam und emotional werden.
Die Tonalität muss zur Zielgruppe passen, nicht zum Unternehmen. Ein Steuerberater kann durchaus humorvoll kommunizieren, wenn seine Zielgruppe gestresste Kleinunternehmer sind, die eine Auflockerung schätzen. Eine Krebshilfe-Organisation sollte hingegen sensibel und hoffnungsvoll kommunizieren.
Tipp aus der Praxis: Stell dir vor, du sitzt deinem idealen Kunden gegenüber im Café. Wie würdest du mit ihm sprechen? Genau diese Tonalität gehört ins Skript.
Die ersten 10 Sekunden: Make it or break it
“Wissen Sie, wie schwer es ist, heute die Aufmerksamkeit der Menschen zu bekommen?” – Stopp. Lösch das. Sofort. Solche Einstiege sind Gift für dein Erklärvideo.
Stattdessen: Starte mit einem Bild, das im Kopf hängen bleibt. “Lisa starrt auf ihren Laptop-Bildschirm. Schon wieder ein potenzieller Kunde, der nach fünf Minuten Website-Besuch abgesprungen ist. Ohne zu kaufen. Ohne zu fragen. Einfach weg.”
Siehst du den Unterschied? Der erste Ansatz ist abstrakt und langweilig. Der zweite ist konkret und emotional. Er baut sofort eine Verbindung auf, weil sich dein Zuschauer in Lisa wiederfindet.
Weitere Einstiegstechniken, die funktionieren:
- Die provokante Frage: “Was wäre, wenn ich dir sage, dass du mit einer einzigen Änderung 40% mehr Kunden gewinnen könntest?”
- Die überraschende Statistik: “73% aller Website-Besucher verstehen nicht, was du anbietest – binnen 8 Sekunden.”
- Das konkrete Szenario: “Es ist Montagmorgen, 9 Uhr. Dein Team sitzt im Meeting und diskutiert über ein Problem, das es seit Monaten gibt.”
Länge und Tempo: Die goldene Balance
Hier kommt eine unbequeme Wahrheit: Die optimale Länge gibt es nicht. Es gibt nur die für dein Thema passende Länge.
Einfache Konzepte: 60-90 Sekunden
Komplexe B2B-Lösungen: 2-3 Minuten
Sehr erklärungsbedürftige Produkte: bis zu 5 Minuten
Wichtiger als die absolute Länge ist das Verhältnis zwischen Sprechtext und visueller Information. Als Faustregel: 120-150 Wörter pro Minute Sprechtext. Das entspricht einem entspannten, aber nicht schleppenden Tempo.
Bei der KI-basierten Videoproduktion können wir das Tempo nachträglich anpassen – ein Luxus, den traditionelle Videoproduktionen nicht haben. Mit KI-gestützter Videoproduktion lässt sich die Effizienz bei der Content-Erstellung nachweislich deutlich steigern. Trotzdem solltest du das Tempo schon im Skript mitdenken.
Übrigens: Pausen sind genauso wichtig wie gesprochene Worte. Sie geben dem Zuschauer Zeit, Informationen zu verarbeiten. Im Skript markiere ich Pausen immer mit [PAUSE 2 SEK] oder ähnlichen Hinweisen.
Sprache vereinfachen ohne zu verblöden
Das ist die Kunst: Komplexe Sachverhalte verständlich erklären, ohne dass sich dein Publikum für dumm verkauft fühlt. Der Trick liegt in der schrittweisen Heranführung.
Statt: “Unsere Lösung implementiert eine KI-gestützte Datenanalyse-Pipeline mit Machine-Learning-Algorithmen zur Optimierung der Customer Journey.”
Besser: “Stell dir vor, du hättest einen digitalen Assistenten, der aus dem Verhalten deiner Kunden lernt. Er erkennt Muster, die dir entgehen, und hilft dir dabei, jedem Kunden genau das zu zeigen, was er braucht.”
Der zweite Ansatz erklärt dasselbe, nutzt aber Bilder und Vergleiche, die jeder versteht. Das ist die Macht der Analogien. Sie machen Abstraktes greifbar.
Weitere Vereinfachungstechniken:
- Konkrete statt abstrakte Begriffe: “Verkäufe” statt “Umsatzgenerierung”
- Aktive statt passive Sprache: “Du sparst Zeit” statt “Zeit wird eingespart”
- Kurze Sätze: Maximum 15-20 Wörter pro Satz
Visuelle Hinweise: Das Drehbuch im Skript
Ein Erklärvideo-Skript ist mehr als nur gesprochener Text. Es ist die Blaupause für das gesamte Video. Deshalb gehören visuelle Hinweise direkt ins Skript – besonders wichtig bei automatisierter Videoproduktion.
Mein Format für Skripte:
[SZENE: Lisa sitzt frustriert vor ihrem Laptop]
SPRECHER: "Lisa starrt auf ihren Laptop-Bildschirm..."
[VISUELL: Grafik zeigt Website-Besucher, die abspringen]
SPRECHER: "Schon wieder ein potenzieller Kunde, der nach fünf Minuten..."
[ÜBERGANG: Zoom auf Bildschirm, Analytics-Dashboard wird sichtbar]
SPRECHER: "Ohne zu kaufen. Ohne zu fragen. Einfach weg."
Diese Struktur hilft nicht nur bei der Produktion, sondern auch beim Schreiben. Du denkst automatisch in Bildern mit und merkst schnell, wenn Text und Visuals nicht zusammenpassen.
Bei komplexen Produkten ist das besonders wichtig. Du kannst nicht alles erklären – manche Dinge müssen gezeigt werden.
Storytelling: Der emotionale Verstärker
Menschen lieben Geschichten. Das ist neurologisch bewiesen. Geschichten aktivieren nicht nur das Sprachzentrum im Gehirn, sondern auch die Bereiche, die für Emotionen und sensorische Erfahrungen zuständig sind.
Für Erklärvideos funktioniert eine abgewandelte Heldenreise besonders gut:
- Held in der gewöhnlichen Welt: Dein Kunde in seiner aktuellen Situation
- Problem/Herausforderung: Das Problem, das gelöst werden muss
- Weigerung/Zweifel: Warum bisherige Lösungsversuche gescheitert sind
- Mentor/Lösung: Dein Produkt als Helfer
- Verwandlung: Das Leben nach der Lösung
- Rückkehr: Der Held kann andere inspirieren
Das klingt komplex, ist aber in 2-3 Minuten gut erzählbar. Besonders bei erklärbedürftigen Dienstleistungen funktioniert dieser Ansatz hervorragend.
Beispiel aus der Praxis: Ein Fintech-Startup, das Kredite für Selbstständige vermittelt, könnte die Geschichte von “Thomas” erzählen – einem Freelancer, der sein Business ausbauen will, aber bei traditionellen Banken abblitzt. Thomas ist der Held, die Kreditverweigerung das Problem, bisherige Lösungsversuche sind gescheitert, das Fintech wird zum Mentor, Thomas bekommt seinen Kredit und kann expandieren.
Die größten Skript-Sünden (und wie du sie vermeidest)
Sünde #1: Informations-Overkill
Du willst alles erklären. Jedes Feature, jeden Vorteil, jede Funktion. Das Ergebnis: Kognitive Überladung. Der Zuschauer schaltet ab.
Lösung: Konzentrier dich auf 3-5 Kernbotschaften. Maximum. Alles andere kann in Folgevideos oder auf der Website erklärt werden.
Sünde #2: Fachjargon ohne Übersetzung
“Unsere API-Integration ermöglicht seamless Workflows…” – äh, was?
Lösung: Für jeden Fachbegriff die 5-Jährigen-Regel anwenden. Würde ein 5-Jähriges Kind verstehen, was du meinst? Wenn nein, übersetzen.
Sünde #3: Der schwache Abschluss
“Wenn Sie Fragen haben, kontaktieren Sie uns gerne.” Gähn.
Lösung: Konkrete Handlungsaufforderungen. “Klick jetzt auf den Button und teste 14 Tage kostenlos” ist hundertmal stärker.
Bei internen Kommunikationsvideos kann der Call-to-Action auch anders aussehen: “Sprich morgen mit deinem Teamleiter über die neuen Prozesse” oder “Nutze das neue Tool ab nächster Woche für deine Projekte.”
Sünde #4: Redundanz
Du wiederholst dieselbe Information in verschiedenen Worten. Das passiert oft unbewusst.
Lösung: Jeder Satz muss neuen Wert liefern. Lies dein Skript laut vor. Alles, was sich wiederholt, fliegt raus.
Der überzeugende Abschluss: Mehr als nur Call-to-Action
Ein starkes Ende bleibt im Gedächtnis. Es fasst nicht nur zusammen, sondern gibt dem Zuschauer das Gefühl, dass sich das Anschauen gelohnt hat.
Drei Abschluss-Varianten, die funktionieren:
1. Der Transformations-Ausblick: “Stell dir vor, wie sich dein Business-Alltag ändert, wenn du nie wieder…”
2. Die emotionale Verbindung: “Du hast nur ein Business. Sorge dafür, dass es floriert.”
3. Der Zeitdruck (wenn authentisch): “Die ersten 100 Kunden bekommen einen Bonus von…”
Der Call-to-Action sollte spezifisch und messbar sein. Nicht “Erfahre mehr”, sondern “Buche jetzt dein kostenloses Beratungsgespräch für nächste Woche.”
Bei Conversion-optimierten Videos haben wir festgestellt, dass CTAs mit konkreten Zeitangaben 23% besser performen als vage Formulierungen.
Best Practices aus erfolgreichen Produktionen
In meiner Zeit bei TRMD habe ich hunderte von Erklärvideo-Skripten entwickelt und optimiert. Einige Muster kristallisieren sich immer wieder heraus:
Pattern #1: Der 80/20-Test
80% des Wertes sollten in den ersten 20% der Zeit vermittelt werden. Wenn dein Video 2 Minuten lang ist, müssen die wichtigsten Informationen in den ersten 24 Sekunden sitzen.
Pattern #2: Die Drei-Sinne-Regel
Sprich mindestens drei verschiedene Sinne an. Visuell ist klar, auditiv auch. Aber kinästhetische Sprache (“Du fühlst dich sicherer”, “Ein Gewicht fällt von deinen Schultern”) verstärkt die Wirkung enorm.
Pattern #3: Der Vertrauens-Stack
Baue systematisch Vertrauen auf: Soziale Beweise (“Über 10.000 Unternehmen nutzen…”), Autorität (“Entwickelt von Experten mit 15 Jahren Erfahrung”), Risikoreduktion (“30 Tage Geld-zurück-Garantie”).
Skripte für die KI-Ära optimieren
Bei KI-basierter visueller Kommunikation gelten teilweise andere Regeln als bei traditioneller Videoproduktion.
Vorteil: Du kannst Skripte schneller testen und iterieren. A/B-Tests verschiedener Einstiege sind problemlos möglich.
Herausforderung: KI-generierte Visuals müssen präzise beschrieben werden. “Glückliche Person” ist zu vage. “Lächelnde Frau, 30-35 Jahre, Business-Kleidung, vor Computer, natürliches Licht” funktioniert besser.
Tipp für die Praxis: Schreibe deine visuellen Anweisungen so, als müsstest du sie einem sehr talentierten, aber pedantischen Illustrator erklären.
Die Prozessoptimierung durch Videoautomatisierung ermöglicht es auch, verschiedene Skript-Varianten für verschiedene Zielgruppen zu entwickeln, ohne das Budget zu sprengen.
Wenn alles steht und fällt mit dem ersten Eindruck
Mir ist kürzlich aufgefallen, wie oft wir über die Technik reden – über KI, über Automatisierung, über Effizienz. Aber am Ende des Tages entscheidet nicht die Technologie über den Erfolg deines Erklärvideos. Es sind die ersten 30 Sekunden deines Skripts.
Du kannst die beste B2B-Sichtbarkeit durch Videos erreichen, die ausgefeilteste Automatisierung nutzen und die Kosten durch KI-Produktion dramatisch senken – wenn dein Skript langweilt, war alles umsonst.
Ein gutes Skript ist wie ein Gespräch mit einem Freund, der zufällig Experte für genau das Problem ist, das dich gerade beschäftigt. Er hört zu, versteht dich und zeigt dir einen Weg, den du vorher nicht gesehen hast.
Vielleicht ist das der wahre Unterschied zwischen einem funktionierenden und einem herausragenden Erklärvideo: Es fühlt sich nicht an wie Marketing, sondern wie Hilfe.