Produktleitfaden

So laden Sie Ihr KI-synchronisiertes Video herunter: Schritt-für-Schritt-Anleitung (MP4, MP3, SRT)

Jump to section

Jump to section

Zusammenfassen mit

Zusammenfassen mit

Teilen

Teilen

Teilen

AI Video-Übersetzer, Lokalisierung und Synchronisationswerkzeug

Probieren Sie es kostenlos aus

Perso AI liefert 10 herunterladbare Dateien aus einem einzigen Synchronisationsprojekt — nicht nur das synchronisierte Video. Sie erhalten das synchronisierte MP4, Quell- und übersetzte Audiospuren (WAV), getrennte Sprecher-Audios (TAR), isolierte Hintergrundmusik (WAV), Quell- und übersetzte Untertitel (SRT) sowie zweisprachige Skripte (XLSX). Jede Datei ist ab dem Starter-Tarif für 6,99 $/Monat verfügbar. Dieser Leitfaden erklärt, was jede Datei ist, wann sie verwendet wird und wie man sie herunterlädt.

In Zahlen: Jede KI-Synchronisationsplattform exportiert das synchronisierte Video. Einige exportieren auch Untertitel und Audiospuren. Perso AI exportiert 10 Dateitypen aus jedem Synchronisationsprojekt — einschließlich isolierter Hintergrundmusik, zweisprachiger XLSX-Skripte und sprechergetrennter Audios — und das alles bereits ab dem Starter-Tarif für 6,99 $/Monat. Keine Enterprise-Sperre. Keine Zusatzgebühren.

Welche Dateien exportiert Perso AI nach der Synchronisation?

Hier ist die vollständige Liste der Dateien, die Sie nach jedem Perso AI-Synchronisationsprojekt herunterladen können:

#

Datei

Format

Was sie enthält

Verfügbar ab

1

Export des synchronisierten Videos

MP4

Vollständiges Video mit übersetztem Voiceover, Lippensynchronisation und originalen visuellen Inhalten

Starter ($6.99/Monat)

2

Export der Quell-Audiospur

WAV

Original-Audiospur aus Ihrem hochgeladenen Video extrahiert

Starter

3

Quell-Audio (nach Sprecher)

TAR

Einzelne Audiodateien, getrennt nach Sprecher, aus dem Original

Starter

4

Export der übersetzten Audiospur

WAV

Nur die synchronisierte Voiceover-Audiospur — kein Video, keine Hintergrundmusik

Starter

5

Übersetzte Audiospur (mit BGM)

WAV

Synchronisiertes Voiceover mit der originalen Hintergrundmusik gemischt

Starter

6

BGM-Export

WAV

Nur isolierte Hintergrundmusik — Gesang vollständig entfernt

Starter

7

Quelluntertitel

SRT

Automatisch generierte Untertitel in der Originalsprache

Starter

8

Übersetzte Untertitel

SRT

Untertitel in der Zielsprache, zeitlich auf das synchronisierte Audio abgestimmt

Starter

9

Quellskript

XLSX

Vollständige Transkription des Originalaudios im Tabellenformat

Starter

10

Quell- & übersetztes Skript

XLSX

Nebeneinander angeordnetes zweisprachiges Skript — Original- und übersetzter Text in parallelen Spalten

Starter

Perso AI generiert alle 10 Dateien automatisch. Keine Add-ons, keine zusätzlichen Credits, keine separaten Tools. Ein Synchronisationsprojekt, 10 Ausgaben.

Sehen Sie jede Datei, die Sie mit einer Synchronisation erhalten

1. Export des synchronisierten Videos (MP4)

Was es ist: Das fertige synchronisierte Video — Ihr Originalmaterial mit der übersetzten Sprachausgabe, die die Quell-Audiospur ersetzt. Voice Cloning bewahrt Tonfall, Tempo und Sprechrhythmus des ursprünglichen Sprechers. Die Lippensynchronisation wird automatisch angewendet.

Wann man es verwendet:

  • Veröffentlichung der synchronisierten Version direkt auf YouTube, TikTok oder Ihrem LMS

  • Einbettung auf Landingpages oder Produktseiten für verschiedene Märkte

  • Weitergabe an Stakeholder zur Prüfung vor der Auslieferung

Was es anders macht: Lippensynchronisation ist ein optionaler Schritt innerhalb des Synchronisations-Workflows von Perso AI — Nutzer entscheiden, wann ein Projekt sie benötigt, und das Ergebnis wird als einzelner MP4-Export geliefert. Die eigentliche Lücke liegt jedoch in der Qualität. Die meisten Wettbewerber, die Lippensynchronisation anbieten, erzeugen trotzdem sichtbare Abweichungen der Mundformen, Frame-Mismatches oder starre, mechanische Bewegungen, die das Vertrauen der Zuschauer untergraben. Die Lippensynchronisation von Perso AI ist so konstruiert, dass sie auch einer Nahprüfung standhält — präzise Mundformen, natürliche Übergänge, sendefähige Ausgabe.

2. Export der Quell-Audiospur (WAV)

Was es ist: Die ursprüngliche Audiospur aus Ihrem hochgeladenen Video, extrahiert als hochwertige WAV-Datei.

Wann man es verwendet:

  • Archivierung der sauberen Original-Audiospur vor der Synchronisation

  • Verwendung des ursprünglichen Voiceovers in einem anderen Schnittprojekt (Premiere Pro, DaVinci Resolve, Final Cut)

  • Vergleich der Audioqualität von Original und Synchronisation Seite an Seite

3. Quell-Audio nach Sprecher (TAR)

Was es ist: Ein komprimiertes Archiv mit einzelnen Audiodateien für jeden im Originalvideo erkannten Sprecher. Wenn Ihr Video 3 Sprecher hat, erhalten Sie 3 separate WAV-Dateien.

Wann man es verwendet:

  • Podcast-Editoren, die Lautstärke oder EQ pro Sprecher unabhängig anpassen müssen

  • Interviewvideos, bei denen ein Sprecher neu aufgenommen werden muss, während die anderen unverändert bleiben

  • Multi-Sprecher-QA — Prüfung, ob die Stimme jedes Sprechers korrekt geklont wurde

Warum das wichtig ist: Sprechergetrennte Audiospuren erfordern normalerweise spezielle Tools wie Descript oder Adobe Podcast. Perso AI enthält sie automatisch in jedem Synchronisationsprojekt. Einen tieferen Einblick finden Sie unter Wie man sprechergetrenntes Audio aus Video exportiert.

4. Export der übersetzten Audiospur (WAV)

Was es ist: Nur die synchronisierte Voiceover-Audiospur — kein Video, keine Hintergrundmusik. Nur die übersetzte Sprachspur.

Wann man es verwendet:

  • Podcast-Lokalisierung: Veröffentlichung einer reinen Audio-Version in einer anderen Sprache

  • Austausch der Audiospur in Ihrer eigenen Schnitt-Timeline (Premiere, Final Cut) für individuelle Postproduktion

  • Verteilung nur des Voiceovers für Radio, interne Schulungs-Audios oder Inhalte im Hörbuch-Stil

Profi-Tipp: Wenn Sie in Ihrem eigenen NLE neu schneiden, laden Sie die übersetzte Audiospur (ohne BGM) und den BGM-Export separat herunter. So haben Sie volle Kontrolle über das Mischungsverhältnis zwischen Stimme und Musik. Den vollständigen Workflow finden Sie unter Wie man synchronisiertes Audio ohne Video herunterlädt.

5. Übersetzte Audiospur mit BGM (WAV)

Was es ist: Das synchronisierte Voiceover, gemischt mit der originalen Hintergrundmusik — sofort nutzbar als vollständige Audiospur ohne Video.

Wann man es verwendet:

  • Audio-First-Vertrieb (Podcasts, interne Kommunikation, Audio-Newsletter), wenn Sie den vollständig produzierten Klang möchten

  • Schnelle Umsetzung: kein manuelles Mischen erforderlich, die BGM-Balance ist bereits eingestellt

  • Social-Media-Audioclips mit erhaltener Hintergrundmusik

6. BGM-Export (WAV)

Was es ist: Die isolierte Hintergrundmusik aus Ihrem Originalvideo — alle Gesangsspuren entfernt. Nur eine saubere Instrumentalspur.

Wann man es verwendet:

  • Neumischen der synchronisierten Audiospur mit einem individuellen Verhältnis von Stimme zu Musik in Ihrer DAW oder Ihrem Editor

  • Verwendung der originalen BGM in Werbeclips, Trailern oder Highlight-Reels

  • Überprüfung, ob die KI Musik und Sprache korrekt getrennt hat (QA-Schritt)

Warum das selten ist: Keine andere KI-Synchronisationsplattform exportiert BGM separat. Die Audiotrennungs-Engine von Perso AI isoliert während der Verarbeitung Gesang und Hintergrundmusik und stellt beides als separate Downloads bereit. Den vollständigen Leitfaden finden Sie unter Wie man Hintergrundmusik mit KI aus Video extrahiert.

7. Quelluntertitel (SRT)

Was es ist: Automatisch generierte Untertitel in der Originalsprache Ihres Videos, exportiert als standardmäßige SRT-Datei. Die Spracherkennung von Perso AI deckt 100 Sprachen für die Transkription ab.

Wann man es verwendet:

  • Hinzufügen von Untertiteln zum Originalvideo auf YouTube oder Vimeo

  • Barrierefreiheits-Compliance (ADA, WCAG) für Ihre bestehenden Inhalte

  • Einspielen der SRT in andere Übersetzungstools oder Workflows

  • SEO: Das Hochladen von SRT auf YouTube verbessert die Auffindbarkeit in der Originalsprache

Formatdetails: Standard-SRT mit Sequenznummern, Zeitstempeln (HH:MM:SS,mmm) und Untertiteltext. Kompatibel mit YouTube, Vimeo, Premiere Pro, Final Cut, DaVinci Resolve und allen wichtigen Videoplattformen. Den vollständigen SRT-Workflow finden Sie unter Wie man SRT-Untertitel automatisch aus jedem Video generiert.

8. Übersetzte Untertitel (SRT)

Was es ist: Untertitel in der Zielsprache, zeitlich so abgestimmt, dass sie zum Timing der synchronisierten Audiospur passen — nicht zum Timing der ursprünglichen Sprache.

Wann man es verwendet:

  • Zweisprachige Veröffentlichung: Laden Sie sowohl Quelluntertitel als auch übersetzte Untertitel als mehrere Untertitelspuren auf YouTube hoch

  • Barrierefreiheit im Zielmarkt

  • Workflows mit eingebrannten Untertiteln, bei denen Sie die Untertitel mit FFmpeg oder Ihrem Editor fest ins Video einbrennen

Wesentlicher Unterschied zu Wettbewerbern: Viele Tools zur Untertitelübersetzung erzeugen übersetzten Text, passen aber das Timing nicht an das Tempo der synchronisierten Audiospur an. Das übersetzte SRT von Perso AI ist auf das tatsächliche synchronisierte Voiceover abgestimmt, sodass die Untertitel im richtigen Moment erscheinen — nicht dann, wenn der ursprüngliche Sprecher gesprochen hat.

9. Quellskript (XLSX)

Was es ist: Die vollständige Transkription Ihres Originalvideos, exportiert als Tabellenkalkulation. Jede Zeile entspricht einem Segment, mit Spalten für Zeitstempel, Sprecherlabel und transkribierten Text.

Wann man es verwendet:

  • Content-Repurposing: Verwandeln Sie ein Videodrehbuch in Blogbeiträge, Social Captions oder E-Mail-Texte

  • Rechtliche/Compliance-Prüfung dessen, was im ursprünglichen Recording tatsächlich gesagt wurde

  • Durchsuchbares Archiv: XLSX ist leicht durchsuchbar, sortierbar und filterbar

10. Quell- & übersetztes Skript (XLSX)

Was es ist: Eine zweisprachige Tabellenkalkulation mit Originaltext und übersetztem Text nebeneinander. Jede Zeile zeigt dasselbe Segment in beiden Sprachen, mit Zeitstempeln und Sprecherlabels.

Wann man es verwendet:

  • Übersetzungs-QA: Prüfer können beide Versionen Zeile für Zeile vergleichen, ohne zwischen Dateien zu wechseln

  • Inhalte zum Sprachenlernen: Lehrkräfte verwenden zweisprachige Skripte als Lernmaterial

  • Übergabe an das Lokalisierungsteam: Projektmanager teilen das XLSX mit lokalen Prüfern, die keinen Zugang zu Perso AI haben

  • Compliance-Dokumentation: Regulierte Branchen (Medizin, Recht, Finanzen) bewahren zweisprachige Aufzeichnungen darüber auf, was gesagt wurde und wie es übersetzt wurde

Warum XLSX und nicht PDF? Tabellen sind bearbeitbar, sortierbar und filterbar. Wenn ein Prüfer in Zeile 47 ein Übersetzungsproblem meldet, kann der Editor direkt zu diesem Zeitstempel im Perso AI-Editor springen und die Zeile korrigieren. Anwendungsfälle und Workflows finden Sie unter Zweisprachiger Skript-Export: Nebeneinanderliegende Übersetzung für QA & Lernen.

So laden Sie Ihre Dateien herunter: 3 Schritte

Schritt 1. Schließen Sie Ihr Synchronisationsprojekt in Perso AI ab (Upload > Sprache auswählen > Verarbeiten).

Schritt 2. Klicken Sie auf der Ergebnisseite des Projekts auf die Schaltfläche Download. Ein Dropdown-Menü zeigt alle verfügbaren Dateitypen an.

Schritt 3. Wählen Sie die gewünschte Datei aus. Jede Datei wird einzeln heruntergeladen, sodass Sie genau das auswählen können, was Sie brauchen, ohne ein Sammelarchiv herunterzuladen.

Alle 10 Dateitypen sind ab dem Starter-Tarif ($6.99/Monat) verfügbar. Der Free-Tarif enthält keine Dateiexporte.

Welche Dateien exportieren Wettbewerber?

Dateityp

Perso AI

ElevenLabs

Descript

HeyGen

Synthesia

Rask AI

Synchronisiertes Video (MP4)

Ja

Ja

Ja

Ja

Ja

Ja

Quell-Audio (WAV)

Ja

Ja

Ja

Teilweise

Ja

Nein

Sprechergetrennte Audio

Ja (TAR)

Ja (ZIP)

Manueller Workaround

Nein

Nein

Nein

Nur übersetzte Audiospur

Ja

Ja

Indirekt

Teilweise

Nein

Teilweise

Übersetzte Audiospur + BGM

Ja

Ja

Nein

Nein

Nein

Nein

BGM-Export (isoliert)

Ja

Nein

Nein

Nein

Nein

Nein

Quelluntertitel (SRT)

Ja

Ja

Ja (SRT/VTT)

Ja (Pro+)

Ja (SRT/VTT)

Ja

Übersetzte Untertitel (SRT)

Ja

Ja

Ja (SRT/VTT)

Ja (SRT/VTT/ASS)

Ja (pro Sprache)

Ja

Quellskript

Ja (XLSX)

Ja (CSV/TXT)

Ja (TXT/DOCX/MD)

Ja (XLSX, Pro+)

XLIFF (Enterprise)

Ja (TXT/DOCX)

Zweisprachiges Skript

Ja (XLSX)

Ja (CSV)

Nein

Nein

Nein

Nein

Bestätigte Exporttypen

10

8-9

6-7

5-6

5-6

4-5

Wo Perso AI sich abhebt

ElevenLabs kommt mit 8-9 Exporttypen am nächsten, einschließlich sprechergetrennter WAV-Tracks und CSV-Zweisprachskripte. Aber drei Unterschiede bleiben:

1. BGM-Export gibt es nur bei Perso AI. Keine andere Plattform auf dieser Liste erlaubt es Ihnen, die isolierte Hintergrundmusik als separate WAV-Datei herunterzuladen. Für Creator, die die synchronisierte Audiospur in einem individuellen Verhältnis von Stimme zu Musik neu mischen müssen, ist dies die einzige Option, die kein separates Stem-Separation-Tool erfordert.

2. Jede Datei ab 6,99 $/Monat. ElevenLabs sperrt einige Exporte hinter höheren Tarifen. HeyGen verlangt Pro+ für SRT- und Skript-Downloads. Synthesia beschränkt den Skriptexport (XLIFF) auf Enterprise. Perso AI stellt alle 10 Dateien ab dem Starter-Tarif bereit.

XLSX statt CSV. ElevenLabs exportiert zweisprachige Skripte als CSV — nützlich für Entwickler, weniger intuitiv für Marketing-Teams, Übersetzer und Projektmanager. Perso AI exportiert als XLSX mit strukturierten Spalten, bereit zum Öffnen in Excel oder Google Sheets ohne Konvertierung.

Häufig gestellte Fragen

F. Sind alle 10 Download-Dateien im Starter-Tarif enthalten, oder erfordern einige eine höhere Stufe?

Alle 10 Dateitypen sind ab dem Starter-Tarif ($6.99/Monat) verfügbar. Es gibt keine Gebühr pro Datei und keine Zusatzkosten. Die einzige Funktion, die durch die Tarifstufe eingeschränkt ist, ist SRT Upload (Import benutzerdefinierter Untertitel vor der Synchronisation), der nur im Enterprise-Tarif verfügbar ist. Im Vergleich dazu beschränkt HeyGen SRT- und Skript-Exporte auf Pro+, und Synthesia begrenzt den Skriptexport auf Enterprise.

F. Kann ich Dateien aus einem Projekt herunterladen, das ich vor Wochen abgeschlossen habe?

Ja. Alle abgeschlossenen Projekte und ihre herunterladbaren Dateien bleiben in Ihrem Perso AI-Dashboard verfügbar. Sie können jederzeit zu jedem früheren Projekt zurückkehren und eine der 10 Dateitypen herunterladen.

F. Welche Audioqualität haben die WAV-Exporte?

Perso AI exportiert WAV-Dateien auf dem Qualitätsniveau der Quelle. WAV ist ein unkomprimiertes, verlustfreies Format, daher gibt es keinen Qualitätsverlust durch Komprimierung. Dadurch eignen sich die Exporte für professionelle Postproduktions-Workflows in DAWs und Video-Editoren.

Exportieren Sie mehr als nur ein Video

Ein Synchronisationsprojekt. Zehn Dateien. Video, Audio, Untertitel, Skripte — alles, was Sie brauchen, um Ihre Inhalte in jedes Format zu überführen, das Ihr Publikum nutzt.

Perso AI kostenlos testen Keine Kreditkarte erforderlich. 10 Exporttypen im Starter-Tarif. 33+ Synchronisationssprachen.

Interne Links:

Perso AI liefert 10 herunterladbare Dateien aus einem einzigen Synchronisationsprojekt — nicht nur das synchronisierte Video. Sie erhalten das synchronisierte MP4, Quell- und übersetzte Audiospuren (WAV), getrennte Sprecher-Audios (TAR), isolierte Hintergrundmusik (WAV), Quell- und übersetzte Untertitel (SRT) sowie zweisprachige Skripte (XLSX). Jede Datei ist ab dem Starter-Tarif für 6,99 $/Monat verfügbar. Dieser Leitfaden erklärt, was jede Datei ist, wann sie verwendet wird und wie man sie herunterlädt.

In Zahlen: Jede KI-Synchronisationsplattform exportiert das synchronisierte Video. Einige exportieren auch Untertitel und Audiospuren. Perso AI exportiert 10 Dateitypen aus jedem Synchronisationsprojekt — einschließlich isolierter Hintergrundmusik, zweisprachiger XLSX-Skripte und sprechergetrennter Audios — und das alles bereits ab dem Starter-Tarif für 6,99 $/Monat. Keine Enterprise-Sperre. Keine Zusatzgebühren.

Welche Dateien exportiert Perso AI nach der Synchronisation?

Hier ist die vollständige Liste der Dateien, die Sie nach jedem Perso AI-Synchronisationsprojekt herunterladen können:

#

Datei

Format

Was sie enthält

Verfügbar ab

1

Export des synchronisierten Videos

MP4

Vollständiges Video mit übersetztem Voiceover, Lippensynchronisation und originalen visuellen Inhalten

Starter ($6.99/Monat)

2

Export der Quell-Audiospur

WAV

Original-Audiospur aus Ihrem hochgeladenen Video extrahiert

Starter

3

Quell-Audio (nach Sprecher)

TAR

Einzelne Audiodateien, getrennt nach Sprecher, aus dem Original

Starter

4

Export der übersetzten Audiospur

WAV

Nur die synchronisierte Voiceover-Audiospur — kein Video, keine Hintergrundmusik

Starter

5

Übersetzte Audiospur (mit BGM)

WAV

Synchronisiertes Voiceover mit der originalen Hintergrundmusik gemischt

Starter

6

BGM-Export

WAV

Nur isolierte Hintergrundmusik — Gesang vollständig entfernt

Starter

7

Quelluntertitel

SRT

Automatisch generierte Untertitel in der Originalsprache

Starter

8

Übersetzte Untertitel

SRT

Untertitel in der Zielsprache, zeitlich auf das synchronisierte Audio abgestimmt

Starter

9

Quellskript

XLSX

Vollständige Transkription des Originalaudios im Tabellenformat

Starter

10

Quell- & übersetztes Skript

XLSX

Nebeneinander angeordnetes zweisprachiges Skript — Original- und übersetzter Text in parallelen Spalten

Starter

Perso AI generiert alle 10 Dateien automatisch. Keine Add-ons, keine zusätzlichen Credits, keine separaten Tools. Ein Synchronisationsprojekt, 10 Ausgaben.

Sehen Sie jede Datei, die Sie mit einer Synchronisation erhalten

1. Export des synchronisierten Videos (MP4)

Was es ist: Das fertige synchronisierte Video — Ihr Originalmaterial mit der übersetzten Sprachausgabe, die die Quell-Audiospur ersetzt. Voice Cloning bewahrt Tonfall, Tempo und Sprechrhythmus des ursprünglichen Sprechers. Die Lippensynchronisation wird automatisch angewendet.

Wann man es verwendet:

  • Veröffentlichung der synchronisierten Version direkt auf YouTube, TikTok oder Ihrem LMS

  • Einbettung auf Landingpages oder Produktseiten für verschiedene Märkte

  • Weitergabe an Stakeholder zur Prüfung vor der Auslieferung

Was es anders macht: Lippensynchronisation ist ein optionaler Schritt innerhalb des Synchronisations-Workflows von Perso AI — Nutzer entscheiden, wann ein Projekt sie benötigt, und das Ergebnis wird als einzelner MP4-Export geliefert. Die eigentliche Lücke liegt jedoch in der Qualität. Die meisten Wettbewerber, die Lippensynchronisation anbieten, erzeugen trotzdem sichtbare Abweichungen der Mundformen, Frame-Mismatches oder starre, mechanische Bewegungen, die das Vertrauen der Zuschauer untergraben. Die Lippensynchronisation von Perso AI ist so konstruiert, dass sie auch einer Nahprüfung standhält — präzise Mundformen, natürliche Übergänge, sendefähige Ausgabe.

2. Export der Quell-Audiospur (WAV)

Was es ist: Die ursprüngliche Audiospur aus Ihrem hochgeladenen Video, extrahiert als hochwertige WAV-Datei.

Wann man es verwendet:

  • Archivierung der sauberen Original-Audiospur vor der Synchronisation

  • Verwendung des ursprünglichen Voiceovers in einem anderen Schnittprojekt (Premiere Pro, DaVinci Resolve, Final Cut)

  • Vergleich der Audioqualität von Original und Synchronisation Seite an Seite

3. Quell-Audio nach Sprecher (TAR)

Was es ist: Ein komprimiertes Archiv mit einzelnen Audiodateien für jeden im Originalvideo erkannten Sprecher. Wenn Ihr Video 3 Sprecher hat, erhalten Sie 3 separate WAV-Dateien.

Wann man es verwendet:

  • Podcast-Editoren, die Lautstärke oder EQ pro Sprecher unabhängig anpassen müssen

  • Interviewvideos, bei denen ein Sprecher neu aufgenommen werden muss, während die anderen unverändert bleiben

  • Multi-Sprecher-QA — Prüfung, ob die Stimme jedes Sprechers korrekt geklont wurde

Warum das wichtig ist: Sprechergetrennte Audiospuren erfordern normalerweise spezielle Tools wie Descript oder Adobe Podcast. Perso AI enthält sie automatisch in jedem Synchronisationsprojekt. Einen tieferen Einblick finden Sie unter Wie man sprechergetrenntes Audio aus Video exportiert.

4. Export der übersetzten Audiospur (WAV)

Was es ist: Nur die synchronisierte Voiceover-Audiospur — kein Video, keine Hintergrundmusik. Nur die übersetzte Sprachspur.

Wann man es verwendet:

  • Podcast-Lokalisierung: Veröffentlichung einer reinen Audio-Version in einer anderen Sprache

  • Austausch der Audiospur in Ihrer eigenen Schnitt-Timeline (Premiere, Final Cut) für individuelle Postproduktion

  • Verteilung nur des Voiceovers für Radio, interne Schulungs-Audios oder Inhalte im Hörbuch-Stil

Profi-Tipp: Wenn Sie in Ihrem eigenen NLE neu schneiden, laden Sie die übersetzte Audiospur (ohne BGM) und den BGM-Export separat herunter. So haben Sie volle Kontrolle über das Mischungsverhältnis zwischen Stimme und Musik. Den vollständigen Workflow finden Sie unter Wie man synchronisiertes Audio ohne Video herunterlädt.

5. Übersetzte Audiospur mit BGM (WAV)

Was es ist: Das synchronisierte Voiceover, gemischt mit der originalen Hintergrundmusik — sofort nutzbar als vollständige Audiospur ohne Video.

Wann man es verwendet:

  • Audio-First-Vertrieb (Podcasts, interne Kommunikation, Audio-Newsletter), wenn Sie den vollständig produzierten Klang möchten

  • Schnelle Umsetzung: kein manuelles Mischen erforderlich, die BGM-Balance ist bereits eingestellt

  • Social-Media-Audioclips mit erhaltener Hintergrundmusik

6. BGM-Export (WAV)

Was es ist: Die isolierte Hintergrundmusik aus Ihrem Originalvideo — alle Gesangsspuren entfernt. Nur eine saubere Instrumentalspur.

Wann man es verwendet:

  • Neumischen der synchronisierten Audiospur mit einem individuellen Verhältnis von Stimme zu Musik in Ihrer DAW oder Ihrem Editor

  • Verwendung der originalen BGM in Werbeclips, Trailern oder Highlight-Reels

  • Überprüfung, ob die KI Musik und Sprache korrekt getrennt hat (QA-Schritt)

Warum das selten ist: Keine andere KI-Synchronisationsplattform exportiert BGM separat. Die Audiotrennungs-Engine von Perso AI isoliert während der Verarbeitung Gesang und Hintergrundmusik und stellt beides als separate Downloads bereit. Den vollständigen Leitfaden finden Sie unter Wie man Hintergrundmusik mit KI aus Video extrahiert.

7. Quelluntertitel (SRT)

Was es ist: Automatisch generierte Untertitel in der Originalsprache Ihres Videos, exportiert als standardmäßige SRT-Datei. Die Spracherkennung von Perso AI deckt 100 Sprachen für die Transkription ab.

Wann man es verwendet:

  • Hinzufügen von Untertiteln zum Originalvideo auf YouTube oder Vimeo

  • Barrierefreiheits-Compliance (ADA, WCAG) für Ihre bestehenden Inhalte

  • Einspielen der SRT in andere Übersetzungstools oder Workflows

  • SEO: Das Hochladen von SRT auf YouTube verbessert die Auffindbarkeit in der Originalsprache

Formatdetails: Standard-SRT mit Sequenznummern, Zeitstempeln (HH:MM:SS,mmm) und Untertiteltext. Kompatibel mit YouTube, Vimeo, Premiere Pro, Final Cut, DaVinci Resolve und allen wichtigen Videoplattformen. Den vollständigen SRT-Workflow finden Sie unter Wie man SRT-Untertitel automatisch aus jedem Video generiert.

8. Übersetzte Untertitel (SRT)

Was es ist: Untertitel in der Zielsprache, zeitlich so abgestimmt, dass sie zum Timing der synchronisierten Audiospur passen — nicht zum Timing der ursprünglichen Sprache.

Wann man es verwendet:

  • Zweisprachige Veröffentlichung: Laden Sie sowohl Quelluntertitel als auch übersetzte Untertitel als mehrere Untertitelspuren auf YouTube hoch

  • Barrierefreiheit im Zielmarkt

  • Workflows mit eingebrannten Untertiteln, bei denen Sie die Untertitel mit FFmpeg oder Ihrem Editor fest ins Video einbrennen

Wesentlicher Unterschied zu Wettbewerbern: Viele Tools zur Untertitelübersetzung erzeugen übersetzten Text, passen aber das Timing nicht an das Tempo der synchronisierten Audiospur an. Das übersetzte SRT von Perso AI ist auf das tatsächliche synchronisierte Voiceover abgestimmt, sodass die Untertitel im richtigen Moment erscheinen — nicht dann, wenn der ursprüngliche Sprecher gesprochen hat.

9. Quellskript (XLSX)

Was es ist: Die vollständige Transkription Ihres Originalvideos, exportiert als Tabellenkalkulation. Jede Zeile entspricht einem Segment, mit Spalten für Zeitstempel, Sprecherlabel und transkribierten Text.

Wann man es verwendet:

  • Content-Repurposing: Verwandeln Sie ein Videodrehbuch in Blogbeiträge, Social Captions oder E-Mail-Texte

  • Rechtliche/Compliance-Prüfung dessen, was im ursprünglichen Recording tatsächlich gesagt wurde

  • Durchsuchbares Archiv: XLSX ist leicht durchsuchbar, sortierbar und filterbar

10. Quell- & übersetztes Skript (XLSX)

Was es ist: Eine zweisprachige Tabellenkalkulation mit Originaltext und übersetztem Text nebeneinander. Jede Zeile zeigt dasselbe Segment in beiden Sprachen, mit Zeitstempeln und Sprecherlabels.

Wann man es verwendet:

  • Übersetzungs-QA: Prüfer können beide Versionen Zeile für Zeile vergleichen, ohne zwischen Dateien zu wechseln

  • Inhalte zum Sprachenlernen: Lehrkräfte verwenden zweisprachige Skripte als Lernmaterial

  • Übergabe an das Lokalisierungsteam: Projektmanager teilen das XLSX mit lokalen Prüfern, die keinen Zugang zu Perso AI haben

  • Compliance-Dokumentation: Regulierte Branchen (Medizin, Recht, Finanzen) bewahren zweisprachige Aufzeichnungen darüber auf, was gesagt wurde und wie es übersetzt wurde

Warum XLSX und nicht PDF? Tabellen sind bearbeitbar, sortierbar und filterbar. Wenn ein Prüfer in Zeile 47 ein Übersetzungsproblem meldet, kann der Editor direkt zu diesem Zeitstempel im Perso AI-Editor springen und die Zeile korrigieren. Anwendungsfälle und Workflows finden Sie unter Zweisprachiger Skript-Export: Nebeneinanderliegende Übersetzung für QA & Lernen.

So laden Sie Ihre Dateien herunter: 3 Schritte

Schritt 1. Schließen Sie Ihr Synchronisationsprojekt in Perso AI ab (Upload > Sprache auswählen > Verarbeiten).

Schritt 2. Klicken Sie auf der Ergebnisseite des Projekts auf die Schaltfläche Download. Ein Dropdown-Menü zeigt alle verfügbaren Dateitypen an.

Schritt 3. Wählen Sie die gewünschte Datei aus. Jede Datei wird einzeln heruntergeladen, sodass Sie genau das auswählen können, was Sie brauchen, ohne ein Sammelarchiv herunterzuladen.

Alle 10 Dateitypen sind ab dem Starter-Tarif ($6.99/Monat) verfügbar. Der Free-Tarif enthält keine Dateiexporte.

Welche Dateien exportieren Wettbewerber?

Dateityp

Perso AI

ElevenLabs

Descript

HeyGen

Synthesia

Rask AI

Synchronisiertes Video (MP4)

Ja

Ja

Ja

Ja

Ja

Ja

Quell-Audio (WAV)

Ja

Ja

Ja

Teilweise

Ja

Nein

Sprechergetrennte Audio

Ja (TAR)

Ja (ZIP)

Manueller Workaround

Nein

Nein

Nein

Nur übersetzte Audiospur

Ja

Ja

Indirekt

Teilweise

Nein

Teilweise

Übersetzte Audiospur + BGM

Ja

Ja

Nein

Nein

Nein

Nein

BGM-Export (isoliert)

Ja

Nein

Nein

Nein

Nein

Nein

Quelluntertitel (SRT)

Ja

Ja

Ja (SRT/VTT)

Ja (Pro+)

Ja (SRT/VTT)

Ja

Übersetzte Untertitel (SRT)

Ja

Ja

Ja (SRT/VTT)

Ja (SRT/VTT/ASS)

Ja (pro Sprache)

Ja

Quellskript

Ja (XLSX)

Ja (CSV/TXT)

Ja (TXT/DOCX/MD)

Ja (XLSX, Pro+)

XLIFF (Enterprise)

Ja (TXT/DOCX)

Zweisprachiges Skript

Ja (XLSX)

Ja (CSV)

Nein

Nein

Nein

Nein

Bestätigte Exporttypen

10

8-9

6-7

5-6

5-6

4-5

Wo Perso AI sich abhebt

ElevenLabs kommt mit 8-9 Exporttypen am nächsten, einschließlich sprechergetrennter WAV-Tracks und CSV-Zweisprachskripte. Aber drei Unterschiede bleiben:

1. BGM-Export gibt es nur bei Perso AI. Keine andere Plattform auf dieser Liste erlaubt es Ihnen, die isolierte Hintergrundmusik als separate WAV-Datei herunterzuladen. Für Creator, die die synchronisierte Audiospur in einem individuellen Verhältnis von Stimme zu Musik neu mischen müssen, ist dies die einzige Option, die kein separates Stem-Separation-Tool erfordert.

2. Jede Datei ab 6,99 $/Monat. ElevenLabs sperrt einige Exporte hinter höheren Tarifen. HeyGen verlangt Pro+ für SRT- und Skript-Downloads. Synthesia beschränkt den Skriptexport (XLIFF) auf Enterprise. Perso AI stellt alle 10 Dateien ab dem Starter-Tarif bereit.

XLSX statt CSV. ElevenLabs exportiert zweisprachige Skripte als CSV — nützlich für Entwickler, weniger intuitiv für Marketing-Teams, Übersetzer und Projektmanager. Perso AI exportiert als XLSX mit strukturierten Spalten, bereit zum Öffnen in Excel oder Google Sheets ohne Konvertierung.

Häufig gestellte Fragen

F. Sind alle 10 Download-Dateien im Starter-Tarif enthalten, oder erfordern einige eine höhere Stufe?

Alle 10 Dateitypen sind ab dem Starter-Tarif ($6.99/Monat) verfügbar. Es gibt keine Gebühr pro Datei und keine Zusatzkosten. Die einzige Funktion, die durch die Tarifstufe eingeschränkt ist, ist SRT Upload (Import benutzerdefinierter Untertitel vor der Synchronisation), der nur im Enterprise-Tarif verfügbar ist. Im Vergleich dazu beschränkt HeyGen SRT- und Skript-Exporte auf Pro+, und Synthesia begrenzt den Skriptexport auf Enterprise.

F. Kann ich Dateien aus einem Projekt herunterladen, das ich vor Wochen abgeschlossen habe?

Ja. Alle abgeschlossenen Projekte und ihre herunterladbaren Dateien bleiben in Ihrem Perso AI-Dashboard verfügbar. Sie können jederzeit zu jedem früheren Projekt zurückkehren und eine der 10 Dateitypen herunterladen.

F. Welche Audioqualität haben die WAV-Exporte?

Perso AI exportiert WAV-Dateien auf dem Qualitätsniveau der Quelle. WAV ist ein unkomprimiertes, verlustfreies Format, daher gibt es keinen Qualitätsverlust durch Komprimierung. Dadurch eignen sich die Exporte für professionelle Postproduktions-Workflows in DAWs und Video-Editoren.

Exportieren Sie mehr als nur ein Video

Ein Synchronisationsprojekt. Zehn Dateien. Video, Audio, Untertitel, Skripte — alles, was Sie brauchen, um Ihre Inhalte in jedes Format zu überführen, das Ihr Publikum nutzt.

Perso AI kostenlos testen Keine Kreditkarte erforderlich. 10 Exporttypen im Starter-Tarif. 33+ Synchronisationssprachen.

Interne Links:

Weiterlesen

Alle durchsuchen

Wie man spanische Videos mit KI ins Englische übersetzt — Perso AI-Leitfaden für LATAM-Creator, die den 2,3-Billionen-US-Hispanic-Markt und globale englischsprachige Zielgruppen erreichen
Produktleitfaden

Wie man spanische Videos mit KI ins Englische übersetzt

Growth Marketer Minjae Lee

Minjae Lee

Wachstumsmarketer

So übersetzen Sie englische Videos mit KI ins Russische — Perso AI-Leitfaden für Creator, die 258 Millionen russischsprachige Menschen und ein gamingaffines Publikum erreichen
Produktleitfaden

Wie man englische Videos mit KI ins Russische übersetzt

Growth Marketer Minjae Lee

Minjae Lee

Wachstumsmarketer

Download-Dateien für KI-Synchronisation
Produktleitfaden

So laden Sie Ihr KI-synchronisiertes Video herunter: Schritt-für-Schritt-Anleitung (MP4, MP3, SRT)

Leiter Wachstum & Produktinhaber Untae Bae

Untae Bae

Leiter Wachstum & Produktverantwortlicher