Alle Dateien, die Sie nach dem KI-Dubbing erhalten: Perso AI Download-Leitfaden
Zuletzt aktualisiert
Jump to section
Jump to section
Teilen
Teilen
Teilen

AI Video-Übersetzer, Lokalisierung und Synchronisationswerkzeug
Probieren Sie es kostenlos aus
Perso AI liefert 10 herunterladbare Dateien aus einem einzigen Dubbing-Projekt — nicht nur das synchronisierte Video. Sie erhalten das synchronisierte MP4, Quell- und übersetzte Audiospuren (WAV), getrenntes Sprecher-Audio (TAR), isolierte Hintergrundmusik (WAV), Quell- und übersetzte Untertitel (SRT) sowie bilinguale Skripte (XLSX). Jede Datei ist bereits im Starter-Plan für 6,99 $/Monat verfügbar. Diese Anleitung erklärt, was jede Datei ist, wann Sie sie verwenden und wie Sie sie herunterladen.
In Zahlen: Jede KI-Dubbing-Plattform exportiert das synchronisierte Video. Einige exportieren auch Untertitel und Audiospuren. Perso AI exportiert 10 Dateitypen aus jedem Dubbing-Projekt — einschließlich isolierter Hintergrundmusik, bilingualer XLSX-Skripte und sprechergetrennter Audio-Dateien — und das alles bereits im Starter-Plan für 6,99 $/Monat. Kein Enterprise-Zwang. Keine Zusatzgebühren.
Welche Dateien exportiert Perso AI nach dem Dubbing?
Hier ist die vollständige Liste der Dateien, die Sie nach jedem Perso AI Dubbing-Projekt herunterladen können:
# | Datei | Format | Enthält | Verfügbar ab |
|---|---|---|---|---|
1 | Synchronisierter Video-Export | MP4 | Vollständiges Video mit übersetztem Voiceover, Lippensynchronisation und ursprünglichen visuellen Inhalten | Starter (6,99 $/Monat) |
2 | Export der Quellaudio | WAV | Aus Ihrem hochgeladenen Video extrahierte Original-Audiospur | Starter |
3 | Quellaudio (nach Sprecher) | TAR | Einzelne Audiodateien, getrennt nach Sprecher aus dem Original | Starter |
4 | Export der übersetzten Audio | WAV | Nur das synchronisierte Voiceover-Audio — kein Video, keine Hintergrundmusik | Starter |
5 | Übersetzte Audio (mit BGM) | WAV | Synchronisiertes Voiceover mit der ursprünglichen Hintergrundmusik gemischt | Starter |
6 | BGM-Export | WAV | Nur isolierte Hintergrundmusik — Gesang vollständig entfernt | Starter |
7 | Quelluntertitel | SRT | Automatisch generierte Untertitel in der Originalsprache | Starter |
8 | Übersetzte Untertitel | SRT | Untertitel in der Zielsprache, zeitlich auf das synchronisierte Audio abgestimmt | Starter |
9 | Quellskript | XLSX | Vollständige Transkription des Originalaudios im Tabellenformat | Starter |
10 | Original- & übersetztes Skript | XLSX | Bilinguales Skript nebeneinander — Original- und übersetzter Text in parallelen Spalten | Starter |
Perso AI generiert alle 10 Dateien automatisch. Keine Add-ons, keine zusätzlichen Credits, keine separaten Tools. Ein Dubbing-Projekt, 10 Ausgaben.
Sehen Sie jede Datei, die Sie mit einem Dub erhalten
1. Synchronisierter Video-Export (MP4)
Was es ist: Das fertige synchronisierte Video — Ihr originales Material mit dem übersetzten Voiceover, das das Quellaudio ersetzt. Die Stimmklonung bewahrt Tonfall, Tempo und Sprechrhythmus des Originalsprechers. Die Lippensynchronisation wird automatisch angewendet.
Wann Sie es verwenden sollten:
Die synchronisierte Version direkt auf YouTube, TikTok oder Ihrem LMS veröffentlichen
Auf Landingpages oder Produktseiten für unterschiedliche Märkte einbetten
Mit Stakeholdern zum Review vor der Verteilung teilen
Was es besonders macht: Der MP4-Export von Perso AI enthält standardmäßig Lippensynchronisation. Die meisten Wettbewerber verlangen dafür einen separaten Schritt oder berechnen zusätzliche Gebühren für die Lippen-Sync-Verarbeitung.
2. Export der Quellaudio (WAV)
Was es ist: Die Original-Audiospur aus Ihrem hochgeladenen Video, extrahiert als hochwertige WAV-Datei.
Wann Sie es verwenden sollten:
Das saubere Originalaudio vor dem Dubbing archivieren
Das ursprüngliche Voiceover in einem anderen Schnittprojekt verwenden (Premiere Pro, DaVinci Resolve, Final Cut)
Original- und übersetzte Audioqualität nebeneinander vergleichen
3. Quellaudio nach Sprecher (TAR)
Was es ist: Ein komprimiertes Archiv mit einzelnen Audiodateien für jeden im Originalvideo erkannten Sprecher. Wenn Ihr Video 3 Sprecher hat, erhalten Sie 3 separate WAV-Dateien.
Wann Sie es verwenden sollten:
Podcast-Editoren, die die Lautstärke oder den EQ pro Sprecher unabhängig anpassen müssen
Interviewvideos, bei denen ein Sprecher neu aufgenommen werden muss, während die anderen unverändert bleiben
QA für mehrere Sprecher — prüfen, ob jede Sprecherstimme korrekt geklont wurde
Warum das wichtig ist: Sprechergetrenntes Audio erfordert normalerweise spezielle Tools wie Descript oder Adobe Podcast. Perso AI enthält es automatisch in jedem Dubbing-Projekt. Für einen tieferen Einblick siehe So exportieren Sie sprechergetrenntes Audio aus Video.
4. Export der übersetzten Audio (WAV)
Was es ist: Nur das synchronisierte Voiceover-Audio — kein Video, keine Hintergrundmusik. Nur die übersetzte Sprachspur.
Wann Sie es verwenden sollten:
Podcast-Lokalisierung: eine Audio-only-Version in einer anderen Sprache veröffentlichen
Audio in Ihrer eigenen Schnitt-Timeline ersetzen (Premiere, Final Cut) für individuelle Nachbearbeitung
Voiceover-only-Verteilung für Radio, interne Trainingsaudioinhalte oder Content im Hörbuch-Stil
Profi-Tipp: Wenn Sie in Ihrem eigenen NLE neu schneiden, laden Sie die übersetzte Audio (ohne BGM) und den BGM-Export separat herunter. So haben Sie volle Kontrolle über das Mischungsverhältnis zwischen Stimme und Musik. Den vollständigen Workflow finden Sie unter So laden Sie synchronisiertes Audio ohne Video herunter.
5. Übersetzte Audio mit BGM (WAV)
Was es ist: Das synchronisierte Voiceover, gemischt mit der ursprünglichen Hintergrundmusik — bereit als vollständige Audiospur ohne Video.
Wann Sie es verwenden sollten:
Audio-first-Veröffentlichung (Podcasts, interne Kommunikation, Audio-Newsletter), wenn Sie den vollständig „produzierten“ Klang möchten
Schnelle Umsetzung: kein manuelles Mischen nötig, die BGM-Balance ist bereits eingestellt
Social-Media-Audioclips mit erhaltener Hintergrundmusik
6. BGM-Export (WAV)
Was es ist: Die isolierte Hintergrundmusik aus Ihrem Originalvideo — alle Vocals entfernt. Nur die saubere Instrumentalspur.
Wann Sie es verwenden sollten:
Neuabmischen von synchronisiertem Audio in einem individuellen Sprach-zu-Musik-Verhältnis in Ihrem DAW oder Editor
Verwendung der ursprünglichen BGM in Promo-Clips, Trailern oder Highlight-Reels
Prüfen, ob die KI Musik und Sprache korrekt getrennt hat (QA-Schritt)
Warum das selten ist: Keine andere KI-Dubbing-Plattform exportiert BGM separat. Die Audio-Trennungs-Engine von Perso AI isoliert während der Verarbeitung Vocals und Hintergrundmusik und macht beides als separate Downloads verfügbar. Den vollständigen Leitfaden finden Sie unter So extrahieren Sie Hintergrundmusik aus Video mit KI.
7. Quelluntertitel (SRT)
Was es ist: Automatisch generierte Untertitel in der Originalsprache Ihres Videos, exportiert als standardmäßige SRT-Datei. Die Spracherkennung von Perso AI deckt 100 Sprachen für die Transkription ab.
Wann Sie es verwenden sollten:
Untertitel für das Originalvideo auf YouTube oder Vimeo hinzufügen
Barrierefreiheits-Compliance (ADA, WCAG) für Ihre bestehenden Inhalte
Das SRT in andere Übersetzungstools oder Workflows einspeisen
SEO: Das Hochladen von SRT auf YouTube verbessert die Auffindbarkeit in der Originalsprache
Formatdetails: Standard-SRT mit Sequenznummern, Zeitstempeln (HH:MM:SS,mmm) und Untertiteltext. Kompatibel mit YouTube, Vimeo, Premiere Pro, Final Cut, DaVinci Resolve und allen wichtigen Videoplattformen. Den vollständigen SRT-Workflow finden Sie unter So erstellen Sie automatisch SRT-Untertitel aus jedem Video.
8. Übersetzte Untertitel (SRT)
Was es ist: Untertitel in der Zielsprache, zeitlich so synchronisiert, dass sie zum Timing des synchronisierten Audios passen — nicht zum Timing der Originalsprache.
Wann Sie es verwenden sollten:
Zweisprachige Veröffentlichung: Source Subtitles und Translated Subtitles beide auf YouTube als mehrere Untertitelspuren hochladen
Barrierefreiheit im Zielmarkt
Workflows mit fest eingebrannten Untertiteln, bei denen Sie Untertitel mit FFmpeg oder Ihrem Editor direkt ins Video einbrennen
Wichtiger Unterschied zu Wettbewerbern: Viele Tools zur Untertitelübersetzung erzeugen übersetzten Text, passen das Timing jedoch nicht an das Tempo des synchronisierten Audios an. Das übersetzte SRT von Perso AI ist auf das tatsächliche synchronisierte Voiceover abgestimmt, sodass die Untertitel im richtigen Moment erscheinen — nicht dann, wenn der ursprüngliche Sprecher gesprochen hat.
9. Quellskript (XLSX)
Was es ist: Die vollständige Transkription Ihres Originalvideos, exportiert als Tabelle. Jede Zeile entspricht einem Segment, mit Spalten für Zeitstempel, Sprecher-Label und transkribierten Text.
Wann Sie es verwenden sollten:
Content-Repurposing: Verwandeln Sie ein Videoskript in Blogposts, Social Captions oder E-Mail-Text
Rechts-/Compliance-Prüfung dessen, was in der Originalaufnahme tatsächlich gesagt wurde
Durchsuchbares Archiv: XLSX ist leicht durchsuchbar, sortierbar und filterbar
10. Original- & übersetztes Skript (XLSX)
Was es ist: Eine bilinguale Tabelle mit Originaltext und übersetztem Text nebeneinander. Jede Zeile zeigt dasselbe Segment in beiden Sprachen, mit Zeitstempeln und Sprecher-Labels.
Wann Sie es verwenden sollten:
Übersetzungs-QA: Prüfer können beide Versionen Zeile für Zeile überblicken, ohne zwischen Dateien zu wechseln
Content zum Sprachenlernen: Lehrkräfte verwenden bilinguale Skripte als Lernmaterialien
Übergabe an das Lokalisierungsteam: Projektmanager teilen das XLSX mit lokalen Prüfern, die keinen Zugriff auf Perso AI haben
Compliance-Dokumentation: Regulierungsbranchen (Medizin, Recht, Finanzen) führen bilinguale Aufzeichnungen darüber, was gesagt und wie es übersetzt wurde
Warum XLSX und nicht PDF? Tabellen sind bearbeitbar, sortierbar und filterbar. Wenn ein Prüfer in Zeile 47 ein Übersetzungsproblem meldet, kann der Editor direkt zu diesem Zeitstempel im Perso-AI-Editor springen und die Zeile korrigieren. Anwendungsfälle und Workflows finden Sie unter Bilingualer Skript-Export: Nebeneinander-Übersetzung für QA & Lernen.
So laden Sie Ihre Dateien herunter: 3 Schritte
Schritt 1. Schließen Sie Ihr Dubbing-Projekt in Perso AI ab (Hochladen > Sprache auswählen > Verarbeiten).
Schritt 2. Klicken Sie auf der Ergebnisseite des Projekts auf die Schaltfläche Download. Ein Dropdown-Menü zeigt alle verfügbaren Dateitypen an.
Schritt 3. Wählen Sie die Datei aus, die Sie benötigen. Jede Datei wird einzeln heruntergeladen, sodass Sie genau das auswählen können, was Sie brauchen, ohne ein Sammelarchiv herunterzuladen.
Alle 10 Dateitypen sind ab dem Starter-Plan (6,99 $/Monat) verfügbar. Der Free-Plan enthält keine Dateiexporte.
Welche Dateien exportieren Wettbewerber?
Dateityp | Perso AI | ElevenLabs | Descript | HeyGen | Synthesia | Rask AI |
|---|---|---|---|---|---|---|
Synchronisiertes Video (MP4) | Ja | Ja | Ja | Ja | Ja | Ja |
Quellaudio (WAV) | Ja | Ja | Ja | Teilweise | Ja | Nein |
Sprechergetrenntes Audio | Ja (TAR) | Ja (ZIP) | Manueller Workaround | Nein | Nein | Nein |
Nur übersetzte Audio | Ja | Ja | Indirekt | Teilweise | Nein | Teilweise |
Übersetzte Audio + BGM | Ja | Ja | Nein | Nein | Nein | Nein |
BGM-Export (isoliert) | Ja | Nein | Nein | Nein | Nein | Nein |
Quelluntertitel (SRT) | Ja | Ja | Ja (SRT/VTT) | Ja (Pro+) | Ja (SRT/VTT) | Ja |
Übersetzte Untertitel (SRT) | Ja | Ja | Ja (SRT/VTT) | Ja (SRT/VTT/ASS) | Ja (pro Sprache) | Ja |
Quellskript | Ja (XLSX) | Ja (CSV/TXT) | Ja (TXT/DOCX/MD) | Ja (XLSX, Pro+) | XLIFF (Enterprise) | Ja (TXT/DOCX) |
Bilinguales Skript | Ja (XLSX) | Ja (CSV) | Nein | Nein | Nein | Nein |
Bestätigte Exporttypen | 10 | 8-9 | 6-7 | 5-6 | 5-6 | 4-5 |
Worin sich Perso AI abhebt
ElevenLabs kommt mit 8-9 Exporttypen am nächsten, einschließlich sprechergetrennter WAV-Tracks und bilingualer CSV-Skripte. Drei Unterschiede bleiben jedoch:
1. BGM-Export gibt es nur bei Perso AI. Keine andere Plattform auf dieser Liste erlaubt Ihnen, die isolierte Hintergrundmusik als separate WAV-Datei herunterzuladen. Für Creator, die synchronisiertes Audio in einem individuellen Sprach-zu-Musik-Verhältnis neu abmischen müssen, ist das die einzige Option, die kein separates Stem-Separation-Tool erfordert.
2. Jede Datei ab 6,99 $/Monat. ElevenLabs sperrt einige Exporte hinter höheren Tarifen. HeyGen verlangt Pro+ für SRT- und Skript-Downloads. Synthesia beschränkt den Skript-Export (XLIFF) auf Enterprise. Perso AI macht alle 10 Dateien ab dem Starter-Plan verfügbar.
3. XLSX statt CSV. ElevenLabs exportiert bilinguale Skripte als CSV — nützlich für Entwickler, aber weniger intuitiv für Marketing-Teams, Übersetzer und Projektmanager. Perso AI exportiert als XLSX mit strukturierten Spalten, bereit zum Öffnen in Excel oder Google Sheets ohne Konvertierung.
Häufig gestellte Fragen
F. Sind alle 10 Download-Dateien im Starter-Plan enthalten, oder benötigen manche eine höhere Stufe?
Alle 10 Dateitypen sind ab dem Starter-Plan (6,99 $/Monat) verfügbar. Es gibt keine Gebühr pro Datei und keine Zusatzkosten. Die einzige Funktion, die auf eine Planstufe beschränkt ist, ist der SRT-Upload (benutzerdefinierter Untertitel-Import vor der Synchronisation), der nur im Enterprise-Plan verfügbar ist. Zum Vergleich: HeyGen beschränkt SRT- und Skriptexporte auf Pro+, und Synthesia limitiert den Skript-Export auf Enterprise.
F. Kann ich Dateien aus einem Projekt herunterladen, das ich vor Wochen abgeschlossen habe?
Ja. Alle abgeschlossenen Projekte und ihre herunterladbaren Dateien bleiben in Ihrem Perso-AI-Dashboard verfügbar. Sie können zu jedem früheren Projekt zurückkehren und jederzeit einen der 10 Dateitypen herunterladen.
F. Welche Audioqualität haben die WAV-Exporte?
Perso AI exportiert WAV-Dateien in Quellqualität. WAV ist ein unkomprimiertes, verlustfreies Format, daher gibt es keinen Qualitätsverlust durch Komprimierung. Dadurch eignen sich die Exporte für professionelle Postproduktions-Workflows in DAWs und Videoeditoren.
Beginnen Sie, mehr als nur ein Video zu exportieren
Ein Dubbing-Projekt. Zehn Dateien. Video, Audio, Untertitel, Skripte — alles, was Sie benötigen, um Ihre Inhalte in jedem Format wiederzuverwenden, das Ihr Publikum nutzt.
Perso AI kostenlos testen Keine Kreditkarte erforderlich. 10 Exporttypen im Starter-Plan. Über 33 Synchronisationssprachen.
Interne Links:
Perso AI liefert 10 herunterladbare Dateien aus einem einzigen Dubbing-Projekt — nicht nur das synchronisierte Video. Sie erhalten das synchronisierte MP4, Quell- und übersetzte Audiospuren (WAV), getrenntes Sprecher-Audio (TAR), isolierte Hintergrundmusik (WAV), Quell- und übersetzte Untertitel (SRT) sowie bilinguale Skripte (XLSX). Jede Datei ist bereits im Starter-Plan für 6,99 $/Monat verfügbar. Diese Anleitung erklärt, was jede Datei ist, wann Sie sie verwenden und wie Sie sie herunterladen.
In Zahlen: Jede KI-Dubbing-Plattform exportiert das synchronisierte Video. Einige exportieren auch Untertitel und Audiospuren. Perso AI exportiert 10 Dateitypen aus jedem Dubbing-Projekt — einschließlich isolierter Hintergrundmusik, bilingualer XLSX-Skripte und sprechergetrennter Audio-Dateien — und das alles bereits im Starter-Plan für 6,99 $/Monat. Kein Enterprise-Zwang. Keine Zusatzgebühren.
Welche Dateien exportiert Perso AI nach dem Dubbing?
Hier ist die vollständige Liste der Dateien, die Sie nach jedem Perso AI Dubbing-Projekt herunterladen können:
# | Datei | Format | Enthält | Verfügbar ab |
|---|---|---|---|---|
1 | Synchronisierter Video-Export | MP4 | Vollständiges Video mit übersetztem Voiceover, Lippensynchronisation und ursprünglichen visuellen Inhalten | Starter (6,99 $/Monat) |
2 | Export der Quellaudio | WAV | Aus Ihrem hochgeladenen Video extrahierte Original-Audiospur | Starter |
3 | Quellaudio (nach Sprecher) | TAR | Einzelne Audiodateien, getrennt nach Sprecher aus dem Original | Starter |
4 | Export der übersetzten Audio | WAV | Nur das synchronisierte Voiceover-Audio — kein Video, keine Hintergrundmusik | Starter |
5 | Übersetzte Audio (mit BGM) | WAV | Synchronisiertes Voiceover mit der ursprünglichen Hintergrundmusik gemischt | Starter |
6 | BGM-Export | WAV | Nur isolierte Hintergrundmusik — Gesang vollständig entfernt | Starter |
7 | Quelluntertitel | SRT | Automatisch generierte Untertitel in der Originalsprache | Starter |
8 | Übersetzte Untertitel | SRT | Untertitel in der Zielsprache, zeitlich auf das synchronisierte Audio abgestimmt | Starter |
9 | Quellskript | XLSX | Vollständige Transkription des Originalaudios im Tabellenformat | Starter |
10 | Original- & übersetztes Skript | XLSX | Bilinguales Skript nebeneinander — Original- und übersetzter Text in parallelen Spalten | Starter |
Perso AI generiert alle 10 Dateien automatisch. Keine Add-ons, keine zusätzlichen Credits, keine separaten Tools. Ein Dubbing-Projekt, 10 Ausgaben.
Sehen Sie jede Datei, die Sie mit einem Dub erhalten
1. Synchronisierter Video-Export (MP4)
Was es ist: Das fertige synchronisierte Video — Ihr originales Material mit dem übersetzten Voiceover, das das Quellaudio ersetzt. Die Stimmklonung bewahrt Tonfall, Tempo und Sprechrhythmus des Originalsprechers. Die Lippensynchronisation wird automatisch angewendet.
Wann Sie es verwenden sollten:
Die synchronisierte Version direkt auf YouTube, TikTok oder Ihrem LMS veröffentlichen
Auf Landingpages oder Produktseiten für unterschiedliche Märkte einbetten
Mit Stakeholdern zum Review vor der Verteilung teilen
Was es besonders macht: Der MP4-Export von Perso AI enthält standardmäßig Lippensynchronisation. Die meisten Wettbewerber verlangen dafür einen separaten Schritt oder berechnen zusätzliche Gebühren für die Lippen-Sync-Verarbeitung.
2. Export der Quellaudio (WAV)
Was es ist: Die Original-Audiospur aus Ihrem hochgeladenen Video, extrahiert als hochwertige WAV-Datei.
Wann Sie es verwenden sollten:
Das saubere Originalaudio vor dem Dubbing archivieren
Das ursprüngliche Voiceover in einem anderen Schnittprojekt verwenden (Premiere Pro, DaVinci Resolve, Final Cut)
Original- und übersetzte Audioqualität nebeneinander vergleichen
3. Quellaudio nach Sprecher (TAR)
Was es ist: Ein komprimiertes Archiv mit einzelnen Audiodateien für jeden im Originalvideo erkannten Sprecher. Wenn Ihr Video 3 Sprecher hat, erhalten Sie 3 separate WAV-Dateien.
Wann Sie es verwenden sollten:
Podcast-Editoren, die die Lautstärke oder den EQ pro Sprecher unabhängig anpassen müssen
Interviewvideos, bei denen ein Sprecher neu aufgenommen werden muss, während die anderen unverändert bleiben
QA für mehrere Sprecher — prüfen, ob jede Sprecherstimme korrekt geklont wurde
Warum das wichtig ist: Sprechergetrenntes Audio erfordert normalerweise spezielle Tools wie Descript oder Adobe Podcast. Perso AI enthält es automatisch in jedem Dubbing-Projekt. Für einen tieferen Einblick siehe So exportieren Sie sprechergetrenntes Audio aus Video.
4. Export der übersetzten Audio (WAV)
Was es ist: Nur das synchronisierte Voiceover-Audio — kein Video, keine Hintergrundmusik. Nur die übersetzte Sprachspur.
Wann Sie es verwenden sollten:
Podcast-Lokalisierung: eine Audio-only-Version in einer anderen Sprache veröffentlichen
Audio in Ihrer eigenen Schnitt-Timeline ersetzen (Premiere, Final Cut) für individuelle Nachbearbeitung
Voiceover-only-Verteilung für Radio, interne Trainingsaudioinhalte oder Content im Hörbuch-Stil
Profi-Tipp: Wenn Sie in Ihrem eigenen NLE neu schneiden, laden Sie die übersetzte Audio (ohne BGM) und den BGM-Export separat herunter. So haben Sie volle Kontrolle über das Mischungsverhältnis zwischen Stimme und Musik. Den vollständigen Workflow finden Sie unter So laden Sie synchronisiertes Audio ohne Video herunter.
5. Übersetzte Audio mit BGM (WAV)
Was es ist: Das synchronisierte Voiceover, gemischt mit der ursprünglichen Hintergrundmusik — bereit als vollständige Audiospur ohne Video.
Wann Sie es verwenden sollten:
Audio-first-Veröffentlichung (Podcasts, interne Kommunikation, Audio-Newsletter), wenn Sie den vollständig „produzierten“ Klang möchten
Schnelle Umsetzung: kein manuelles Mischen nötig, die BGM-Balance ist bereits eingestellt
Social-Media-Audioclips mit erhaltener Hintergrundmusik
6. BGM-Export (WAV)
Was es ist: Die isolierte Hintergrundmusik aus Ihrem Originalvideo — alle Vocals entfernt. Nur die saubere Instrumentalspur.
Wann Sie es verwenden sollten:
Neuabmischen von synchronisiertem Audio in einem individuellen Sprach-zu-Musik-Verhältnis in Ihrem DAW oder Editor
Verwendung der ursprünglichen BGM in Promo-Clips, Trailern oder Highlight-Reels
Prüfen, ob die KI Musik und Sprache korrekt getrennt hat (QA-Schritt)
Warum das selten ist: Keine andere KI-Dubbing-Plattform exportiert BGM separat. Die Audio-Trennungs-Engine von Perso AI isoliert während der Verarbeitung Vocals und Hintergrundmusik und macht beides als separate Downloads verfügbar. Den vollständigen Leitfaden finden Sie unter So extrahieren Sie Hintergrundmusik aus Video mit KI.
7. Quelluntertitel (SRT)
Was es ist: Automatisch generierte Untertitel in der Originalsprache Ihres Videos, exportiert als standardmäßige SRT-Datei. Die Spracherkennung von Perso AI deckt 100 Sprachen für die Transkription ab.
Wann Sie es verwenden sollten:
Untertitel für das Originalvideo auf YouTube oder Vimeo hinzufügen
Barrierefreiheits-Compliance (ADA, WCAG) für Ihre bestehenden Inhalte
Das SRT in andere Übersetzungstools oder Workflows einspeisen
SEO: Das Hochladen von SRT auf YouTube verbessert die Auffindbarkeit in der Originalsprache
Formatdetails: Standard-SRT mit Sequenznummern, Zeitstempeln (HH:MM:SS,mmm) und Untertiteltext. Kompatibel mit YouTube, Vimeo, Premiere Pro, Final Cut, DaVinci Resolve und allen wichtigen Videoplattformen. Den vollständigen SRT-Workflow finden Sie unter So erstellen Sie automatisch SRT-Untertitel aus jedem Video.
8. Übersetzte Untertitel (SRT)
Was es ist: Untertitel in der Zielsprache, zeitlich so synchronisiert, dass sie zum Timing des synchronisierten Audios passen — nicht zum Timing der Originalsprache.
Wann Sie es verwenden sollten:
Zweisprachige Veröffentlichung: Source Subtitles und Translated Subtitles beide auf YouTube als mehrere Untertitelspuren hochladen
Barrierefreiheit im Zielmarkt
Workflows mit fest eingebrannten Untertiteln, bei denen Sie Untertitel mit FFmpeg oder Ihrem Editor direkt ins Video einbrennen
Wichtiger Unterschied zu Wettbewerbern: Viele Tools zur Untertitelübersetzung erzeugen übersetzten Text, passen das Timing jedoch nicht an das Tempo des synchronisierten Audios an. Das übersetzte SRT von Perso AI ist auf das tatsächliche synchronisierte Voiceover abgestimmt, sodass die Untertitel im richtigen Moment erscheinen — nicht dann, wenn der ursprüngliche Sprecher gesprochen hat.
9. Quellskript (XLSX)
Was es ist: Die vollständige Transkription Ihres Originalvideos, exportiert als Tabelle. Jede Zeile entspricht einem Segment, mit Spalten für Zeitstempel, Sprecher-Label und transkribierten Text.
Wann Sie es verwenden sollten:
Content-Repurposing: Verwandeln Sie ein Videoskript in Blogposts, Social Captions oder E-Mail-Text
Rechts-/Compliance-Prüfung dessen, was in der Originalaufnahme tatsächlich gesagt wurde
Durchsuchbares Archiv: XLSX ist leicht durchsuchbar, sortierbar und filterbar
10. Original- & übersetztes Skript (XLSX)
Was es ist: Eine bilinguale Tabelle mit Originaltext und übersetztem Text nebeneinander. Jede Zeile zeigt dasselbe Segment in beiden Sprachen, mit Zeitstempeln und Sprecher-Labels.
Wann Sie es verwenden sollten:
Übersetzungs-QA: Prüfer können beide Versionen Zeile für Zeile überblicken, ohne zwischen Dateien zu wechseln
Content zum Sprachenlernen: Lehrkräfte verwenden bilinguale Skripte als Lernmaterialien
Übergabe an das Lokalisierungsteam: Projektmanager teilen das XLSX mit lokalen Prüfern, die keinen Zugriff auf Perso AI haben
Compliance-Dokumentation: Regulierungsbranchen (Medizin, Recht, Finanzen) führen bilinguale Aufzeichnungen darüber, was gesagt und wie es übersetzt wurde
Warum XLSX und nicht PDF? Tabellen sind bearbeitbar, sortierbar und filterbar. Wenn ein Prüfer in Zeile 47 ein Übersetzungsproblem meldet, kann der Editor direkt zu diesem Zeitstempel im Perso-AI-Editor springen und die Zeile korrigieren. Anwendungsfälle und Workflows finden Sie unter Bilingualer Skript-Export: Nebeneinander-Übersetzung für QA & Lernen.
So laden Sie Ihre Dateien herunter: 3 Schritte
Schritt 1. Schließen Sie Ihr Dubbing-Projekt in Perso AI ab (Hochladen > Sprache auswählen > Verarbeiten).
Schritt 2. Klicken Sie auf der Ergebnisseite des Projekts auf die Schaltfläche Download. Ein Dropdown-Menü zeigt alle verfügbaren Dateitypen an.
Schritt 3. Wählen Sie die Datei aus, die Sie benötigen. Jede Datei wird einzeln heruntergeladen, sodass Sie genau das auswählen können, was Sie brauchen, ohne ein Sammelarchiv herunterzuladen.
Alle 10 Dateitypen sind ab dem Starter-Plan (6,99 $/Monat) verfügbar. Der Free-Plan enthält keine Dateiexporte.
Welche Dateien exportieren Wettbewerber?
Dateityp | Perso AI | ElevenLabs | Descript | HeyGen | Synthesia | Rask AI |
|---|---|---|---|---|---|---|
Synchronisiertes Video (MP4) | Ja | Ja | Ja | Ja | Ja | Ja |
Quellaudio (WAV) | Ja | Ja | Ja | Teilweise | Ja | Nein |
Sprechergetrenntes Audio | Ja (TAR) | Ja (ZIP) | Manueller Workaround | Nein | Nein | Nein |
Nur übersetzte Audio | Ja | Ja | Indirekt | Teilweise | Nein | Teilweise |
Übersetzte Audio + BGM | Ja | Ja | Nein | Nein | Nein | Nein |
BGM-Export (isoliert) | Ja | Nein | Nein | Nein | Nein | Nein |
Quelluntertitel (SRT) | Ja | Ja | Ja (SRT/VTT) | Ja (Pro+) | Ja (SRT/VTT) | Ja |
Übersetzte Untertitel (SRT) | Ja | Ja | Ja (SRT/VTT) | Ja (SRT/VTT/ASS) | Ja (pro Sprache) | Ja |
Quellskript | Ja (XLSX) | Ja (CSV/TXT) | Ja (TXT/DOCX/MD) | Ja (XLSX, Pro+) | XLIFF (Enterprise) | Ja (TXT/DOCX) |
Bilinguales Skript | Ja (XLSX) | Ja (CSV) | Nein | Nein | Nein | Nein |
Bestätigte Exporttypen | 10 | 8-9 | 6-7 | 5-6 | 5-6 | 4-5 |
Worin sich Perso AI abhebt
ElevenLabs kommt mit 8-9 Exporttypen am nächsten, einschließlich sprechergetrennter WAV-Tracks und bilingualer CSV-Skripte. Drei Unterschiede bleiben jedoch:
1. BGM-Export gibt es nur bei Perso AI. Keine andere Plattform auf dieser Liste erlaubt Ihnen, die isolierte Hintergrundmusik als separate WAV-Datei herunterzuladen. Für Creator, die synchronisiertes Audio in einem individuellen Sprach-zu-Musik-Verhältnis neu abmischen müssen, ist das die einzige Option, die kein separates Stem-Separation-Tool erfordert.
2. Jede Datei ab 6,99 $/Monat. ElevenLabs sperrt einige Exporte hinter höheren Tarifen. HeyGen verlangt Pro+ für SRT- und Skript-Downloads. Synthesia beschränkt den Skript-Export (XLIFF) auf Enterprise. Perso AI macht alle 10 Dateien ab dem Starter-Plan verfügbar.
3. XLSX statt CSV. ElevenLabs exportiert bilinguale Skripte als CSV — nützlich für Entwickler, aber weniger intuitiv für Marketing-Teams, Übersetzer und Projektmanager. Perso AI exportiert als XLSX mit strukturierten Spalten, bereit zum Öffnen in Excel oder Google Sheets ohne Konvertierung.
Häufig gestellte Fragen
F. Sind alle 10 Download-Dateien im Starter-Plan enthalten, oder benötigen manche eine höhere Stufe?
Alle 10 Dateitypen sind ab dem Starter-Plan (6,99 $/Monat) verfügbar. Es gibt keine Gebühr pro Datei und keine Zusatzkosten. Die einzige Funktion, die auf eine Planstufe beschränkt ist, ist der SRT-Upload (benutzerdefinierter Untertitel-Import vor der Synchronisation), der nur im Enterprise-Plan verfügbar ist. Zum Vergleich: HeyGen beschränkt SRT- und Skriptexporte auf Pro+, und Synthesia limitiert den Skript-Export auf Enterprise.
F. Kann ich Dateien aus einem Projekt herunterladen, das ich vor Wochen abgeschlossen habe?
Ja. Alle abgeschlossenen Projekte und ihre herunterladbaren Dateien bleiben in Ihrem Perso-AI-Dashboard verfügbar. Sie können zu jedem früheren Projekt zurückkehren und jederzeit einen der 10 Dateitypen herunterladen.
F. Welche Audioqualität haben die WAV-Exporte?
Perso AI exportiert WAV-Dateien in Quellqualität. WAV ist ein unkomprimiertes, verlustfreies Format, daher gibt es keinen Qualitätsverlust durch Komprimierung. Dadurch eignen sich die Exporte für professionelle Postproduktions-Workflows in DAWs und Videoeditoren.
Beginnen Sie, mehr als nur ein Video zu exportieren
Ein Dubbing-Projekt. Zehn Dateien. Video, Audio, Untertitel, Skripte — alles, was Sie benötigen, um Ihre Inhalte in jedem Format wiederzuverwenden, das Ihr Publikum nutzt.
Perso AI kostenlos testen Keine Kreditkarte erforderlich. 10 Exporttypen im Starter-Plan. Über 33 Synchronisationssprachen.
Interne Links:
Weiterlesen
Alle durchsuchen
PRODUKT
ANWENDUNGSFALL
RESSOURCE
ESTsoft Inc. 15770 Laguna Canyon Rd #250, Irvine, CA 92618
PRODUKT
ANWENDUNGSFALL
RESSOURCE
ESTsoft Inc. 15770 Laguna Canyon Rd #250, Irvine, CA 92618
PRODUKT
ANWENDUNGSFALL
RESSOURCE
ESTsoft Inc. 15770 Laguna Canyon Rd #250, Irvine, CA 92618





