So laden Sie Ihr KI-synchronisiertes Video herunter: Schritt-für-Schritt-Anleitung (MP4, MP3, SRT)
Zuletzt aktualisiert
Jump to section
Jump to section
Teilen
Teilen
Teilen

AI Video-Übersetzer, Lokalisierung und Synchronisationswerkzeug
Probieren Sie es kostenlos aus
Perso AI liefert 10 herunterladbare Dateien aus einem einzigen Synchronisationsprojekt — nicht nur das synchronisierte Video. Sie erhalten das synchronisierte MP4, Quell- und übersetzte Audiospuren (WAV), getrennte Sprecher-Audios (TAR), isolierte Hintergrundmusik (WAV), Quell- und übersetzte Untertitel (SRT) sowie zweisprachige Skripte (XLSX). Jede Datei ist ab dem Starter-Tarif für 6,99 $/Monat verfügbar. Dieser Leitfaden erklärt, was jede Datei ist, wann sie verwendet wird und wie man sie herunterlädt.
In Zahlen: Jede KI-Synchronisationsplattform exportiert das synchronisierte Video. Einige exportieren auch Untertitel und Audiospuren. Perso AI exportiert 10 Dateitypen aus jedem Synchronisationsprojekt — einschließlich isolierter Hintergrundmusik, zweisprachiger XLSX-Skripte und sprechergetrennter Audios — und das alles bereits ab dem Starter-Tarif für 6,99 $/Monat. Keine Enterprise-Sperre. Keine Zusatzgebühren.
Welche Dateien exportiert Perso AI nach der Synchronisation?
Hier ist die vollständige Liste der Dateien, die Sie nach jedem Perso AI-Synchronisationsprojekt herunterladen können:
# | Datei | Format | Was sie enthält | Verfügbar ab |
|---|---|---|---|---|
1 | Export des synchronisierten Videos | MP4 | Vollständiges Video mit übersetztem Voiceover, Lippensynchronisation und originalen visuellen Inhalten | Starter ($6.99/Monat) |
2 | Export der Quell-Audiospur | WAV | Original-Audiospur aus Ihrem hochgeladenen Video extrahiert | Starter |
3 | Quell-Audio (nach Sprecher) | TAR | Einzelne Audiodateien, getrennt nach Sprecher, aus dem Original | Starter |
4 | Export der übersetzten Audiospur | WAV | Nur die synchronisierte Voiceover-Audiospur — kein Video, keine Hintergrundmusik | Starter |
5 | Übersetzte Audiospur (mit BGM) | WAV | Synchronisiertes Voiceover mit der originalen Hintergrundmusik gemischt | Starter |
6 | BGM-Export | WAV | Nur isolierte Hintergrundmusik — Gesang vollständig entfernt | Starter |
7 | Quelluntertitel | SRT | Automatisch generierte Untertitel in der Originalsprache | Starter |
8 | Übersetzte Untertitel | SRT | Untertitel in der Zielsprache, zeitlich auf das synchronisierte Audio abgestimmt | Starter |
9 | Quellskript | XLSX | Vollständige Transkription des Originalaudios im Tabellenformat | Starter |
10 | Quell- & übersetztes Skript | XLSX | Nebeneinander angeordnetes zweisprachiges Skript — Original- und übersetzter Text in parallelen Spalten | Starter |
Perso AI generiert alle 10 Dateien automatisch. Keine Add-ons, keine zusätzlichen Credits, keine separaten Tools. Ein Synchronisationsprojekt, 10 Ausgaben.
Sehen Sie jede Datei, die Sie mit einer Synchronisation erhalten
1. Export des synchronisierten Videos (MP4)
Was es ist: Das fertige synchronisierte Video — Ihr Originalmaterial mit der übersetzten Sprachausgabe, die die Quell-Audiospur ersetzt. Voice Cloning bewahrt Tonfall, Tempo und Sprechrhythmus des ursprünglichen Sprechers. Die Lippensynchronisation wird automatisch angewendet.
Wann man es verwendet:
Veröffentlichung der synchronisierten Version direkt auf YouTube, TikTok oder Ihrem LMS
Einbettung auf Landingpages oder Produktseiten für verschiedene Märkte
Weitergabe an Stakeholder zur Prüfung vor der Auslieferung
Was es anders macht: Lippensynchronisation ist ein optionaler Schritt innerhalb des Synchronisations-Workflows von Perso AI — Nutzer entscheiden, wann ein Projekt sie benötigt, und das Ergebnis wird als einzelner MP4-Export geliefert. Die eigentliche Lücke liegt jedoch in der Qualität. Die meisten Wettbewerber, die Lippensynchronisation anbieten, erzeugen trotzdem sichtbare Abweichungen der Mundformen, Frame-Mismatches oder starre, mechanische Bewegungen, die das Vertrauen der Zuschauer untergraben. Die Lippensynchronisation von Perso AI ist so konstruiert, dass sie auch einer Nahprüfung standhält — präzise Mundformen, natürliche Übergänge, sendefähige Ausgabe.
2. Export der Quell-Audiospur (WAV)
Was es ist: Die ursprüngliche Audiospur aus Ihrem hochgeladenen Video, extrahiert als hochwertige WAV-Datei.
Wann man es verwendet:
Archivierung der sauberen Original-Audiospur vor der Synchronisation
Verwendung des ursprünglichen Voiceovers in einem anderen Schnittprojekt (Premiere Pro, DaVinci Resolve, Final Cut)
Vergleich der Audioqualität von Original und Synchronisation Seite an Seite
3. Quell-Audio nach Sprecher (TAR)
Was es ist: Ein komprimiertes Archiv mit einzelnen Audiodateien für jeden im Originalvideo erkannten Sprecher. Wenn Ihr Video 3 Sprecher hat, erhalten Sie 3 separate WAV-Dateien.
Wann man es verwendet:
Podcast-Editoren, die Lautstärke oder EQ pro Sprecher unabhängig anpassen müssen
Interviewvideos, bei denen ein Sprecher neu aufgenommen werden muss, während die anderen unverändert bleiben
Multi-Sprecher-QA — Prüfung, ob die Stimme jedes Sprechers korrekt geklont wurde
Warum das wichtig ist: Sprechergetrennte Audiospuren erfordern normalerweise spezielle Tools wie Descript oder Adobe Podcast. Perso AI enthält sie automatisch in jedem Synchronisationsprojekt. Einen tieferen Einblick finden Sie unter Wie man sprechergetrenntes Audio aus Video exportiert.
4. Export der übersetzten Audiospur (WAV)
Was es ist: Nur die synchronisierte Voiceover-Audiospur — kein Video, keine Hintergrundmusik. Nur die übersetzte Sprachspur.
Wann man es verwendet:
Podcast-Lokalisierung: Veröffentlichung einer reinen Audio-Version in einer anderen Sprache
Austausch der Audiospur in Ihrer eigenen Schnitt-Timeline (Premiere, Final Cut) für individuelle Postproduktion
Verteilung nur des Voiceovers für Radio, interne Schulungs-Audios oder Inhalte im Hörbuch-Stil
Profi-Tipp: Wenn Sie in Ihrem eigenen NLE neu schneiden, laden Sie die übersetzte Audiospur (ohne BGM) und den BGM-Export separat herunter. So haben Sie volle Kontrolle über das Mischungsverhältnis zwischen Stimme und Musik. Den vollständigen Workflow finden Sie unter Wie man synchronisiertes Audio ohne Video herunterlädt.
5. Übersetzte Audiospur mit BGM (WAV)
Was es ist: Das synchronisierte Voiceover, gemischt mit der originalen Hintergrundmusik — sofort nutzbar als vollständige Audiospur ohne Video.
Wann man es verwendet:
Audio-First-Vertrieb (Podcasts, interne Kommunikation, Audio-Newsletter), wenn Sie den vollständig produzierten Klang möchten
Schnelle Umsetzung: kein manuelles Mischen erforderlich, die BGM-Balance ist bereits eingestellt
Social-Media-Audioclips mit erhaltener Hintergrundmusik
6. BGM-Export (WAV)
Was es ist: Die isolierte Hintergrundmusik aus Ihrem Originalvideo — alle Gesangsspuren entfernt. Nur eine saubere Instrumentalspur.
Wann man es verwendet:
Neumischen der synchronisierten Audiospur mit einem individuellen Verhältnis von Stimme zu Musik in Ihrer DAW oder Ihrem Editor
Verwendung der originalen BGM in Werbeclips, Trailern oder Highlight-Reels
Überprüfung, ob die KI Musik und Sprache korrekt getrennt hat (QA-Schritt)
Warum das selten ist: Keine andere KI-Synchronisationsplattform exportiert BGM separat. Die Audiotrennungs-Engine von Perso AI isoliert während der Verarbeitung Gesang und Hintergrundmusik und stellt beides als separate Downloads bereit. Den vollständigen Leitfaden finden Sie unter Wie man Hintergrundmusik mit KI aus Video extrahiert.
7. Quelluntertitel (SRT)
Was es ist: Automatisch generierte Untertitel in der Originalsprache Ihres Videos, exportiert als standardmäßige SRT-Datei. Die Spracherkennung von Perso AI deckt 100 Sprachen für die Transkription ab.
Wann man es verwendet:
Hinzufügen von Untertiteln zum Originalvideo auf YouTube oder Vimeo
Barrierefreiheits-Compliance (ADA, WCAG) für Ihre bestehenden Inhalte
Einspielen der SRT in andere Übersetzungstools oder Workflows
SEO: Das Hochladen von SRT auf YouTube verbessert die Auffindbarkeit in der Originalsprache
Formatdetails: Standard-SRT mit Sequenznummern, Zeitstempeln (HH:MM:SS,mmm) und Untertiteltext. Kompatibel mit YouTube, Vimeo, Premiere Pro, Final Cut, DaVinci Resolve und allen wichtigen Videoplattformen. Den vollständigen SRT-Workflow finden Sie unter Wie man SRT-Untertitel automatisch aus jedem Video generiert.
8. Übersetzte Untertitel (SRT)
Was es ist: Untertitel in der Zielsprache, zeitlich so abgestimmt, dass sie zum Timing der synchronisierten Audiospur passen — nicht zum Timing der ursprünglichen Sprache.
Wann man es verwendet:
Zweisprachige Veröffentlichung: Laden Sie sowohl Quelluntertitel als auch übersetzte Untertitel als mehrere Untertitelspuren auf YouTube hoch
Barrierefreiheit im Zielmarkt
Workflows mit eingebrannten Untertiteln, bei denen Sie die Untertitel mit FFmpeg oder Ihrem Editor fest ins Video einbrennen
Wesentlicher Unterschied zu Wettbewerbern: Viele Tools zur Untertitelübersetzung erzeugen übersetzten Text, passen aber das Timing nicht an das Tempo der synchronisierten Audiospur an. Das übersetzte SRT von Perso AI ist auf das tatsächliche synchronisierte Voiceover abgestimmt, sodass die Untertitel im richtigen Moment erscheinen — nicht dann, wenn der ursprüngliche Sprecher gesprochen hat.
9. Quellskript (XLSX)
Was es ist: Die vollständige Transkription Ihres Originalvideos, exportiert als Tabellenkalkulation. Jede Zeile entspricht einem Segment, mit Spalten für Zeitstempel, Sprecherlabel und transkribierten Text.
Wann man es verwendet:
Content-Repurposing: Verwandeln Sie ein Videodrehbuch in Blogbeiträge, Social Captions oder E-Mail-Texte
Rechtliche/Compliance-Prüfung dessen, was im ursprünglichen Recording tatsächlich gesagt wurde
Durchsuchbares Archiv: XLSX ist leicht durchsuchbar, sortierbar und filterbar
10. Quell- & übersetztes Skript (XLSX)
Was es ist: Eine zweisprachige Tabellenkalkulation mit Originaltext und übersetztem Text nebeneinander. Jede Zeile zeigt dasselbe Segment in beiden Sprachen, mit Zeitstempeln und Sprecherlabels.
Wann man es verwendet:
Übersetzungs-QA: Prüfer können beide Versionen Zeile für Zeile vergleichen, ohne zwischen Dateien zu wechseln
Inhalte zum Sprachenlernen: Lehrkräfte verwenden zweisprachige Skripte als Lernmaterial
Übergabe an das Lokalisierungsteam: Projektmanager teilen das XLSX mit lokalen Prüfern, die keinen Zugang zu Perso AI haben
Compliance-Dokumentation: Regulierte Branchen (Medizin, Recht, Finanzen) bewahren zweisprachige Aufzeichnungen darüber auf, was gesagt wurde und wie es übersetzt wurde
Warum XLSX und nicht PDF? Tabellen sind bearbeitbar, sortierbar und filterbar. Wenn ein Prüfer in Zeile 47 ein Übersetzungsproblem meldet, kann der Editor direkt zu diesem Zeitstempel im Perso AI-Editor springen und die Zeile korrigieren. Anwendungsfälle und Workflows finden Sie unter Zweisprachiger Skript-Export: Nebeneinanderliegende Übersetzung für QA & Lernen.
So laden Sie Ihre Dateien herunter: 3 Schritte
Schritt 1. Schließen Sie Ihr Synchronisationsprojekt in Perso AI ab (Upload > Sprache auswählen > Verarbeiten).
Schritt 2. Klicken Sie auf der Ergebnisseite des Projekts auf die Schaltfläche Download. Ein Dropdown-Menü zeigt alle verfügbaren Dateitypen an.
Schritt 3. Wählen Sie die gewünschte Datei aus. Jede Datei wird einzeln heruntergeladen, sodass Sie genau das auswählen können, was Sie brauchen, ohne ein Sammelarchiv herunterzuladen.
Alle 10 Dateitypen sind ab dem Starter-Tarif ($6.99/Monat) verfügbar. Der Free-Tarif enthält keine Dateiexporte.
Welche Dateien exportieren Wettbewerber?
Dateityp | Perso AI | ElevenLabs | Descript | HeyGen | Synthesia | Rask AI |
|---|---|---|---|---|---|---|
Synchronisiertes Video (MP4) | Ja | Ja | Ja | Ja | Ja | Ja |
Quell-Audio (WAV) | Ja | Ja | Ja | Teilweise | Ja | Nein |
Sprechergetrennte Audio | Ja (TAR) | Ja (ZIP) | Manueller Workaround | Nein | Nein | Nein |
Nur übersetzte Audiospur | Ja | Ja | Indirekt | Teilweise | Nein | Teilweise |
Übersetzte Audiospur + BGM | Ja | Ja | Nein | Nein | Nein | Nein |
BGM-Export (isoliert) | Ja | Nein | Nein | Nein | Nein | Nein |
Quelluntertitel (SRT) | Ja | Ja | Ja (SRT/VTT) | Ja (Pro+) | Ja (SRT/VTT) | Ja |
Übersetzte Untertitel (SRT) | Ja | Ja | Ja (SRT/VTT) | Ja (SRT/VTT/ASS) | Ja (pro Sprache) | Ja |
Quellskript | Ja (XLSX) | Ja (CSV/TXT) | Ja (TXT/DOCX/MD) | Ja (XLSX, Pro+) | XLIFF (Enterprise) | Ja (TXT/DOCX) |
Zweisprachiges Skript | Ja (XLSX) | Ja (CSV) | Nein | Nein | Nein | Nein |
Bestätigte Exporttypen | 10 | 8-9 | 6-7 | 5-6 | 5-6 | 4-5 |
Wo Perso AI sich abhebt
ElevenLabs kommt mit 8-9 Exporttypen am nächsten, einschließlich sprechergetrennter WAV-Tracks und CSV-Zweisprachskripte. Aber drei Unterschiede bleiben:
1. BGM-Export gibt es nur bei Perso AI. Keine andere Plattform auf dieser Liste erlaubt es Ihnen, die isolierte Hintergrundmusik als separate WAV-Datei herunterzuladen. Für Creator, die die synchronisierte Audiospur in einem individuellen Verhältnis von Stimme zu Musik neu mischen müssen, ist dies die einzige Option, die kein separates Stem-Separation-Tool erfordert.
2. Jede Datei ab 6,99 $/Monat. ElevenLabs sperrt einige Exporte hinter höheren Tarifen. HeyGen verlangt Pro+ für SRT- und Skript-Downloads. Synthesia beschränkt den Skriptexport (XLIFF) auf Enterprise. Perso AI stellt alle 10 Dateien ab dem Starter-Tarif bereit.
XLSX statt CSV. ElevenLabs exportiert zweisprachige Skripte als CSV — nützlich für Entwickler, weniger intuitiv für Marketing-Teams, Übersetzer und Projektmanager. Perso AI exportiert als XLSX mit strukturierten Spalten, bereit zum Öffnen in Excel oder Google Sheets ohne Konvertierung.
Häufig gestellte Fragen
F. Sind alle 10 Download-Dateien im Starter-Tarif enthalten, oder erfordern einige eine höhere Stufe?
Alle 10 Dateitypen sind ab dem Starter-Tarif ($6.99/Monat) verfügbar. Es gibt keine Gebühr pro Datei und keine Zusatzkosten. Die einzige Funktion, die durch die Tarifstufe eingeschränkt ist, ist SRT Upload (Import benutzerdefinierter Untertitel vor der Synchronisation), der nur im Enterprise-Tarif verfügbar ist. Im Vergleich dazu beschränkt HeyGen SRT- und Skript-Exporte auf Pro+, und Synthesia begrenzt den Skriptexport auf Enterprise.
F. Kann ich Dateien aus einem Projekt herunterladen, das ich vor Wochen abgeschlossen habe?
Ja. Alle abgeschlossenen Projekte und ihre herunterladbaren Dateien bleiben in Ihrem Perso AI-Dashboard verfügbar. Sie können jederzeit zu jedem früheren Projekt zurückkehren und eine der 10 Dateitypen herunterladen.
F. Welche Audioqualität haben die WAV-Exporte?
Perso AI exportiert WAV-Dateien auf dem Qualitätsniveau der Quelle. WAV ist ein unkomprimiertes, verlustfreies Format, daher gibt es keinen Qualitätsverlust durch Komprimierung. Dadurch eignen sich die Exporte für professionelle Postproduktions-Workflows in DAWs und Video-Editoren.
Exportieren Sie mehr als nur ein Video
Ein Synchronisationsprojekt. Zehn Dateien. Video, Audio, Untertitel, Skripte — alles, was Sie brauchen, um Ihre Inhalte in jedes Format zu überführen, das Ihr Publikum nutzt.
Perso AI kostenlos testen Keine Kreditkarte erforderlich. 10 Exporttypen im Starter-Tarif. 33+ Synchronisationssprachen.
Interne Links:
Perso AI liefert 10 herunterladbare Dateien aus einem einzigen Synchronisationsprojekt — nicht nur das synchronisierte Video. Sie erhalten das synchronisierte MP4, Quell- und übersetzte Audiospuren (WAV), getrennte Sprecher-Audios (TAR), isolierte Hintergrundmusik (WAV), Quell- und übersetzte Untertitel (SRT) sowie zweisprachige Skripte (XLSX). Jede Datei ist ab dem Starter-Tarif für 6,99 $/Monat verfügbar. Dieser Leitfaden erklärt, was jede Datei ist, wann sie verwendet wird und wie man sie herunterlädt.
In Zahlen: Jede KI-Synchronisationsplattform exportiert das synchronisierte Video. Einige exportieren auch Untertitel und Audiospuren. Perso AI exportiert 10 Dateitypen aus jedem Synchronisationsprojekt — einschließlich isolierter Hintergrundmusik, zweisprachiger XLSX-Skripte und sprechergetrennter Audios — und das alles bereits ab dem Starter-Tarif für 6,99 $/Monat. Keine Enterprise-Sperre. Keine Zusatzgebühren.
Welche Dateien exportiert Perso AI nach der Synchronisation?
Hier ist die vollständige Liste der Dateien, die Sie nach jedem Perso AI-Synchronisationsprojekt herunterladen können:
# | Datei | Format | Was sie enthält | Verfügbar ab |
|---|---|---|---|---|
1 | Export des synchronisierten Videos | MP4 | Vollständiges Video mit übersetztem Voiceover, Lippensynchronisation und originalen visuellen Inhalten | Starter ($6.99/Monat) |
2 | Export der Quell-Audiospur | WAV | Original-Audiospur aus Ihrem hochgeladenen Video extrahiert | Starter |
3 | Quell-Audio (nach Sprecher) | TAR | Einzelne Audiodateien, getrennt nach Sprecher, aus dem Original | Starter |
4 | Export der übersetzten Audiospur | WAV | Nur die synchronisierte Voiceover-Audiospur — kein Video, keine Hintergrundmusik | Starter |
5 | Übersetzte Audiospur (mit BGM) | WAV | Synchronisiertes Voiceover mit der originalen Hintergrundmusik gemischt | Starter |
6 | BGM-Export | WAV | Nur isolierte Hintergrundmusik — Gesang vollständig entfernt | Starter |
7 | Quelluntertitel | SRT | Automatisch generierte Untertitel in der Originalsprache | Starter |
8 | Übersetzte Untertitel | SRT | Untertitel in der Zielsprache, zeitlich auf das synchronisierte Audio abgestimmt | Starter |
9 | Quellskript | XLSX | Vollständige Transkription des Originalaudios im Tabellenformat | Starter |
10 | Quell- & übersetztes Skript | XLSX | Nebeneinander angeordnetes zweisprachiges Skript — Original- und übersetzter Text in parallelen Spalten | Starter |
Perso AI generiert alle 10 Dateien automatisch. Keine Add-ons, keine zusätzlichen Credits, keine separaten Tools. Ein Synchronisationsprojekt, 10 Ausgaben.
Sehen Sie jede Datei, die Sie mit einer Synchronisation erhalten
1. Export des synchronisierten Videos (MP4)
Was es ist: Das fertige synchronisierte Video — Ihr Originalmaterial mit der übersetzten Sprachausgabe, die die Quell-Audiospur ersetzt. Voice Cloning bewahrt Tonfall, Tempo und Sprechrhythmus des ursprünglichen Sprechers. Die Lippensynchronisation wird automatisch angewendet.
Wann man es verwendet:
Veröffentlichung der synchronisierten Version direkt auf YouTube, TikTok oder Ihrem LMS
Einbettung auf Landingpages oder Produktseiten für verschiedene Märkte
Weitergabe an Stakeholder zur Prüfung vor der Auslieferung
Was es anders macht: Lippensynchronisation ist ein optionaler Schritt innerhalb des Synchronisations-Workflows von Perso AI — Nutzer entscheiden, wann ein Projekt sie benötigt, und das Ergebnis wird als einzelner MP4-Export geliefert. Die eigentliche Lücke liegt jedoch in der Qualität. Die meisten Wettbewerber, die Lippensynchronisation anbieten, erzeugen trotzdem sichtbare Abweichungen der Mundformen, Frame-Mismatches oder starre, mechanische Bewegungen, die das Vertrauen der Zuschauer untergraben. Die Lippensynchronisation von Perso AI ist so konstruiert, dass sie auch einer Nahprüfung standhält — präzise Mundformen, natürliche Übergänge, sendefähige Ausgabe.
2. Export der Quell-Audiospur (WAV)
Was es ist: Die ursprüngliche Audiospur aus Ihrem hochgeladenen Video, extrahiert als hochwertige WAV-Datei.
Wann man es verwendet:
Archivierung der sauberen Original-Audiospur vor der Synchronisation
Verwendung des ursprünglichen Voiceovers in einem anderen Schnittprojekt (Premiere Pro, DaVinci Resolve, Final Cut)
Vergleich der Audioqualität von Original und Synchronisation Seite an Seite
3. Quell-Audio nach Sprecher (TAR)
Was es ist: Ein komprimiertes Archiv mit einzelnen Audiodateien für jeden im Originalvideo erkannten Sprecher. Wenn Ihr Video 3 Sprecher hat, erhalten Sie 3 separate WAV-Dateien.
Wann man es verwendet:
Podcast-Editoren, die Lautstärke oder EQ pro Sprecher unabhängig anpassen müssen
Interviewvideos, bei denen ein Sprecher neu aufgenommen werden muss, während die anderen unverändert bleiben
Multi-Sprecher-QA — Prüfung, ob die Stimme jedes Sprechers korrekt geklont wurde
Warum das wichtig ist: Sprechergetrennte Audiospuren erfordern normalerweise spezielle Tools wie Descript oder Adobe Podcast. Perso AI enthält sie automatisch in jedem Synchronisationsprojekt. Einen tieferen Einblick finden Sie unter Wie man sprechergetrenntes Audio aus Video exportiert.
4. Export der übersetzten Audiospur (WAV)
Was es ist: Nur die synchronisierte Voiceover-Audiospur — kein Video, keine Hintergrundmusik. Nur die übersetzte Sprachspur.
Wann man es verwendet:
Podcast-Lokalisierung: Veröffentlichung einer reinen Audio-Version in einer anderen Sprache
Austausch der Audiospur in Ihrer eigenen Schnitt-Timeline (Premiere, Final Cut) für individuelle Postproduktion
Verteilung nur des Voiceovers für Radio, interne Schulungs-Audios oder Inhalte im Hörbuch-Stil
Profi-Tipp: Wenn Sie in Ihrem eigenen NLE neu schneiden, laden Sie die übersetzte Audiospur (ohne BGM) und den BGM-Export separat herunter. So haben Sie volle Kontrolle über das Mischungsverhältnis zwischen Stimme und Musik. Den vollständigen Workflow finden Sie unter Wie man synchronisiertes Audio ohne Video herunterlädt.
5. Übersetzte Audiospur mit BGM (WAV)
Was es ist: Das synchronisierte Voiceover, gemischt mit der originalen Hintergrundmusik — sofort nutzbar als vollständige Audiospur ohne Video.
Wann man es verwendet:
Audio-First-Vertrieb (Podcasts, interne Kommunikation, Audio-Newsletter), wenn Sie den vollständig produzierten Klang möchten
Schnelle Umsetzung: kein manuelles Mischen erforderlich, die BGM-Balance ist bereits eingestellt
Social-Media-Audioclips mit erhaltener Hintergrundmusik
6. BGM-Export (WAV)
Was es ist: Die isolierte Hintergrundmusik aus Ihrem Originalvideo — alle Gesangsspuren entfernt. Nur eine saubere Instrumentalspur.
Wann man es verwendet:
Neumischen der synchronisierten Audiospur mit einem individuellen Verhältnis von Stimme zu Musik in Ihrer DAW oder Ihrem Editor
Verwendung der originalen BGM in Werbeclips, Trailern oder Highlight-Reels
Überprüfung, ob die KI Musik und Sprache korrekt getrennt hat (QA-Schritt)
Warum das selten ist: Keine andere KI-Synchronisationsplattform exportiert BGM separat. Die Audiotrennungs-Engine von Perso AI isoliert während der Verarbeitung Gesang und Hintergrundmusik und stellt beides als separate Downloads bereit. Den vollständigen Leitfaden finden Sie unter Wie man Hintergrundmusik mit KI aus Video extrahiert.
7. Quelluntertitel (SRT)
Was es ist: Automatisch generierte Untertitel in der Originalsprache Ihres Videos, exportiert als standardmäßige SRT-Datei. Die Spracherkennung von Perso AI deckt 100 Sprachen für die Transkription ab.
Wann man es verwendet:
Hinzufügen von Untertiteln zum Originalvideo auf YouTube oder Vimeo
Barrierefreiheits-Compliance (ADA, WCAG) für Ihre bestehenden Inhalte
Einspielen der SRT in andere Übersetzungstools oder Workflows
SEO: Das Hochladen von SRT auf YouTube verbessert die Auffindbarkeit in der Originalsprache
Formatdetails: Standard-SRT mit Sequenznummern, Zeitstempeln (HH:MM:SS,mmm) und Untertiteltext. Kompatibel mit YouTube, Vimeo, Premiere Pro, Final Cut, DaVinci Resolve und allen wichtigen Videoplattformen. Den vollständigen SRT-Workflow finden Sie unter Wie man SRT-Untertitel automatisch aus jedem Video generiert.
8. Übersetzte Untertitel (SRT)
Was es ist: Untertitel in der Zielsprache, zeitlich so abgestimmt, dass sie zum Timing der synchronisierten Audiospur passen — nicht zum Timing der ursprünglichen Sprache.
Wann man es verwendet:
Zweisprachige Veröffentlichung: Laden Sie sowohl Quelluntertitel als auch übersetzte Untertitel als mehrere Untertitelspuren auf YouTube hoch
Barrierefreiheit im Zielmarkt
Workflows mit eingebrannten Untertiteln, bei denen Sie die Untertitel mit FFmpeg oder Ihrem Editor fest ins Video einbrennen
Wesentlicher Unterschied zu Wettbewerbern: Viele Tools zur Untertitelübersetzung erzeugen übersetzten Text, passen aber das Timing nicht an das Tempo der synchronisierten Audiospur an. Das übersetzte SRT von Perso AI ist auf das tatsächliche synchronisierte Voiceover abgestimmt, sodass die Untertitel im richtigen Moment erscheinen — nicht dann, wenn der ursprüngliche Sprecher gesprochen hat.
9. Quellskript (XLSX)
Was es ist: Die vollständige Transkription Ihres Originalvideos, exportiert als Tabellenkalkulation. Jede Zeile entspricht einem Segment, mit Spalten für Zeitstempel, Sprecherlabel und transkribierten Text.
Wann man es verwendet:
Content-Repurposing: Verwandeln Sie ein Videodrehbuch in Blogbeiträge, Social Captions oder E-Mail-Texte
Rechtliche/Compliance-Prüfung dessen, was im ursprünglichen Recording tatsächlich gesagt wurde
Durchsuchbares Archiv: XLSX ist leicht durchsuchbar, sortierbar und filterbar
10. Quell- & übersetztes Skript (XLSX)
Was es ist: Eine zweisprachige Tabellenkalkulation mit Originaltext und übersetztem Text nebeneinander. Jede Zeile zeigt dasselbe Segment in beiden Sprachen, mit Zeitstempeln und Sprecherlabels.
Wann man es verwendet:
Übersetzungs-QA: Prüfer können beide Versionen Zeile für Zeile vergleichen, ohne zwischen Dateien zu wechseln
Inhalte zum Sprachenlernen: Lehrkräfte verwenden zweisprachige Skripte als Lernmaterial
Übergabe an das Lokalisierungsteam: Projektmanager teilen das XLSX mit lokalen Prüfern, die keinen Zugang zu Perso AI haben
Compliance-Dokumentation: Regulierte Branchen (Medizin, Recht, Finanzen) bewahren zweisprachige Aufzeichnungen darüber auf, was gesagt wurde und wie es übersetzt wurde
Warum XLSX und nicht PDF? Tabellen sind bearbeitbar, sortierbar und filterbar. Wenn ein Prüfer in Zeile 47 ein Übersetzungsproblem meldet, kann der Editor direkt zu diesem Zeitstempel im Perso AI-Editor springen und die Zeile korrigieren. Anwendungsfälle und Workflows finden Sie unter Zweisprachiger Skript-Export: Nebeneinanderliegende Übersetzung für QA & Lernen.
So laden Sie Ihre Dateien herunter: 3 Schritte
Schritt 1. Schließen Sie Ihr Synchronisationsprojekt in Perso AI ab (Upload > Sprache auswählen > Verarbeiten).
Schritt 2. Klicken Sie auf der Ergebnisseite des Projekts auf die Schaltfläche Download. Ein Dropdown-Menü zeigt alle verfügbaren Dateitypen an.
Schritt 3. Wählen Sie die gewünschte Datei aus. Jede Datei wird einzeln heruntergeladen, sodass Sie genau das auswählen können, was Sie brauchen, ohne ein Sammelarchiv herunterzuladen.
Alle 10 Dateitypen sind ab dem Starter-Tarif ($6.99/Monat) verfügbar. Der Free-Tarif enthält keine Dateiexporte.
Welche Dateien exportieren Wettbewerber?
Dateityp | Perso AI | ElevenLabs | Descript | HeyGen | Synthesia | Rask AI |
|---|---|---|---|---|---|---|
Synchronisiertes Video (MP4) | Ja | Ja | Ja | Ja | Ja | Ja |
Quell-Audio (WAV) | Ja | Ja | Ja | Teilweise | Ja | Nein |
Sprechergetrennte Audio | Ja (TAR) | Ja (ZIP) | Manueller Workaround | Nein | Nein | Nein |
Nur übersetzte Audiospur | Ja | Ja | Indirekt | Teilweise | Nein | Teilweise |
Übersetzte Audiospur + BGM | Ja | Ja | Nein | Nein | Nein | Nein |
BGM-Export (isoliert) | Ja | Nein | Nein | Nein | Nein | Nein |
Quelluntertitel (SRT) | Ja | Ja | Ja (SRT/VTT) | Ja (Pro+) | Ja (SRT/VTT) | Ja |
Übersetzte Untertitel (SRT) | Ja | Ja | Ja (SRT/VTT) | Ja (SRT/VTT/ASS) | Ja (pro Sprache) | Ja |
Quellskript | Ja (XLSX) | Ja (CSV/TXT) | Ja (TXT/DOCX/MD) | Ja (XLSX, Pro+) | XLIFF (Enterprise) | Ja (TXT/DOCX) |
Zweisprachiges Skript | Ja (XLSX) | Ja (CSV) | Nein | Nein | Nein | Nein |
Bestätigte Exporttypen | 10 | 8-9 | 6-7 | 5-6 | 5-6 | 4-5 |
Wo Perso AI sich abhebt
ElevenLabs kommt mit 8-9 Exporttypen am nächsten, einschließlich sprechergetrennter WAV-Tracks und CSV-Zweisprachskripte. Aber drei Unterschiede bleiben:
1. BGM-Export gibt es nur bei Perso AI. Keine andere Plattform auf dieser Liste erlaubt es Ihnen, die isolierte Hintergrundmusik als separate WAV-Datei herunterzuladen. Für Creator, die die synchronisierte Audiospur in einem individuellen Verhältnis von Stimme zu Musik neu mischen müssen, ist dies die einzige Option, die kein separates Stem-Separation-Tool erfordert.
2. Jede Datei ab 6,99 $/Monat. ElevenLabs sperrt einige Exporte hinter höheren Tarifen. HeyGen verlangt Pro+ für SRT- und Skript-Downloads. Synthesia beschränkt den Skriptexport (XLIFF) auf Enterprise. Perso AI stellt alle 10 Dateien ab dem Starter-Tarif bereit.
XLSX statt CSV. ElevenLabs exportiert zweisprachige Skripte als CSV — nützlich für Entwickler, weniger intuitiv für Marketing-Teams, Übersetzer und Projektmanager. Perso AI exportiert als XLSX mit strukturierten Spalten, bereit zum Öffnen in Excel oder Google Sheets ohne Konvertierung.
Häufig gestellte Fragen
F. Sind alle 10 Download-Dateien im Starter-Tarif enthalten, oder erfordern einige eine höhere Stufe?
Alle 10 Dateitypen sind ab dem Starter-Tarif ($6.99/Monat) verfügbar. Es gibt keine Gebühr pro Datei und keine Zusatzkosten. Die einzige Funktion, die durch die Tarifstufe eingeschränkt ist, ist SRT Upload (Import benutzerdefinierter Untertitel vor der Synchronisation), der nur im Enterprise-Tarif verfügbar ist. Im Vergleich dazu beschränkt HeyGen SRT- und Skript-Exporte auf Pro+, und Synthesia begrenzt den Skriptexport auf Enterprise.
F. Kann ich Dateien aus einem Projekt herunterladen, das ich vor Wochen abgeschlossen habe?
Ja. Alle abgeschlossenen Projekte und ihre herunterladbaren Dateien bleiben in Ihrem Perso AI-Dashboard verfügbar. Sie können jederzeit zu jedem früheren Projekt zurückkehren und eine der 10 Dateitypen herunterladen.
F. Welche Audioqualität haben die WAV-Exporte?
Perso AI exportiert WAV-Dateien auf dem Qualitätsniveau der Quelle. WAV ist ein unkomprimiertes, verlustfreies Format, daher gibt es keinen Qualitätsverlust durch Komprimierung. Dadurch eignen sich die Exporte für professionelle Postproduktions-Workflows in DAWs und Video-Editoren.
Exportieren Sie mehr als nur ein Video
Ein Synchronisationsprojekt. Zehn Dateien. Video, Audio, Untertitel, Skripte — alles, was Sie brauchen, um Ihre Inhalte in jedes Format zu überführen, das Ihr Publikum nutzt.
Perso AI kostenlos testen Keine Kreditkarte erforderlich. 10 Exporttypen im Starter-Tarif. 33+ Synchronisationssprachen.
Interne Links:
Weiterlesen
Alle durchsuchen
PRODUKT
ANWENDUNGSFALL
RESSOURCE
ESTsoft Inc. 15770 Laguna Canyon Rd #250, Irvine, CA 92618
PRODUKT
ANWENDUNGSFALL
RESSOURCE
ESTsoft Inc. 15770 Laguna Canyon Rd #250, Irvine, CA 92618
PRODUKT
ANWENDUNGSFALL
RESSOURCE
ESTsoft Inc. 15770 Laguna Canyon Rd #250, Irvine, CA 92618





