KI-Audio-Trennung
Stimmen, Sprecher & Hintergrundmusik trennen

Perso Dubbing ist ein KI-gestützter Stimmenentferner und Audiosplitter, der jede Audio- oder Videodatei in einzelne Spuren aufteilt – und dabei Gesang, einzelne Sprecherstimmen, Hintergrundmusik und Umgebungsgeräusche mit Studio-Präzision isoliert. Laden Sie eine Datei hoch, hören Sie sich jede getrennte Spur in der Vorschau an, wählen Sie die gewünschte Kombination aus und exportieren Sie alles als eine einzige, zusammengefügte Datei. Bearbeiten Sie die Namen der Sprecher, weisen Sie falsch zugeordnete Segmente neu zu und exportieren Sie das Ergebnis erneut mit den übernommenen Änderungen – alles auf einer einzigen Seite. Eine automatische Transkription in über 100 Sprachen ist bei jeder Trennung inbegriffen.

Keine Installation erforderlich · Kostenloser Plan verfügbar · In Sekunden starten

Beliebt bei Nutzern weltweit

Das beste Werkzeug zur Audiotrennung
Das beste Werkzeug zur Audiotrennung
Das beste Werkzeug zur Audiotrennung

Kernfunktionen

Kernfunktionen

Trennung + Transkription in einer Ansicht

Trennung + Transkription in einer Ansicht

Laden Sie beliebige Audio- oder Videodateien hoch — trennen Sie Stimmen, entfernen Sie urheberrechtlich geschützte Hintergrundmusik und exportieren Sie saubere Spuren in Sekunden.

Laden Sie beliebige Audio- oder Videodateien hoch — trennen Sie Stimmen, entfernen Sie urheberrechtlich geschützte Hintergrundmusik und exportieren Sie saubere Spuren in Sekunden.

✨ Nur in Perso Dubbing

Dualer Hintergrundmodus

Background Music extrahiert reines BGM. Background with Reaction behält Gelächter und Umgebungsgeräusche bei. Kein anderes Tool bietet das.

Automatische Transkription in über 100 Sprachen

Jede Trennung beinhaltet eine automatische Sprache-zu-Text-Transkription, die neben Ihren getrennten Spuren mit Sprecherbezeichnungen angezeigt wird. Keine zusätzlichen Tools oder Schritte erforderlich. Unterstützt über 100 Sprachen mit automatischer Spracherkennung.

KI-Vokalentferner & Stem-Trenner

Perso Dubbing ist die einzige Plattform, die mithilfe von KI Gesang, Hintergrundmusik und einzelne Sprecherstimmen aus einer einzigen Audio- oder Videodatei trennt – und so Creatorn, Cuttern und Produzenten eine Stem-Trennung in Studioqualität bietet.

Sprecherverwaltung & Bearbeitung

Benennen Sie Sprechernamen nach der KI-Trennung um, fügen Sie sie hinzu oder löschen Sie sie. Weisen Sie falsch zugeordnete Segmente zwischen erkannten Sprechern neu zu. Wählen Sie, ob Sie ein einzelnes Segment oder alle übereinstimmenden Bezeichnungen auf einmal aktualisieren möchten. Exportieren Sie Audiospuren und Transkriptionsdateien mit Ihren angewendeten Änderungen – keine erneute Verarbeitung erforderlich.

Jede getrennte Spur vor dem Export in der Vorschau anzeigen

Hören Sie sich jede isolierte Spur vor dem Download an – prüfen Sie Gesang, einzelne Sprecher, reine Hintergrundmusik und Hintergrundmusik mit Reaktionen jeweils separat. Hören Sie genau, was Sie vor dem Export erhalten.

Funktioniert mit Audio- und Videodateien

Laden Sie MP3-, WAV-, MP4-, MOV- oder WebM-Dateien hoch. Exportieren Sie getrennte Tonspuren mit eingebetteten Untertiteln oder laden Sie separate SRT-Dateien herunter. Perso Dubbing verarbeitet sowohl reine Audiodateien als auch Videodateien in einem einzigen Workflow.

✨ Nur in Perso AI

Dualer Hintergrundmodus

Background Music extrahiert reines BGM. Background with Reaction behält Gelächter und Umgebungsgeräusche bei. Kein anderes Tool bietet das.

KI-Vokalentferner & Stem-Trenner

Perso Dubbing ist die einzige Plattform, die mithilfe von KI Gesang, Hintergrundmusik und einzelne Sprecherstimmen aus einer einzigen Audio- oder Videodatei trennt – und so Creatorn, Cuttern und Produzenten eine Stem-Trennung in Studioqualität bietet.

Jede getrennte Spur vor dem Export in der Vorschau anzeigen

Hören Sie sich jede isolierte Spur vor dem Download an – prüfen Sie Gesang, einzelne Sprecher, reine Hintergrundmusik und Hintergrundmusik mit Reaktionen jeweils separat. Hören Sie genau, was Sie vor dem Export erhalten.

Automatische Transkription in über 100 Sprachen

Jede Trennung beinhaltet eine automatische Sprache-zu-Text-Transkription, die neben Ihren getrennten Spuren mit Sprecherbezeichnungen angezeigt wird. Keine zusätzlichen Tools oder Schritte erforderlich. Unterstützt über 100 Sprachen mit automatischer Spracherkennung.

Sprecherverwaltung & Bearbeitung

Benennen Sie Sprechernamen nach der KI-Trennung um, fügen Sie sie hinzu oder löschen Sie sie. Weisen Sie falsch zugeordnete Segmente zwischen erkannten Sprechern neu zu. Wählen Sie, ob Sie ein einzelnes Segment oder alle übereinstimmenden Bezeichnungen auf einmal aktualisieren möchten. Exportieren Sie Audiospuren und Transkriptionsdateien mit Ihren angewendeten Änderungen – keine erneute Verarbeitung erforderlich.

Funktioniert mit Audio- und Videodateien

Laden Sie MP3-, WAV-, MP4-, MOV- oder WebM-Dateien hoch. Exportieren Sie getrennte Tonspuren mit eingebetteten Untertiteln oder laden Sie separate SRT-Dateien herunter. Perso Dubbing verarbeitet sowohl reine Audiodateien als auch Videodateien in einem einzigen Workflow.

✨ Nur in Perso Dubbing

Dualer Hintergrundmodus

Background Music extrahiert reines BGM. Background with Reaction behält Gelächter und Umgebungsgeräusche bei. Kein anderes Tool bietet das.

Jede getrennte Spur vor dem Export in der Vorschau anzeigen

Hören Sie sich jede isolierte Spur vor dem Download an – prüfen Sie Gesang, einzelne Sprecher, reine Hintergrundmusik und Hintergrundmusik mit Reaktionen jeweils separat. Hören Sie genau, was Sie vor dem Export erhalten.

Sprecherverwaltung & Bearbeitung

Benennen Sie Sprechernamen nach der KI-Trennung um, fügen Sie sie hinzu oder löschen Sie sie. Weisen Sie falsch zugeordnete Segmente zwischen erkannten Sprechern neu zu. Wählen Sie, ob Sie ein einzelnes Segment oder alle übereinstimmenden Bezeichnungen auf einmal aktualisieren möchten. Exportieren Sie Audiospuren und Transkriptionsdateien mit Ihren angewendeten Änderungen – keine erneute Verarbeitung erforderlich.

KI-Vokalentferner & Stem-Trenner

Perso Dubbing ist die einzige Plattform, die mithilfe von KI Gesang, Hintergrundmusik und einzelne Sprecherstimmen aus einer einzigen Audio- oder Videodatei trennt – und so Creatorn, Cuttern und Produzenten eine Stem-Trennung in Studioqualität bietet.

Automatische Transkription in über 100 Sprachen

Jede Trennung beinhaltet eine automatische Sprache-zu-Text-Transkription, die neben Ihren getrennten Spuren mit Sprecherbezeichnungen angezeigt wird. Keine zusätzlichen Tools oder Schritte erforderlich. Unterstützt über 100 Sprachen mit automatischer Spracherkennung.

Funktioniert mit Audio- und Videodateien

Laden Sie MP3-, WAV-, MP4-, MOV- oder WebM-Dateien hoch. Exportieren Sie getrennte Tonspuren mit eingebetteten Untertiteln oder laden Sie separate SRT-Dateien herunter. Perso Dubbing verarbeitet sowohl reine Audiodateien als auch Videodateien in einem einzigen Workflow.

Zwei Wege, um Hintergrund-Audio zu entfernen —
Reine BGM oder BGM mit Reaktionen

Ein Podcast-Lachkonserve, die Reaktion eines Live-Publikums, ein Husten während einer Keynote – die meisten Stimmenentferner und Audiosplitter können diese Geräusche nicht von der Sprache trennen. Perso Dubbing ist das einzige Tool, das zwei verschiedene Modi zur Hintergrundtrennung bietet.

MODUS 1

Hintergrundmusik

Reine Musik, keine menschlichen Geräusche

Entfernt alle von Menschen erzeugten Geräusche — Sprache, Lachen, Husten, Klatschen, Atemzüge — und liefert ausschließlich reine Hintergrundmusik und Umgebungsgeräusche. Ideal zum Extrahieren von urheberrechtsfreier BGM oder zum Erstellen sauberer Audiobetten für das Nachsynchronisieren.

🗣️Sprache / Stimme

🗣️Sprache / Stimme

ENTFERNT

😂Lachen / Applaus

😂Lachen / Applaus

ENTFERNT

🎵Hintergrundmusik

GEHALTEN

🌿Ambient / Umgebung

GEHALTEN

Am besten geeignet für

Musikextraktion, urheberrechtsfreie Hintergrundmusik (BGM), saubere Klangteppiche, Neusynchronisation über sauberen Hintergrund

MODUS 2

Hintergrund mit Reaktion

Bewahre die menschlichen Momente

Entfernt nur Sprache und bewahrt menschliche Nicht-Sprachlaute – Lachen, Applaus, Publikumsreaktionen, Husten – sowie Hintergrundmusik. Perfekt, um die natürliche Atmosphäre von Live-Aufnahmen, Podcasts und Varieté-Shows zu erhalten.

🗣️Sprache / Stimme

🗣️Sprache / Stimme

ENTFERNT

😂Lachen / Applaus

GEHALTEN

🎵Hintergrundmusik

GEHALTEN

🌿Ambient / Umgebung

GEHALTEN

Am besten geeignet für

Podcasts, Live-Events, Varieté-Shows, Interviews — überall dort, wo Atmosphäre wichtig ist

Hören Sie den Unterschied

Sehen Sie, wie Perso Dubbing eine gemischte Audiodatei in saubere, isolierte Spuren trennt. Spielen Sie das Original ab und hören Sie sich dann jede einzelne getrennte Ebene an. Was Sie hören, ist genau das, was Sie bekommen.

Jetzt starten

Jetzt starten

Jetzt starten

Anwendungsfälle

Anwendungsfälle

Wer nutzt Audio-Separation?

Von Urheberrechtskonformität bis hin zur Podcast-Bearbeitung – sehen Sie, wie Kreative, Teams und Unternehmen Perso Dubbing Audio Separation nutzen.

Urheberrechtsauflösung

Ansprüche ohne erneute Aufzeichnung lösen

Entfernen Sie urheberrechtlich geschützte Hintergrundmusik, während der Dialog erhalten bleibt. Ersetzen Sie sie durch lizenzfreie Musik und laden Sie das Video ohne Ansprüche erneut hoch.

Urheberrechtsauflösung

Ansprüche ohne erneute Aufzeichnung lösen

Entfernen Sie urheberrechtlich geschützte Hintergrundmusik, während der Dialog erhalten bleibt. Ersetzen Sie sie durch lizenzfreie Musik und laden Sie das Video ohne Ansprüche erneut hoch.

Podcast-Bearbeitung

Bearbeiten, ohne den Vibe zu verlieren

Entfernen Sie Füllwörter und unerwünschte Sprache, während das Lachen des Publikums, der Applaus und alle Umgebungsreaktionen vollständig intakt bleiben.

Podcast-Bearbeitung

Bearbeiten, ohne den Vibe zu verlieren

Entfernen Sie Füllwörter und unerwünschte Sprache, während das Lachen des Publikums, der Applaus und alle Umgebungsreaktionen vollständig intakt bleiben.

Video-Synchronisation

Saubere Spuren für mehrere Sprachen

Extrahieren Sie eine saubere BGM-Spur ohne Sprachübersprechen und legen Sie dann ein neues Voice-over in einer von über 99 Sprachen darüber.

Video-Synchronisation

Saubere Spuren für mehrere Sprachen

Extrahieren Sie eine saubere BGM-Spur ohne Sprachübersprechen und legen Sie dann ein neues Voice-over in einer von über 99 Sprachen darüber.

Meeting & Konferenz

Meeting-Sprechende automatisch trennen

Trennen Sie die Stimme jedes Teilnehmers aus Zoom-, Teams- oder Meet-Aufnahmen. Erhalten Sie automatisch ein Transkript mit Sprecherkennzeichnung.

Meeting & Konferenz

Meeting-Sprechende automatisch trennen

Trennen Sie die Stimme jedes Teilnehmers aus Zoom-, Teams- oder Meet-Aufnahmen. Erhalten Sie automatisch ein Transkript mit Sprecherkennzeichnung.

Social-Media-Clips

BGM in Kurzvideos austauschen

Entfernen Sie die ursprüngliche Hintergrundmusik aus Kurzvideos und ersetzen Sie sie durch einen angesagten Track – ohne dass Ihr Voiceover oder Dialog beeinträchtigt wird.

Social-Media-Clips

BGM in Kurzvideos austauschen

Entfernen Sie die ursprüngliche Hintergrundmusik aus Kurzvideos und ersetzen Sie sie durch einen angesagten Track – ohne dass Ihr Voiceover oder Dialog beeinträchtigt wird.

Konzert & Fancams

Live-Performance-Audio bereinigen

Entferne Publikumsgeräusche, Jubel und Hall aus der Veranstaltungsumgebung aus Konzert-Fancams und Live-Clips. Isoliere die Stimme des Künstlers oder die Musik für kristallklare Wiedergabe und zum Teilen.

Konzert & Fancams

Live-Performance-Audio bereinigen

Entferne Publikumsgeräusche, Jubel und Hall aus der Veranstaltungsumgebung aus Konzert-Fancams und Live-Clips. Isoliere die Stimme des Künstlers oder die Musik für kristallklare Wiedergabe und zum Teilen.

Journalismus & Interviews

Quellen aus Feldaudio isolieren

Trennen Sie die Stimme jeder interviewten Person von verrauschten Feldaufnahmen. Erhalten Sie saubere, mit Sprecherkennzeichnung versehene Transkripte zum Faktencheck.

Journalismus & Interviews

Quellen aus Feldaudio isolieren

Trennen Sie die Stimme jeder interviewten Person von verrauschten Feldaufnahmen. Erhalten Sie saubere, mit Sprecherkennzeichnung versehene Transkripte zum Faktencheck.

Inhalte wiederverwenden

Ein Upload, mehrere Assets

Ein Upload → Podcast-Audio, Promo-Hintergrundmusik, Sprecher-Clips für Social Media, vollständiges Transkript für den Blog. Alles aus einer einzigen Datei.

Inhalte wiederverwenden

Ein Upload, mehrere Assets

Ein Upload → Podcast-Audio, Promo-Hintergrundmusik, Sprecher-Clips für Social Media, vollständiges Transkript für den Blog. Alles aus einer einzigen Datei.

Jetzt starten

Jetzt starten

Jetzt starten

So trennen Sie Audio mit Perso Dubbing

Transkribiere und übersetze deine Videos in 3 einfachen Schritten

Laden Sie eine beliebige Audio- oder Videodatei hoch und Perso Dubbing trennt jede Tonspur automatisch. Hören Sie sich eine Vorschau einzelner Spuren wie Gesang, Musik, Sprache und Umgebungsgeräusche an und laden Sie diese separat herunter oder kombinieren Sie ausgewählte Spuren in einer einzigen Datei. Keine Softwareinstallation, keine Accounteinrichtung erforderlich.

Jetzt starten

Jetzt starten

Jetzt starten

Häufig gestellte Fragen

Häufig gestellte Fragen

Was ist KI-Audio-Separation?

Die KI-Audio-Trennung verwendet maschinelles Lernen, um eine Audio- oder Videodatei in einzelne Spuren aufzuteilen – zum Beispiel Gesang, Hintergrundmusik und die Stimmen einzelner Sprecher – damit Sie jede Spur separat in der Vorschau ansehen, bearbeiten oder herunterladen können.

Kann ich ausgewählte Audiospuren in einer Datei zusammenführen?

Ja. Mit Perso Dubbing können Sie jede beliebige Kombination von getrennten Tonspuren auswählen – zum Beispiel Hintergrundmusik plus Sprecher 1 – und diese als eine einzige, zusammengeführte Audiodatei exportieren. Diese Funktion für selektives Mischen ist einzigartig für Perso Dubbing.

Kann ich ausgewählte Audiospuren in einer Datei zusammenführen?

Kann ich urheberrechtlich geschützte Hintergrundmusik aus meinem Video entfernen?

Ja. Laden Sie Ihr Video hoch, lassen Sie die KI die Audiospuren trennen und exportieren Sie dann nur die Sprach-/Sprecher-Spuren ohne Hintergrundmusik. Das ist der schnellste Weg, Urheberrechtsansprüche auf Plattformen wie YouTube, TikTok und Instagram zu lösen, ohne Ihre Inhalte neu aufzunehmen.

Kann ich urheberrechtlich geschützte Hintergrundmusik aus meinem Video entfernen?

Beinhaltet Perso Dubbing Audio Separation eine Transkription?

Ja. Wenn Sie eine Audio- oder Videodatei hochladen, transkribiert die KI die Sprache automatisch in Text mit Sprecherkennzeichnungen, der zusammen mit den getrennten Audiotracks auf derselben Ergebnisseite angezeigt wird.

Beinhaltet Perso Dubbing Audio Separation eine Transkription?

Welche Dateitypen werden unterstützt?

Sowohl Audiodateien (MP3, WAV usw.) als auch Videodateien werden unterstützt. Die KI extrahiert und trennt die Audiospuren automatisch, unabhängig vom Eingabeformat.

Welche Dateitypen werden unterstützt?

Kann ich Sprecher nach der Trennung neu zuordnen?

Ja. Wenn die KI falsch erkennt, wer was gesagt hat, können Sie jedes Sprachsegment einem anderen Sprecher neu zuweisen, der in derselben Datei erkannt wurde. Verschieben Sie zum Beispiel einen Satz von Sprecher A zu Sprecher B. Alle exportierten Audiospuren und Transkriptionsdateien übernehmen die korrigierten Sprecherzuweisungen automatisch.

Kann ich Sprecher nach der Trennung neu zuordnen?

Wie unterscheidet sich das von LALAL.AI oder Moises?

Anders als musikfokussierte Tools kombiniert Perso Dubbing Audiotrennung, Transkription, Sprecherneuzuweisung, duale Hintergrundmodi und selektives Track-Mixing in einem einzigen Projekt – speziell entwickelt für Videokünstler und Content-Editoren, nicht nur für Musiker.

Wie unterscheidet sich das von LALAL.AI oder Moises?

Was ist der Unterschied zwischen Hintergrundmusik und Hintergrund mit Reaktion?

Background Music entfernt alle von Menschen erzeugten Geräusche – Sprache, Lachen, Applaus, Husten – und liefert ausschließlich reine Hintergrundmusik und Umgebungstracks. Background with Reaction entfernt nur die Sprache, während menschliche Nicht-Sprachgeräusche wie Lachen und Publikumsreaktionen erhalten bleiben – ideal, um die natürliche Atmosphäre von Live-Aufnahmen zu bewahren. Perso Dubbing ist das einzige Tool, das beide Modi bietet.

Was ist der Unterschied zwischen Hintergrundmusik und Hintergrund mit Reaktion?

Kann ich nach der Trennung zwischen den Hintergrundmodi wechseln?

Ja. Sowohl Background Music als auch Background with Reaction-Tracks werden beim Hochladen einer Datei gleichzeitig generiert. Sie können beide Modi in der Vorschau ansehen, vergleichen und auswählen — oder beide in Ihren Export aufnehmen. Ein erneutes Hochladen oder Verarbeiten ist nicht erforderlich.

Kann ich nach der Trennung zwischen den Hintergrundmodi wechseln?

Kann ich die Sprecher-Namen nach der Trennung bearbeiten?

Ja. In kostenpflichtigen Tarifen können Sie jeden erkannten Sprecher umbenennen, neue Sprecher hinzufügen oder falsch identifizierte Sprecher löschen. Beim Umbenennen können Sie wählen, ob die Änderung nur für ein einzelnes Segment oder für alle mit diesem Sprecher gekennzeichneten Segmente übernommen werden soll. Ihre Änderungen werden beim erneuten Export der Dateien übernommen — sowohl die Audiospuren als auch die Transkriptionsdateien enthalten die aktualisierten Bezeichnungen.

Kann ich die Sprecher-Namen nach der Trennung bearbeiten?

Ist die Sprecherbearbeitung im kostenlosen Plan verfügbar?

Die Sprecherbearbeitung (umbenennen, hinzufügen, löschen) ist ausschließlich in kostenpflichtigen Tarifen verfügbar — Starter, Pro und Enterprise. Der kostenlose Tarif umfasst die Audiotrennung und Transkription, aber die Bearbeitung von Sprecherbezeichnungen und der Export der aktualisierten Datei erfordern einen kostenpflichtigen Tarif. Diese Funktion funktioniert sowohl mit Ergebnissen der Audiotrennung als auch mit Speech-to-Text-Ergebnissen.

Ist die Sprecherbearbeitung im kostenlosen Plan verfügbar?