
KI-Audio-Trennung
Stimmen, Sprecher & Hintergrundmusik trennen
Perso AI ist ein KI-gestützter Vocal-Remover und Audio-Splitter, der jede Audio- oder Videodatei in einzelne Spuren aufteilt — dabei werden Gesang, einzelne Sprecherstimmen, Hintergrundmusik und Umgebungsgeräusche mit Studioqualität präzise isoliert. Laden Sie eine Datei hoch, sehen Sie sich jede getrennte Spur in der Vorschau an, wählen Sie die gewünschte Kombination aus und exportieren Sie alles als eine einzige zusammengeführte Datei. Bearbeiten Sie Sprechernamen, weisen Sie falsch zugeordnete Segmente neu zu und exportieren Sie die Datei mit den vorgenommenen Änderungen erneut — alles auf einer Seite. Eine automatische Transkription in über 99 Sprachen ist bei jeder Trennung enthalten.
Jetzt starten
Jetzt starten
Jetzt starten
Keine Installation erforderlich · Kostenloser Plan verfügbar · In Sekunden starten



Kernfunktionen
Kernfunktionen
Trennung + Transkription in einer Ansicht
Trennung + Transkription in einer Ansicht
Laden Sie beliebige Audio- oder Videodateien hoch — trennen Sie Stimmen, entfernen Sie urheberrechtlich geschützte Hintergrundmusik und exportieren Sie saubere Spuren in Sekunden.
Laden Sie beliebige Audio- oder Videodateien hoch — trennen Sie Stimmen, entfernen Sie urheberrechtlich geschützte Hintergrundmusik und exportieren Sie saubere Spuren in Sekunden.
KI-Vokalentferner & Stem-Trenner
Perso AI ist die einzige Plattform, die Gesang, Hintergrundmusik und einzelne Sprecherstimmen aus einer einzigen Audio- oder Videodatei mithilfe von KI trennt – und damit eine Stem-Trennung in Studioqualität für Creator, Editoren und Produzenten liefert.
Automatische Transkription in über 99 Sprachen
Jede Trennung wird mit einer automatischen Sprach-zu-Text-Transkription geliefert — angezeigt neben Ihren getrennten Spuren mit Sprecherkennzeichnungen. Keine zusätzlichen Tools oder Schritte erforderlich. Unterstützt über 99 Sprachen mit automatischer Spracherkennung.
✨ Nur in Perso AI
Dualer Hintergrundmodus
Background Music extrahiert reines BGM. Background with Reaction behält Gelächter und Umgebungsgeräusche bei. Kein anderes Tool bietet das.
Sprecherverwaltung & Bearbeitung
Benennen Sie Sprechernamen nach der KI-Trennung um, fügen Sie sie hinzu oder löschen Sie sie. Weisen Sie falsch zugeordnete Segmente zwischen erkannten Sprechern neu zu. Wählen Sie, ob Sie ein einzelnes Segment oder alle übereinstimmenden Bezeichnungen auf einmal aktualisieren möchten. Exportieren Sie Audiospuren und Transkriptionsdateien mit Ihren angewendeten Änderungen – keine erneute Verarbeitung erforderlich.
Jede getrennte Spur vor dem Export in der Vorschau anzeigen
Hören Sie sich jede isolierte Spur vor dem Download an – prüfen Sie Gesang, einzelne Sprecher, reine Hintergrundmusik und Hintergrundmusik mit Reaktionen jeweils separat. Hören Sie genau, was Sie vor dem Export erhalten.
Funktioniert mit Audio- und Videodateien
Laden Sie MP3-, WAV-, MP4-, MOV- oder WebM-Dateien hoch. Exportieren Sie getrennte Spuren mit eingebetteten Untertiteln oder laden Sie separate SRT-Dateien herunter. Perso AI verarbeitet sowohl reine Audiodateien als auch Videodateien in einem einzigen Workflow.
KI-Vokalentferner & Stem-Trenner
Perso AI ist die einzige Plattform, die Gesang, Hintergrundmusik und einzelne Sprecherstimmen aus einer einzigen Audio- oder Videodatei mithilfe von KI trennt – und damit eine Stem-Trennung in Studioqualität für Creator, Editoren und Produzenten liefert.
✨ Nur in Perso AI
Dualer Hintergrundmodus
Background Music extrahiert reines BGM. Background with Reaction behält Gelächter und Umgebungsgeräusche bei. Kein anderes Tool bietet das.
Jede getrennte Spur vor dem Export in der Vorschau anzeigen
Hören Sie sich jede isolierte Spur vor dem Download an – prüfen Sie Gesang, einzelne Sprecher, reine Hintergrundmusik und Hintergrundmusik mit Reaktionen jeweils separat. Hören Sie genau, was Sie vor dem Export erhalten.
Automatische Transkription in über 99 Sprachen
Jede Trennung wird mit einer automatischen Sprach-zu-Text-Transkription geliefert — angezeigt neben Ihren getrennten Spuren mit Sprecherkennzeichnungen. Keine zusätzlichen Tools oder Schritte erforderlich. Unterstützt über 99 Sprachen mit automatischer Spracherkennung.
Sprecherverwaltung & Bearbeitung
Benennen Sie Sprechernamen nach der KI-Trennung um, fügen Sie sie hinzu oder löschen Sie sie. Weisen Sie falsch zugeordnete Segmente zwischen erkannten Sprechern neu zu. Wählen Sie, ob Sie ein einzelnes Segment oder alle übereinstimmenden Bezeichnungen auf einmal aktualisieren möchten. Exportieren Sie Audiospuren und Transkriptionsdateien mit Ihren angewendeten Änderungen – keine erneute Verarbeitung erforderlich.
Funktioniert mit Audio- und Videodateien
Laden Sie MP3-, WAV-, MP4-, MOV- oder WebM-Dateien hoch. Exportieren Sie getrennte Spuren mit eingebetteten Untertiteln oder laden Sie separate SRT-Dateien herunter. Perso AI verarbeitet sowohl reine Audiodateien als auch Videodateien in einem einzigen Workflow.
KI-Vokalentferner & Stem-Trenner
Perso AI ist die einzige Plattform, die Gesang, Hintergrundmusik und einzelne Sprecherstimmen aus einer einzigen Audio- oder Videodatei mithilfe von KI trennt – und damit eine Stem-Trennung in Studioqualität für Creator, Editoren und Produzenten liefert.
Jede getrennte Spur vor dem Export in der Vorschau anzeigen
Hören Sie sich jede isolierte Spur vor dem Download an – prüfen Sie Gesang, einzelne Sprecher, reine Hintergrundmusik und Hintergrundmusik mit Reaktionen jeweils separat. Hören Sie genau, was Sie vor dem Export erhalten.
Sprecherverwaltung & Bearbeitung
Benennen Sie Sprechernamen nach der KI-Trennung um, fügen Sie sie hinzu oder löschen Sie sie. Weisen Sie falsch zugeordnete Segmente zwischen erkannten Sprechern neu zu. Wählen Sie, ob Sie ein einzelnes Segment oder alle übereinstimmenden Bezeichnungen auf einmal aktualisieren möchten. Exportieren Sie Audiospuren und Transkriptionsdateien mit Ihren angewendeten Änderungen – keine erneute Verarbeitung erforderlich.
✨ Nur in Perso AI
Dualer Hintergrundmodus
Background Music extrahiert reines BGM. Background with Reaction behält Gelächter und Umgebungsgeräusche bei. Kein anderes Tool bietet das.
Automatische Transkription in über 99 Sprachen
Jede Trennung wird mit einer automatischen Sprach-zu-Text-Transkription geliefert — angezeigt neben Ihren getrennten Spuren mit Sprecherkennzeichnungen. Keine zusätzlichen Tools oder Schritte erforderlich. Unterstützt über 99 Sprachen mit automatischer Spracherkennung.
Funktioniert mit Audio- und Videodateien
Laden Sie MP3-, WAV-, MP4-, MOV- oder WebM-Dateien hoch. Exportieren Sie getrennte Spuren mit eingebetteten Untertiteln oder laden Sie separate SRT-Dateien herunter. Perso AI verarbeitet sowohl reine Audiodateien als auch Videodateien in einem einzigen Workflow.
Zwei Möglichkeiten, Hintergrundmusik zu entfernen — reines BGM oder BGM mit Reaktionen
Zwei Möglichkeiten, Hintergrundaudio zu entfernen — reines BGM oder BGM mit Reaktionen
Eine Lachspur in einem Podcast, eine Reaktion des Live-Publikums, ein Husten während einer Keynote – die meisten Stimmenentferner und Audio-Splitter können diese nicht von Sprache trennen. Perso AI ist das einzige Tool, das zwei unterschiedliche Modi zur Hintergrundtrennung bietet.
Eine Lachspur in einem Podcast, eine Reaktion des Live-Publikums, ein Husten während einer Keynote — die meisten Stimmentferner und Audioteiler können diese nicht von der Sprache trennen. Perso AI ist das einzige Tool, das zwei unterschiedliche Modi zur Trennung von Hintergrundgeräuschen bietet.
Ein Lachtrack in einem Podcast, eine Reaktion des Live-Publikums, ein Husten während einer Keynote — die meisten Stimmenentferner und Audio-Splitter können diese nicht von Sprache trennen. Perso AI ist das einzige Tool, das zwei verschiedene Modi zur Hintergrundtrennung bietet.
MODUS 1
Hintergrundmusik
Reine Musik, keine menschlichen Geräusche
Entfernt alle von Menschen erzeugten Geräusche — Sprache, Lachen, Husten, Klatschen, Atemzüge — und liefert ausschließlich reine Hintergrundmusik und Umgebungsgeräusche. Ideal zum Extrahieren von urheberrechtsfreier BGM oder zum Erstellen sauberer Audiobetten für das Nachsynchronisieren.
🗣️Sprache / Stimme
🗣️Sprache / Stimme
ENTFERNT
😂Lachen / Applaus
😂Lachen / Applaus
ENTFERNT
🎵Hintergrundmusik
GEHALTEN
🌿Ambient / Umgebung
GEHALTEN
Am besten geeignet für
Musikextraktion, urheberrechtsfreie Hintergrundmusik (BGM), saubere Klangteppiche, Neusynchronisation über sauberen Hintergrund
MODUS 2
Hintergrund mit Reaktion
Bewahre die menschlichen Momente
Entfernt nur Sprache und bewahrt menschliche Nicht-Sprachlaute – Lachen, Applaus, Publikumsreaktionen, Husten – sowie Hintergrundmusik. Perfekt, um die natürliche Atmosphäre von Live-Aufnahmen, Podcasts und Varieté-Shows zu erhalten.
🗣️Sprache / Stimme
🗣️Sprache / Stimme
ENTFERNT
😂Lachen / Applaus
GEHALTEN
🎵Hintergrundmusik
GEHALTEN
🌿Ambient / Umgebung
GEHALTEN
Am besten geeignet für
Podcasts, Live-Events, Varieté-Shows, Interviews — überall dort, wo Atmosphäre wichtig ist
Hören Sie den Unterschied
Lihat bagaimana Perso AI memisahkan file audio campuran menjadi trek yang bersih dan terisolasi. Putar versi aslinya, lalu dengarkan setiap lapisan yang dipisahkan secara individual. Apa yang Anda dengar adalah persis seperti yang Anda dapatkan.
Lihat bagaimana Perso AI memisahkan file audio campuran menjadi trek yang bersih dan terisolasi. Putar versi aslinya, lalu dengarkan setiap lapisan yang dipisahkan secara individual. Apa yang Anda dengar adalah persis apa yang Anda dapatkan.
Sehen Sie, wie Perso AI eine gemischte Audiodatei in saubere, isolierte Spuren aufteilt. Spielen Sie das Original ab und hören Sie sich dann jede getrennte Spur einzeln an. Was Sie hören, ist genau das, was Sie bekommen.


Jetzt starten
Jetzt starten
Jetzt starten
Anwendungsfälle
Anwendungsfälle
Wer nutzt Audio-Separation?
Von der Einhaltung des Urheberrechts bis zur Podcast-Bearbeitung — sehen Sie, wie Kreative, Teams und Unternehmen Perso AI Audio Separation nutzen.
Urheberrechtsauflösung
Ansprüche ohne erneute Aufzeichnung lösen
Entfernen Sie urheberrechtlich geschützte Hintergrundmusik, während der Dialog erhalten bleibt. Ersetzen Sie sie durch lizenzfreie Musik und laden Sie das Video ohne Ansprüche erneut hoch.
Urheberrechtsauflösung
Ansprüche ohne erneute Aufzeichnung lösen
Entfernen Sie urheberrechtlich geschützte Hintergrundmusik, während der Dialog erhalten bleibt. Ersetzen Sie sie durch lizenzfreie Musik und laden Sie das Video ohne Ansprüche erneut hoch.
Podcast-Bearbeitung
Bearbeiten, ohne den Vibe zu verlieren
Entfernen Sie Füllwörter und unerwünschte Sprache, während das Lachen des Publikums, der Applaus und alle Umgebungsreaktionen vollständig intakt bleiben.
Podcast-Bearbeitung
Bearbeiten, ohne den Vibe zu verlieren
Entfernen Sie Füllwörter und unerwünschte Sprache, während das Lachen des Publikums, der Applaus und alle Umgebungsreaktionen vollständig intakt bleiben.
Video-Synchronisation
Saubere Spuren für mehrere Sprachen
Extrahieren Sie eine saubere BGM-Spur ohne Sprachübersprechen und legen Sie dann ein neues Voice-over in einer von über 99 Sprachen darüber.
Video-Synchronisation
Saubere Spuren für mehrere Sprachen
Extrahieren Sie eine saubere BGM-Spur ohne Sprachübersprechen und legen Sie dann ein neues Voice-over in einer von über 99 Sprachen darüber.
Meeting & Konferenz
Meeting-Sprechende automatisch trennen
Trennen Sie die Stimme jedes Teilnehmers aus Zoom-, Teams- oder Meet-Aufnahmen. Erhalten Sie automatisch ein Transkript mit Sprecherkennzeichnung.
Meeting & Konferenz
Meeting-Sprechende automatisch trennen
Trennen Sie die Stimme jedes Teilnehmers aus Zoom-, Teams- oder Meet-Aufnahmen. Erhalten Sie automatisch ein Transkript mit Sprecherkennzeichnung.
Social-Media-Clips
BGM in Kurzvideos austauschen
Entfernen Sie die ursprüngliche Hintergrundmusik aus Kurzvideos und ersetzen Sie sie durch einen angesagten Track – ohne dass Ihr Voiceover oder Dialog beeinträchtigt wird.
Social-Media-Clips
BGM in Kurzvideos austauschen
Entfernen Sie die ursprüngliche Hintergrundmusik aus Kurzvideos und ersetzen Sie sie durch einen angesagten Track – ohne dass Ihr Voiceover oder Dialog beeinträchtigt wird.
Konzert & Fancams
Live-Performance-Audio bereinigen
Entferne Publikumsgeräusche, Jubel und Hall aus der Veranstaltungsumgebung aus Konzert-Fancams und Live-Clips. Isoliere die Stimme des Künstlers oder die Musik für kristallklare Wiedergabe und zum Teilen.
Konzert & Fancams
Live-Performance-Audio bereinigen
Entferne Publikumsgeräusche, Jubel und Hall aus der Veranstaltungsumgebung aus Konzert-Fancams und Live-Clips. Isoliere die Stimme des Künstlers oder die Musik für kristallklare Wiedergabe und zum Teilen.
Journalismus & Interviews
Quellen aus Feldaudio isolieren
Trennen Sie die Stimme jeder interviewten Person von verrauschten Feldaufnahmen. Erhalten Sie saubere, mit Sprecherkennzeichnung versehene Transkripte zum Faktencheck.
Journalismus & Interviews
Quellen aus Feldaudio isolieren
Trennen Sie die Stimme jeder interviewten Person von verrauschten Feldaufnahmen. Erhalten Sie saubere, mit Sprecherkennzeichnung versehene Transkripte zum Faktencheck.
Inhalte wiederverwenden
Ein Upload, mehrere Assets
Ein Upload → Podcast-Audio, Promo-Hintergrundmusik, Sprecher-Clips für Social Media, vollständiges Transkript für den Blog. Alles aus einer einzigen Datei.
Inhalte wiederverwenden
Ein Upload, mehrere Assets
Ein Upload → Podcast-Audio, Promo-Hintergrundmusik, Sprecher-Clips für Social Media, vollständiges Transkript für den Blog. Alles aus einer einzigen Datei.
Jetzt starten
Jetzt starten
Jetzt starten
Wie man Audio mit Perso AI trennt
So trennst du Audio mit Perso AI
Transkribiere und übersetze deine Videos in 3 einfachen Schritten
Laden Sie jede Audio- oder Videodatei hoch, und Perso AI trennt automatisch jede Klangspur. Sehen Sie sich einzelne Spuren wie Gesang, Musik, Sprache und Umgebungsgeräusche in der Vorschau an und laden Sie sie dann separat herunter oder kombinieren Sie ausgewählte Spuren zu einer einzigen Datei. Keine Software zum Installieren, kein Konto erforderlich.
Laden Sie einfach eine beliebige Audio- oder Videodatei hoch, und Perso AI trennt automatisch jede Tonspur. Sehen Sie sich einzelne Spuren wie Gesang, Musik, Sprache und Umgebungsgeräusche in der Vorschau an, laden Sie sie anschließend einzeln herunter oder fassen Sie ausgewählte Spuren in einer einzigen Datei zusammen. Keine Softwareinstallation, keine Kontoerstellung erforderlich.
Laden Sie jede beliebige Audio- oder Videodatei hoch, und Perso AI trennt automatisch jede Tonspur. Sehen Sie sich einzelne Spuren wie Gesang, Musik, Sprache und Umgebungsgeräusche in der Vorschau an und laden Sie sie anschließend entweder separat herunter oder kombinieren Sie ausgewählte Spuren zu einer einzigen Datei. Keine Softwareinstallation, keine Kontoerstellung erforderlich.
Jetzt starten
Jetzt starten
Jetzt starten
Häufig gestellte Fragen
Häufig gestellte Fragen
Was ist KI-Audio-Separation?
Die KI-Audio-Trennung verwendet maschinelles Lernen, um eine Audio- oder Videodatei in einzelne Spuren aufzuteilen – zum Beispiel Gesang, Hintergrundmusik und die Stimmen einzelner Sprecher – damit Sie jede Spur separat in der Vorschau ansehen, bearbeiten oder herunterladen können.
Kann ich ausgewählte Audiospuren in einer Datei zusammenführen?
Ja. Mit Perso AI können Sie jede beliebige Kombination getrennter Spuren auswählen — zum Beispiel Hintergrundmusik plus Sprecher 1 — und sie als eine einzige zusammengeführte Audiodatei exportieren. Diese Funktion für die selektive Mischung ist einzigartig bei Perso AI.
Kann ich ausgewählte Audiospuren in einer Datei zusammenführen?
Kann ich urheberrechtlich geschützte Hintergrundmusik aus meinem Video entfernen?
Ja. Laden Sie Ihr Video hoch, lassen Sie die KI die Audiospuren trennen und exportieren Sie dann nur die Sprach-/Sprecher-Spuren ohne Hintergrundmusik. Das ist der schnellste Weg, Urheberrechtsansprüche auf Plattformen wie YouTube, TikTok und Instagram zu lösen, ohne Ihre Inhalte neu aufzunehmen.
Kann ich urheberrechtlich geschützte Hintergrundmusik aus meinem Video entfernen?
Enthält Perso AI Audio Separation eine Transkription?
Ja. Wenn Sie eine Audio- oder Videodatei hochladen, transkribiert die KI die Sprache automatisch in Text mit Sprecherkennzeichnungen, der zusammen mit den getrennten Audiotracks auf derselben Ergebnisseite angezeigt wird.
Enthält Perso AI Audio Separation eine Transkription?
Welche Dateitypen werden unterstützt?
Sowohl Audiodateien (MP3, WAV usw.) als auch Videodateien werden unterstützt. Die KI extrahiert und trennt die Audiospuren automatisch, unabhängig vom Eingabeformat.
Welche Dateitypen werden unterstützt?
Kann ich Sprecher nach der Trennung neu zuordnen?
Ja. Wenn die KI falsch erkennt, wer was gesagt hat, können Sie jedes Sprachsegment einem anderen Sprecher neu zuweisen, der in derselben Datei erkannt wurde. Verschieben Sie zum Beispiel einen Satz von Sprecher A zu Sprecher B. Alle exportierten Audiospuren und Transkriptionsdateien übernehmen die korrigierten Sprecherzuweisungen automatisch.
Kann ich Sprecher nach der Trennung neu zuordnen?
Wie unterscheidet sich das von LALAL.AI oder Moises?
Anders als auf Musik fokussierte Tools vereint Perso AI in einem einzigen Projekt Audiotrennung, Texttranskription, Sprecherzuordnung, zwei Hintergrundmodi und selektives Track-Mixing – entwickelt nicht nur für Musiker, sondern für Videokreative und Content-Editoren.
Wie unterscheidet sich das von LALAL.AI oder Moises?
Was ist der Unterschied zwischen Hintergrundmusik und Hintergrund mit Reaktion?
Background Music entfernt alle von Menschen erzeugten Geräusche — Sprache, Lachen, Applaus, Husten — und liefert ausschließlich reine Hintergrundmusik und Ambient-Tracks. Background with Reaction entfernt nur Sprache, bewahrt aber menschliche Nicht-Sprachgeräusche wie Lachen und Publikumsreaktionen, ideal, um die natürliche Atmosphäre von Live-Aufnahmen zu erhalten. Perso AI ist das einzige Tool, das beide Modi anbietet.
Was ist der Unterschied zwischen Hintergrundmusik und Hintergrund mit Reaktion?
Kann ich nach der Trennung zwischen den Hintergrundmodi wechseln?
Ja. Sowohl Background Music als auch Background with Reaction-Tracks werden beim Hochladen einer Datei gleichzeitig generiert. Sie können beide Modi in der Vorschau ansehen, vergleichen und auswählen — oder beide in Ihren Export aufnehmen. Ein erneutes Hochladen oder Verarbeiten ist nicht erforderlich.
Kann ich nach der Trennung zwischen den Hintergrundmodi wechseln?
Kann ich die Sprecher-Namen nach der Trennung bearbeiten?
Ja. In kostenpflichtigen Tarifen können Sie jeden erkannten Sprecher umbenennen, neue Sprecher hinzufügen oder falsch identifizierte Sprecher löschen. Beim Umbenennen können Sie wählen, ob die Änderung nur für ein einzelnes Segment oder für alle mit diesem Sprecher gekennzeichneten Segmente übernommen werden soll. Ihre Änderungen werden beim erneuten Export der Dateien übernommen — sowohl die Audiospuren als auch die Transkriptionsdateien enthalten die aktualisierten Bezeichnungen.
Kann ich die Sprecher-Namen nach der Trennung bearbeiten?
Ist die Sprecherbearbeitung im kostenlosen Plan verfügbar?
Die Sprecherbearbeitung (umbenennen, hinzufügen, löschen) ist ausschließlich in kostenpflichtigen Tarifen verfügbar — Starter, Pro und Enterprise. Der kostenlose Tarif umfasst die Audiotrennung und Transkription, aber die Bearbeitung von Sprecherbezeichnungen und der Export der aktualisierten Datei erfordern einen kostenpflichtigen Tarif. Diese Funktion funktioniert sowohl mit Ergebnissen der Audiotrennung als auch mit Speech-to-Text-Ergebnissen.
Ist die Sprecherbearbeitung im kostenlosen Plan verfügbar?
Entdecken Sie unsere Produktmerkmale
Entdecken Sie unsere Produktmerkmale
PRODUKT
ANWENDUNGSFALL
RESSOURCE
ESTsoft Inc. 15770 Laguna Canyon Rd #250, Irvine, CA 92618
PRODUKT
ANWENDUNGSFALL
RESSOURCE
ESTsoft Inc. 15770 Laguna Canyon Rd #250, Irvine, CA 92618
PRODUKT
ANWENDUNGSFALL
RESSOURCE
ESTsoft Inc. 15770 Laguna Canyon Rd #250, Irvine, CA 92618
