AI 音訊分離
分離人聲、說話者與背景音樂
Perso AI Audio Separation 可將音訊與影片檔案拆分成各個獨立音軌,透過 AI 分離人聲、說話者與背景音樂。您可在「完整背景」(保留笑聲與環境音)或「乾淨背景」(僅保留音樂)之間選擇。可預覽每一條音軌,選取所需項目,並將自訂混音匯出為單一檔案。支援 99 種以上語言,並包含自動轉錄功能。
選擇語言
快速 · 安全 · 準確
分離背景音訊的兩種方法
播客中的笑聲軌、現場觀眾的反應、主題演講中的咳嗽聲——大多數工具無法將這些與語音分離。Perso AI 讓你自由選擇。
模式 1
背景音樂
純音樂,零人聲
移除所有人類產生的聲音——語音、笑聲、咳嗽、拍手、呼吸。僅保留乾淨的背景音樂與環境音。
已移除
已移除
🎵背景音樂
保留
🌿環境/周遭
保留
最適合
音樂提取、無版權 BGM、乾淨音軌、在乾淨背景上重新配音
模式 2
具有反應的背景
保留人性時刻
只移除語音。保留人類非語音聲音——笑聲、掌聲、觀眾反應、咳嗽聲——以及背景音樂。
已移除
😂笑聲/掌聲
保留
🎵背景音樂
保留
🌿環境/周遭
保留
最適合
Podcast、現場活動、綜藝節目、訪談——凡是重視氛圍的地方
從版權合規到播客編輯——看看創作者、團隊和企業如何使用 Perso AI 音訊分離功能。
著作權解決
無需重錄即可解決索賠
在保留對話完整的同時移除受版權保護的背景音樂。改用免版稅音樂並重新上傳,避免版權主張。
Podcast 編輯
編輯時保留氛圍
移除贅詞和不需要的語音,同時完整保留觀眾的笑聲、掌聲與現場反應。
影片配音
多語言用的乾淨音軌
擷取乾淨的 BGM 音軌,完全沒有任何人聲滲漏,然後以 99 種以上的任一語言疊加新的配音。
會議與研討會
自動區分會議發言人
將每位參與者的聲音從 Zoom、Teams 或 Meet 錄音中分離出來。自動取得帶有說話者標籤的逐字稿。
社群媒體短片
在短影音中替換 BGM
移除短影片中的原始背景音樂,並換上熱門音軌,同時不影響你的旁白或對白。
新聞與訪談
從現場音訊中分離音源
將每位受訪者的聲音從嘈雜的現場錄音中分離出來。取得乾淨、標註說話者的逐字稿,以便進行事實查核。
重新利用內容
一次上傳,多個素材
一次上傳 → 產生 Podcast 音訊、宣傳 BGM、供社群使用的講者精華片段,以及可用於部落格的完整逐字稿。全部只需一個檔案。
什麼是 AI 音訊分離?
AI 音訊分離使用機器學習,將音訊或影片檔拆分為個別音軌,例如人聲、背景音樂與各個說話者的聲音,讓您可以分別預覽、編輯或下載每一個音軌。




