



快速 · 安全 · 準確
核心功能
核心功能
在同一畫面中進行分離+轉錄
在同一畫面中進行分離 + 轉錄
上傳任何音訊或影片檔案——分離人聲、移除受著作權保護的背景音樂,並在數秒內匯出乾淨音軌。
上傳任何音訊或影片檔案——分離人聲、移除受版權保護的背景音樂,並在幾秒內匯出乾淨音軌。
上傳任何音訊或影片檔案——分離人聲、移除受著作權保護的背景音樂,並在數秒內匯出乾淨音軌。
音訊軌道分離
Perso AI 是唯一一個能夠利用 AI,從單一音訊或影片檔中分離人聲、背景音樂與各個說話者聲音的平台——並具備錄音室等級的精準度。
自動轉錄
每次分離都會自動產生文字轉錄——並顯示在分離出的音軌旁。無需額外工具或步驟。支援 99+ 種語言。
✨ 僅限於 Perso AI
雙重背景模式
背景音樂可擷取純淨的 BGM。帶有反應的背景可保留笑聲與環境音。沒有其他工具提供這項功能。
說話者重新指派
在偵測到的說話者之間重新分配語音片段。即時修正誤判的區段——所有匯出的音軌與逐字稿都會反映更正後的指派。
個別軌道預覽
下載前,請先聆聽各個分離音軌。可分別預覽人聲、發言者以及兩種背景模式。
適用於影片檔案
可依需求匯出任何格式——MP4、MOV、WebM——並附有內嵌字幕或獨立的 SRT 檔案。
音訊軌道分離
Perso AI 是唯一一個能夠利用 AI,從單一音訊或影片檔中分離人聲、背景音樂與各個說話者聲音的平台——並具備錄音室等級的精準度。
✨ 僅在 Perso AI
雙重背景模式
背景音樂可擷取純淨的 BGM。帶有反應的背景可保留笑聲與環境音。沒有其他工具提供這項功能。
個別軌道預覽
下載前,請先聆聽各個分離音軌。可分別預覽人聲、發言者以及兩種背景模式。
自動轉錄
每次分離都會自動產生文字轉錄——並顯示在分離出的音軌旁。無需額外工具或步驟。支援 99+ 種語言。
說話者重新指派
在偵測到的說話者之間重新分配語音片段。即時修正誤判的區段——所有匯出的音軌與逐字稿都會反映更正後的指派。
適用於影片檔案
可依需求匯出任何格式——MP4、MOV、WebM——並附有內嵌字幕或獨立的 SRT 檔案。
音訊軌道分離
Perso AI 是唯一一個能夠利用 AI,從單一音訊或影片檔中分離人聲、背景音樂與各個說話者聲音的平台——並具備錄音室等級的精準度。
個別軌道預覽
下載前,請先聆聽各個分離音軌。可分別預覽人聲、發言者以及兩種背景模式。
說話者重新指派
在偵測到的說話者之間重新分配語音片段。即時修正誤判的區段——所有匯出的音軌與逐字稿都會反映更正後的指派。
✨ 僅限於 Perso AI
雙重背景模式
背景音樂可擷取純淨的 BGM。帶有反應的背景可保留笑聲與環境音。沒有其他工具提供這項功能。
自動轉錄
每次分離都會自動產生文字轉錄——並顯示在分離出的音軌旁。無需額外工具或步驟。支援 99+ 種語言。
適用於影片檔案
可依需求匯出任何格式——MP4、MOV、WebM——並附有內嵌字幕或獨立的 SRT 檔案。
分離背景音訊的兩種方法
播客中的笑聲軌、現場觀眾的反應、主題演講中的咳嗽聲——大多數工具無法將這些與語音分離。Perso AI 讓你自由選擇。
模式 1
背景音樂
純音樂,零人聲
移除所有人類產生的聲音——語音、笑聲、咳嗽、拍手、呼吸。僅保留乾淨的背景音樂與環境音。
🗣️語音 / 聲音
🗣️語音 / 聲音
已移除
😂笑聲/掌聲
😂笑聲/掌聲
已移除
🎵背景音樂
保留
🌿環境/周遭
保留
最適合
音樂提取、無版權 BGM、乾淨音軌、在乾淨背景上重新配音
模式 2
具有反應的背景
保留人性時刻
只移除語音。保留人類非語音聲音——笑聲、掌聲、觀眾反應、咳嗽聲——以及背景音樂。
🗣️語音 / 聲音
🗣️語音 / 聲音
已移除
😂笑聲/掌聲
保留
🎵背景音樂
保留
🌿環境/周遭
保留
最適合
Podcast、現場活動、綜藝節目、訪談——凡是重視氛圍的地方
聆聽差異
違いを聞いてみてください
看看 Perso AI 如何將混合音訊檔案分離成乾淨、獨立的音軌。先播放原始音檔,再逐一聆聽每個分離後的音軌。你聽到的,就是你得到的。
看看 Perso AI 如何將混合音訊檔案分離成乾淨、獨立的音軌。先播放原始音訊,再逐一聆聽每個分離出的層。你聽到的,就是你得到的。
看看 Perso AI 如何將混合音訊檔案分離成乾淨、獨立的音軌。先播放原始音檔,再逐一聆聽每個分離出的層。你聽到的,就是實際得到的效果。


立即開始
立即開始
立即開始
使用案例
使用案例
誰在使用音訊分離?
誰會使用音訊分離?
從版權合規到播客編輯——看看創作者、團隊和企業如何使用 Perso AI 音訊分離功能。
著作權解決
無需重錄即可解決索賠
在保留對話完整的同時移除受版權保護的背景音樂。改用免版稅音樂並重新上傳,避免版權主張。
著作權解決
無需重錄即可解決索賠
在保留對話完整的同時移除受版權保護的背景音樂。改用免版稅音樂並重新上傳,避免版權主張。
Podcast 編輯
編輯時保留氛圍
移除贅詞和不需要的語音,同時完整保留觀眾的笑聲、掌聲與現場反應。
Podcast 編輯
編輯時保留氛圍
移除贅詞和不需要的語音,同時完整保留觀眾的笑聲、掌聲與現場反應。
影片配音
多語言用的乾淨音軌
擷取乾淨的 BGM 音軌,完全沒有任何人聲滲漏,然後以 99 種以上的任一語言疊加新的配音。
影片配音
多語言用的乾淨音軌
擷取乾淨的 BGM 音軌,完全沒有任何人聲滲漏,然後以 99 種以上的任一語言疊加新的配音。
會議與研討會
自動區分會議發言人
將每位參與者的聲音從 Zoom、Teams 或 Meet 錄音中分離出來。自動取得帶有說話者標籤的逐字稿。
會議與研討會
自動區分會議發言人
將每位參與者的聲音從 Zoom、Teams 或 Meet 錄音中分離出來。自動取得帶有說話者標籤的逐字稿。
社群媒體短片
在短影音中替換 BGM
移除短影片中的原始背景音樂,並換上熱門音軌,同時不影響你的旁白或對白。
社群媒體短片
在短影音中替換 BGM
移除短影片中的原始背景音樂,並換上熱門音軌,同時不影響你的旁白或對白。
演唱會與飯拍
清理現場表演音訊
移除演唱會飯拍和現場片段中的人群噪音、歡呼聲與場館迴響。分離歌手的聲音或音樂,帶來清晰無比的播放與分享體驗。
演唱會與飯拍
清理現場表演音訊
移除演唱會飯拍和現場片段中的人群噪音、歡呼聲與場館迴響。分離歌手的聲音或音樂,帶來清晰無比的播放與分享體驗。
新聞與訪談
從現場音訊中分離音源
將每位受訪者的聲音從嘈雜的現場錄音中分離出來。取得乾淨、標註說話者的逐字稿,以便進行事實查核。
新聞與訪談
從現場音訊中分離音源
將每位受訪者的聲音從嘈雜的現場錄音中分離出來。取得乾淨、標註說話者的逐字稿,以便進行事實查核。
重新利用內容
一次上傳,多個素材
一次上傳 → 產生 Podcast 音訊、宣傳 BGM、供社群使用的講者精華片段,以及可用於部落格的完整逐字稿。全部只需一個檔案。
重新利用內容
一次上傳,多個素材
一次上傳 → 產生 Podcast 音訊、宣傳 BGM、供社群使用的講者精華片段,以及可用於部落格的完整逐字稿。全部只需一個檔案。
立即開始
立即開始
立即開始
如何使用 Perso AI 分離音訊
只需 3 個簡單步驟,即可轉錄並翻譯您的影片
上傳任何音訊或影片檔案,Perso AI 會自動分離每一層聲音。您可以預覽人聲、音樂、語音和環境音等各個音軌,然後分別下載,或將選取的音軌合併成單一檔案。無需安裝軟體,也不需要建立帳號。
上傳任何音訊或影片檔案,Perso AI 會自動分離所有聲音層。您可以預覽各個音軌,例如人聲、音樂、語音和環境音效,然後分別下載,或將選取的音軌合併為單一檔案。無需安裝軟體,也不需要建立帳戶。
上傳任何音訊或影片檔,Perso AI 就會自動分離每個聲音層。您可以預覽各個音軌,例如人聲、音樂、語音和環境音,然後分別下載,或將選取的音軌合併成單一檔案。無需安裝軟體,也不需要設定帳號。
立即開始
立即開始
立即開始
常見問題
常見問題
什麼是 AI 音訊分離?
AI 音訊分離使用機器學習,將音訊或影片檔拆分為個別音軌,例如人聲、背景音樂與各個說話者的聲音,讓您可以分別預覽、編輯或下載每一個音軌。
我可以將選取的音訊軌道合併成一個檔案嗎?
是。Perso AI 可讓您選擇任何已分離音軌的任意組合——例如,背景音樂加上講者 1——並將它們匯出為單一合併音訊檔。這項選擇性混音功能是 Perso AI 所獨有。
我可以將選取的音訊軌道合併成一個檔案嗎?
我可以從我的影片中移除受著作權保護的背景音樂嗎?
是的。上傳您的影片,讓 AI 分離音軌,然後只匯出人聲/說話者音軌,不含背景音樂。這是最快解決 YouTube、TikTok 和 Instagram 等平台上的版權申訴,而無需重新錄製內容的方法。
我可以從我的影片中移除受著作權保護的背景音樂嗎?
Perso AI Audio Separation 是否包含轉錄功能?
是的。當您上傳音訊或影片檔案時,AI 會自動將語音轉錄成文字,並標示說話者,與分離後的音軌一同顯示在同一個結果頁面上。
Perso AI Audio Separation 是否包含轉錄功能?
支援哪些檔案類型?
支援音訊檔案(MP3、WAV 等)和影片檔案。AI 會自動擷取並分離音軌,無論輸入格式為何。
支援哪些檔案類型?
分離後我可以重新指派說話者嗎?
是的。如果 AI 錯誤辨識了誰說了什麼,您可以將任何語音片段重新指派給同一檔案中偵測到的其他說話者。例如,將一句話從說話者 A 移到說話者 B。所有匯出的音軌和轉錄檔都會自動反映更正後的說話者指派。
分離後我可以重新指派說話者嗎?
這和 LALAL.AI 或 Moises 有什麼不同?
與專注於音樂的工具不同,Perso AI 將音訊分離、文字轉錄、說話者重新指派、雙重背景模式,以及選擇性音軌混音整合於同一個專案中——專為影片創作者與內容編輯人員打造,不僅僅是為了音樂人。
這和 LALAL.AI 或 Moises 有什麼不同?
背景音樂與帶有反應的背景有什麼差別?
Background Music 會移除所有人聲產生的聲音——包括說話、笑聲、掌聲、咳嗽等——只保留純背景音樂與環境音軌。Background with Reaction 則只會移除說話聲,同時保留笑聲與觀眾反應等人聲以外的聲音,非常適合維持直播錄音的自然氛圍。Perso AI 是唯一同時提供這兩種模式的工具。
背景音樂與帶有反應的背景有什麼差別?
分離後,我可以在背景模式之間切換嗎?
是的。當您上傳檔案時,Background Music 和 Background with Reaction 兩種音軌會同時產生。您可以預覽、比較並選擇任一模式——也可以在匯出時同時包含兩者。無需重新上傳或重新處理。
分離後,我可以在背景模式之間切換嗎?
探索我們的產品功能
探索我們的產品功能
ESTsoft Inc. 15770 Laguna Canyon Rd #250, Irvine, CA 92618
ESTsoft Inc. 15770 Laguna Canyon Rd #250, Irvine, CA 92618
ESTsoft Inc. 15770 Laguna Canyon Rd #250, Irvine, CA 92618
