如何下載您的 AI 配音影片:逐步指南(MP4、MP3、SRT)

人工智能視頻翻譯、定位和配音工具
免費試用
Perso AI 從單一配音專案即可輸出 10 個可下載檔案——不只是配音後的影片。你會取得配音後的 MP4、來源與翻譯音軌(WAV)、分離的說話者音訊(TAR)、獨立背景音樂(WAV)、來源與翻譯字幕(SRT),以及雙語腳本(XLSX)。Starter 方案每月 6.99 美元即可取得所有檔案。本指南將說明每個檔案是什麼、何時使用,以及如何下載。
從數據來看: 每個 AI 配音平台都會輸出配音後的影片。少數平台也會輸出字幕與音軌。Perso AI 可從每個配音專案輸出 10 種檔案類型——包括獨立背景音樂、雙語 XLSX 腳本,以及分離說話者音訊——而且全部都可從每月 6.99 美元的 Starter 方案取得。沒有 Enterprise 門檻。沒有額外加購費。
Perso AI 配音後會輸出哪些檔案?
以下是你在完成任何 Perso AI 配音專案後可下載的完整檔案清單:
# | 檔案 | 格式 | 內容 | 可從何方案取得 |
|---|---|---|---|---|
1 | 配音影片輸出 | MP4 | 完整影片,包含翻譯後的旁白、口型同步與原始畫面 | Starter(每月 6.99 美元) |
2 | 來源音訊輸出 | WAV | 從你上傳影片中擷取出的原始音軌 | Starter |
3 | 來源音訊(依說話者) | TAR | 從原始影片中依說話者分離出的個別音訊檔案 | Starter |
4 | 翻譯音訊輸出 | WAV | 僅有配音後的旁白音訊——沒有影片、沒有背景音樂 | Starter |
5 | 翻譯音訊(含 BGM) | WAV | 配音後旁白音訊,並混入原始背景音樂 | Starter |
6 | BGM 輸出 | WAV | 僅有獨立背景音樂——人聲已完全移除 | Starter |
7 | 來源字幕 | SRT | 原始語言的自動生成字幕 | Starter |
8 | 翻譯字幕 | SRT | 目標語言字幕,時間軸與配音音訊同步 | Starter |
9 | 來源腳本 | XLSX | 原始音訊的完整逐字稿,以試算表格式呈現 | Starter |
10 | 來源與翻譯腳本 | XLSX | 左右並列的雙語腳本——原文與譯文以平行欄位呈現 | Starter |
Perso AI 會自動產生全部 10 個檔案。沒有加購、沒有額外點數、也不需要其他工具。一個配音專案,10 種輸出。
一次配音即可看到你取得的每個檔案
1. 配音影片輸出(MP4)
它是什麼: 最終的配音影片——將原始畫面保留,並以翻譯後的旁白取代來源音訊。語音克隆可保留原始說話者的語氣、速度與節奏。口型同步會自動套用。
何時使用:
直接將配音版本發佈到 YouTube、TikTok 或你的 LMS
嵌入登陸頁或產品頁面,供不同市場使用
在發佈前分享給利害關係人審閱
有何不同: 口型同步是 Perso AI 配音工作流程中的可選步驟——使用者可自行決定專案何時需要它,結果會以單一 MP4 輸出交付。真正的差距其實在品質。多數提供口型同步的競品,仍會出現明顯的嘴型漂移、畫格不一致,或僵硬、機械式的動作,破壞觀眾信任。Perso AI 的口型同步經過精心設計,可經得起近距離檢視——嘴型精準、過渡自然、輸出可直接播出。
2. 來源音訊輸出(WAV)
它是什麼: 從你上傳影片中擷取出的原始音軌,以高品質 WAV 檔輸出。
何時使用:
在配音前先封存乾淨的原始音訊
在其他剪輯專案中使用原始旁白(Premiere Pro、DaVinci Resolve、Final Cut)
並排比較原始與配音後的音訊品質
3. 依說話者分離的來源音訊(TAR)
它是什麼: 一個壓縮封存檔,內含原始影片中偵測到的每位說話者的個別音訊檔。如果你的影片有 3 位說話者,你會得到 3 個分開的 WAV 檔。
何時使用:
需要獨立調整每位說話者音量或 EQ 的 Podcast 編輯者
訪談影片中,只需要重錄其中一位說話者,其他人維持不變
多說話者 QA——確認每位說話者的聲音是否正確克隆
這很重要的原因: 依說話者分離的音訊通常需要 Descript 或 Adobe Podcast 這類專用工具。Perso AI 會在每個配音專案中自動包含這項功能。若想深入了解,請參閱如何從影片匯出依說話者分離的音訊。
4. 翻譯音訊輸出(WAV)
它是什麼: 僅有配音後的旁白音訊——沒有影片、沒有背景音樂。只有翻譯後的語音軌。
何時使用:
Podcast 在地化:以其他語言發佈僅音訊版本
在自己的剪輯時間軸中替換音訊(Premiere、Final Cut),進行客製化後製
僅旁白的發佈用途,例如廣播、內部訓練音訊或有聲書風格內容
專業提示: 如果你要在自己的 NLE 中重新剪輯,請分別下載「翻譯音訊(不含 BGM)」與「BGM 輸出」。這樣你就能完整控制人聲與音樂的混音比例。完整流程請參閱如何在不含影片的情況下下載配音音訊。
5. 含 BGM 的翻譯音訊(WAV)
它是什麼: 將配音後的旁白與原始背景音樂混音在一起——可直接作為完整音訊軌使用,不含影片。
何時使用:
以音訊為優先的發佈方式(Podcast、內部溝通、音訊電子報),你希望保留完整的「製作感」
快速交付:不需要手動混音,BGM 平衡已經設定完成
保留背景音樂的社群媒體音訊短片
6. BGM 輸出(WAV)
它是什麼: 從原始影片中分離出的背景音樂——所有人聲都已移除。僅保留乾淨的純音樂音軌。
何時使用:
在 DAW 或剪輯軟體中,以自訂的人聲與音樂比例重新混音配音音訊
將原始 BGM 用於宣傳短片、預告片或精華剪輯
確認 AI 是否正確將音樂與語音分離(QA 步驟)
為何這很少見: 沒有其他 AI 配音平台會單獨輸出 BGM。Perso AI 的音訊分離引擎會在處理過程中將人聲與背景音樂分離,並提供兩者作為獨立下載檔。完整指南請參閱如何使用 AI 從影片中擷取背景音樂。
7. 來源字幕(SRT)
它是什麼: 影片原始語言的自動生成字幕,並以標準 SRT 檔輸出。Perso AI 的語音辨識可支援 100 種語言的轉錄。
何時使用:
為 YouTube 或 Vimeo 上的原始影片加入隱藏式字幕
為現有內容提供無障礙合規(ADA、WCAG)
將 SRT 輸入其他翻譯工具或工作流程
SEO:將 SRT 上傳到 YouTube 可提升原始語言的可搜尋性
格式細節: 標準 SRT,包含序號、時間戳(HH:MM:SS,mmm)與字幕文字。可相容於 YouTube、Vimeo、Premiere Pro、Final Cut、DaVinci Resolve,以及所有主流影片平台。完整的 SRT 工作流程請參閱如何從任何影片自動生成 SRT 字幕。
8. 翻譯字幕(SRT)
它是什麼: 目標語言字幕,時間軸與配音音訊的實際時間同步——而不是與原始語音時間同步。
何時使用:
雙語發佈:將來源字幕與翻譯字幕一起上傳到 YouTube,作為多重字幕軌
目標市場的無障礙使用
燒錄字幕工作流程:使用 FFmpeg 或你的編輯器將字幕硬編碼進影片
與競品的關鍵差異: 許多字幕翻譯工具會產生翻譯文字,但不會調整時間以符合配音節奏。Perso AI 的翻譯 SRT 會與實際的配音旁白同步,因此字幕會在正確的時刻出現——而不是原始說話者開口的時間。
9. 來源腳本(XLSX)
它是什麼: 你原始影片的完整逐字稿,以試算表形式輸出。每一列對應一個片段,欄位包含時間戳、說話者標籤與轉錄文字。
何時使用:
內容再利用:把影片腳本轉成部落格文章、社群貼文或電子郵件文案
法律/合規審查原始錄音中實際說了什麼
可搜尋的檔案:XLSX 容易搜尋、排序與篩選
10. 來源與翻譯腳本(XLSX)
它是什麼: 一份雙語試算表,原文與譯文並排呈現。每一列都顯示同一片段的兩種語言,並包含時間戳與說話者標籤。
何時使用:
翻譯 QA: 審核者可逐行檢查兩個版本,而不必在檔案間切換
語言學習內容: 教學者將雙語腳本作為學習材料
在地化團隊交接: 專案經理將 XLSX 分享給無法存取 Perso AI 的在地審核者
合規文件: 受監管產業(醫療、法律、金融)保留說了什麼以及如何翻譯的雙語紀錄
為什麼是 XLSX 而不是 PDF? 試算表可編輯、可排序、可篩選。如果審核者在第 47 列標記了翻譯問題,編輯者可以直接跳到 Perso AI 編輯器中的該時間戳並修正該行。請參閱雙語腳本輸出:並列翻譯用於 QA 與學習,以了解使用情境與工作流程。
如何下載你的檔案:3 個步驟
步驟 1. 在 Perso AI 中完成你的配音專案(上傳 > 選擇語言 > 處理)。
步驟 2. 在專案結果頁面點擊 Download 按鈕。下拉選單會顯示所有可用的檔案類型。
步驟 3. 選擇你需要的檔案。每個檔案都會個別下載,因此你可以精準選取所需內容,不必下載整包封存檔。
全部 10 種檔案類型都可從 Starter 方案(每月 6.99 美元) 起取得。Free 方案不包含檔案輸出。
競品會輸出哪些檔案?
檔案類型 | Perso AI | ElevenLabs | Descript | HeyGen | Synthesia | Rask AI |
|---|---|---|---|---|---|---|
配音影片(MP4) | 是 | 是 | 是 | 是 | 是 | 是 |
來源音訊(WAV) | 是 | 是 | 是 | 部分 | 是 | 否 |
依說話者分離的音訊 | 是(TAR) | 是(ZIP) | 手動變通 | 否 | 否 | 否 |
僅翻譯音訊 | 是 | 是 | 間接 | 部分 | 否 | 部分 |
翻譯音訊 + BGM | 是 | 是 | 否 | 否 | 否 | 否 |
BGM 輸出(獨立) | 是 | 否 | 否 | 否 | 否 | 否 |
來源字幕(SRT) | 是 | 是 | 是(SRT/VTT) | 是(Pro+) | 是(SRT/VTT) | 是 |
翻譯字幕(SRT) | 是 | 是 | 是(SRT/VTT) | 是(SRT/VTT/ASS) | 是(依語言) | 是 |
來源腳本 | 是(XLSX) | 是(CSV/TXT) | 是(TXT/DOCX/MD) | 是(XLSX,Pro+) | XLIFF(Enterprise) | 是(TXT/DOCX) |
雙語腳本 | 是(XLSX) | 是(CSV) | 否 | 否 | 否 | 否 |
已確認的輸出類型 | 10 | 8-9 | 6-7 | 5-6 | 5-6 | 4-5 |
Perso AI 的優勢在哪裡
ElevenLabs 最接近,提供 8-9 種輸出類型,包括依說話者分離的 WAV 音軌與 CSV 雙語腳本。但仍有三個差異:
1. 只有 Perso AI 提供 BGM 輸出。 這份清單中沒有其他平台能讓你把獨立背景音樂下載成單獨的 WAV 檔。對於需要以自訂的人聲與音樂比例重新混音配音音訊的創作者來說,這是唯一不需要額外音軌分離工具的選擇。
2. 每月 6.99 美元即可取得所有檔案。 ElevenLabs 會將部分輸出限制在更高方案。HeyGen 需要 Pro+ 才能取得 SRT 與腳本下載。Synthesia 則將腳本輸出(XLIFF)限制在 Enterprise。Perso AI 讓 Starter 方案即可取得全部 10 個檔案。
3. 使用 XLSX,而不是 CSV。 ElevenLabs 以 CSV 輸出雙語腳本——對開發者很實用,但對行銷團隊、翻譯者與專案經理來說不夠直覺。Perso AI 以具結構的欄位輸出 XLSX,可直接在 Excel 或 Google 試算表中開啟,不需要轉換。
常見問題
Q. Starter 方案是否包含全部 10 種下載檔案,還是有些需要更高階方案?
Starter 方案(每月 6.99 美元)即可取得全部 10 種檔案類型。沒有任何單檔費用或額外加購費。唯一受方案層級限制的功能是 SRT Upload(在配音前自訂匯入字幕),且僅限 Enterprise 方案提供。相較之下,HeyGen 將 SRT 與腳本輸出限制在 Pro+,而 Synthesia 則把腳本輸出限制在 Enterprise。
Q. 我可以下載幾週前完成的專案檔案嗎?
可以。所有已完成的專案及其可下載檔案都會保留在你的 Perso AI 儀表板中。你可以隨時回到任何過去的專案,下載 10 種檔案類型中的任一種。
Q. WAV 輸出的音訊品質如何?
Perso AI 會以來源品質層級輸出 WAV 檔。WAV 是未壓縮的無損格式,因此不會因壓縮而造成品質損失。這使得輸出檔非常適合在 DAW 與影片編輯器中進行專業後製流程。
開始輸出不只是影片的內容
一個配音專案。十個檔案。影片、音訊、字幕、腳本——你需要的一切,讓內容可重新運用到受眾使用的各種格式中。
免費試用 Perso AI 無需信用卡。Starter 可輸出 10 種類型。支援 33+ 種配音語言。
內部連結:
Perso AI 從單一配音專案即可輸出 10 個可下載檔案——不只是配音後的影片。你會取得配音後的 MP4、來源與翻譯音軌(WAV)、分離的說話者音訊(TAR)、獨立背景音樂(WAV)、來源與翻譯字幕(SRT),以及雙語腳本(XLSX)。Starter 方案每月 6.99 美元即可取得所有檔案。本指南將說明每個檔案是什麼、何時使用,以及如何下載。
從數據來看: 每個 AI 配音平台都會輸出配音後的影片。少數平台也會輸出字幕與音軌。Perso AI 可從每個配音專案輸出 10 種檔案類型——包括獨立背景音樂、雙語 XLSX 腳本,以及分離說話者音訊——而且全部都可從每月 6.99 美元的 Starter 方案取得。沒有 Enterprise 門檻。沒有額外加購費。
Perso AI 配音後會輸出哪些檔案?
以下是你在完成任何 Perso AI 配音專案後可下載的完整檔案清單:
# | 檔案 | 格式 | 內容 | 可從何方案取得 |
|---|---|---|---|---|
1 | 配音影片輸出 | MP4 | 完整影片,包含翻譯後的旁白、口型同步與原始畫面 | Starter(每月 6.99 美元) |
2 | 來源音訊輸出 | WAV | 從你上傳影片中擷取出的原始音軌 | Starter |
3 | 來源音訊(依說話者) | TAR | 從原始影片中依說話者分離出的個別音訊檔案 | Starter |
4 | 翻譯音訊輸出 | WAV | 僅有配音後的旁白音訊——沒有影片、沒有背景音樂 | Starter |
5 | 翻譯音訊(含 BGM) | WAV | 配音後旁白音訊,並混入原始背景音樂 | Starter |
6 | BGM 輸出 | WAV | 僅有獨立背景音樂——人聲已完全移除 | Starter |
7 | 來源字幕 | SRT | 原始語言的自動生成字幕 | Starter |
8 | 翻譯字幕 | SRT | 目標語言字幕,時間軸與配音音訊同步 | Starter |
9 | 來源腳本 | XLSX | 原始音訊的完整逐字稿,以試算表格式呈現 | Starter |
10 | 來源與翻譯腳本 | XLSX | 左右並列的雙語腳本——原文與譯文以平行欄位呈現 | Starter |
Perso AI 會自動產生全部 10 個檔案。沒有加購、沒有額外點數、也不需要其他工具。一個配音專案,10 種輸出。
一次配音即可看到你取得的每個檔案
1. 配音影片輸出(MP4)
它是什麼: 最終的配音影片——將原始畫面保留,並以翻譯後的旁白取代來源音訊。語音克隆可保留原始說話者的語氣、速度與節奏。口型同步會自動套用。
何時使用:
直接將配音版本發佈到 YouTube、TikTok 或你的 LMS
嵌入登陸頁或產品頁面,供不同市場使用
在發佈前分享給利害關係人審閱
有何不同: 口型同步是 Perso AI 配音工作流程中的可選步驟——使用者可自行決定專案何時需要它,結果會以單一 MP4 輸出交付。真正的差距其實在品質。多數提供口型同步的競品,仍會出現明顯的嘴型漂移、畫格不一致,或僵硬、機械式的動作,破壞觀眾信任。Perso AI 的口型同步經過精心設計,可經得起近距離檢視——嘴型精準、過渡自然、輸出可直接播出。
2. 來源音訊輸出(WAV)
它是什麼: 從你上傳影片中擷取出的原始音軌,以高品質 WAV 檔輸出。
何時使用:
在配音前先封存乾淨的原始音訊
在其他剪輯專案中使用原始旁白(Premiere Pro、DaVinci Resolve、Final Cut)
並排比較原始與配音後的音訊品質
3. 依說話者分離的來源音訊(TAR)
它是什麼: 一個壓縮封存檔,內含原始影片中偵測到的每位說話者的個別音訊檔。如果你的影片有 3 位說話者,你會得到 3 個分開的 WAV 檔。
何時使用:
需要獨立調整每位說話者音量或 EQ 的 Podcast 編輯者
訪談影片中,只需要重錄其中一位說話者,其他人維持不變
多說話者 QA——確認每位說話者的聲音是否正確克隆
這很重要的原因: 依說話者分離的音訊通常需要 Descript 或 Adobe Podcast 這類專用工具。Perso AI 會在每個配音專案中自動包含這項功能。若想深入了解,請參閱如何從影片匯出依說話者分離的音訊。
4. 翻譯音訊輸出(WAV)
它是什麼: 僅有配音後的旁白音訊——沒有影片、沒有背景音樂。只有翻譯後的語音軌。
何時使用:
Podcast 在地化:以其他語言發佈僅音訊版本
在自己的剪輯時間軸中替換音訊(Premiere、Final Cut),進行客製化後製
僅旁白的發佈用途,例如廣播、內部訓練音訊或有聲書風格內容
專業提示: 如果你要在自己的 NLE 中重新剪輯,請分別下載「翻譯音訊(不含 BGM)」與「BGM 輸出」。這樣你就能完整控制人聲與音樂的混音比例。完整流程請參閱如何在不含影片的情況下下載配音音訊。
5. 含 BGM 的翻譯音訊(WAV)
它是什麼: 將配音後的旁白與原始背景音樂混音在一起——可直接作為完整音訊軌使用,不含影片。
何時使用:
以音訊為優先的發佈方式(Podcast、內部溝通、音訊電子報),你希望保留完整的「製作感」
快速交付:不需要手動混音,BGM 平衡已經設定完成
保留背景音樂的社群媒體音訊短片
6. BGM 輸出(WAV)
它是什麼: 從原始影片中分離出的背景音樂——所有人聲都已移除。僅保留乾淨的純音樂音軌。
何時使用:
在 DAW 或剪輯軟體中,以自訂的人聲與音樂比例重新混音配音音訊
將原始 BGM 用於宣傳短片、預告片或精華剪輯
確認 AI 是否正確將音樂與語音分離(QA 步驟)
為何這很少見: 沒有其他 AI 配音平台會單獨輸出 BGM。Perso AI 的音訊分離引擎會在處理過程中將人聲與背景音樂分離,並提供兩者作為獨立下載檔。完整指南請參閱如何使用 AI 從影片中擷取背景音樂。
7. 來源字幕(SRT)
它是什麼: 影片原始語言的自動生成字幕,並以標準 SRT 檔輸出。Perso AI 的語音辨識可支援 100 種語言的轉錄。
何時使用:
為 YouTube 或 Vimeo 上的原始影片加入隱藏式字幕
為現有內容提供無障礙合規(ADA、WCAG)
將 SRT 輸入其他翻譯工具或工作流程
SEO:將 SRT 上傳到 YouTube 可提升原始語言的可搜尋性
格式細節: 標準 SRT,包含序號、時間戳(HH:MM:SS,mmm)與字幕文字。可相容於 YouTube、Vimeo、Premiere Pro、Final Cut、DaVinci Resolve,以及所有主流影片平台。完整的 SRT 工作流程請參閱如何從任何影片自動生成 SRT 字幕。
8. 翻譯字幕(SRT)
它是什麼: 目標語言字幕,時間軸與配音音訊的實際時間同步——而不是與原始語音時間同步。
何時使用:
雙語發佈:將來源字幕與翻譯字幕一起上傳到 YouTube,作為多重字幕軌
目標市場的無障礙使用
燒錄字幕工作流程:使用 FFmpeg 或你的編輯器將字幕硬編碼進影片
與競品的關鍵差異: 許多字幕翻譯工具會產生翻譯文字,但不會調整時間以符合配音節奏。Perso AI 的翻譯 SRT 會與實際的配音旁白同步,因此字幕會在正確的時刻出現——而不是原始說話者開口的時間。
9. 來源腳本(XLSX)
它是什麼: 你原始影片的完整逐字稿,以試算表形式輸出。每一列對應一個片段,欄位包含時間戳、說話者標籤與轉錄文字。
何時使用:
內容再利用:把影片腳本轉成部落格文章、社群貼文或電子郵件文案
法律/合規審查原始錄音中實際說了什麼
可搜尋的檔案:XLSX 容易搜尋、排序與篩選
10. 來源與翻譯腳本(XLSX)
它是什麼: 一份雙語試算表,原文與譯文並排呈現。每一列都顯示同一片段的兩種語言,並包含時間戳與說話者標籤。
何時使用:
翻譯 QA: 審核者可逐行檢查兩個版本,而不必在檔案間切換
語言學習內容: 教學者將雙語腳本作為學習材料
在地化團隊交接: 專案經理將 XLSX 分享給無法存取 Perso AI 的在地審核者
合規文件: 受監管產業(醫療、法律、金融)保留說了什麼以及如何翻譯的雙語紀錄
為什麼是 XLSX 而不是 PDF? 試算表可編輯、可排序、可篩選。如果審核者在第 47 列標記了翻譯問題,編輯者可以直接跳到 Perso AI 編輯器中的該時間戳並修正該行。請參閱雙語腳本輸出:並列翻譯用於 QA 與學習,以了解使用情境與工作流程。
如何下載你的檔案:3 個步驟
步驟 1. 在 Perso AI 中完成你的配音專案(上傳 > 選擇語言 > 處理)。
步驟 2. 在專案結果頁面點擊 Download 按鈕。下拉選單會顯示所有可用的檔案類型。
步驟 3. 選擇你需要的檔案。每個檔案都會個別下載,因此你可以精準選取所需內容,不必下載整包封存檔。
全部 10 種檔案類型都可從 Starter 方案(每月 6.99 美元) 起取得。Free 方案不包含檔案輸出。
競品會輸出哪些檔案?
檔案類型 | Perso AI | ElevenLabs | Descript | HeyGen | Synthesia | Rask AI |
|---|---|---|---|---|---|---|
配音影片(MP4) | 是 | 是 | 是 | 是 | 是 | 是 |
來源音訊(WAV) | 是 | 是 | 是 | 部分 | 是 | 否 |
依說話者分離的音訊 | 是(TAR) | 是(ZIP) | 手動變通 | 否 | 否 | 否 |
僅翻譯音訊 | 是 | 是 | 間接 | 部分 | 否 | 部分 |
翻譯音訊 + BGM | 是 | 是 | 否 | 否 | 否 | 否 |
BGM 輸出(獨立) | 是 | 否 | 否 | 否 | 否 | 否 |
來源字幕(SRT) | 是 | 是 | 是(SRT/VTT) | 是(Pro+) | 是(SRT/VTT) | 是 |
翻譯字幕(SRT) | 是 | 是 | 是(SRT/VTT) | 是(SRT/VTT/ASS) | 是(依語言) | 是 |
來源腳本 | 是(XLSX) | 是(CSV/TXT) | 是(TXT/DOCX/MD) | 是(XLSX,Pro+) | XLIFF(Enterprise) | 是(TXT/DOCX) |
雙語腳本 | 是(XLSX) | 是(CSV) | 否 | 否 | 否 | 否 |
已確認的輸出類型 | 10 | 8-9 | 6-7 | 5-6 | 5-6 | 4-5 |
Perso AI 的優勢在哪裡
ElevenLabs 最接近,提供 8-9 種輸出類型,包括依說話者分離的 WAV 音軌與 CSV 雙語腳本。但仍有三個差異:
1. 只有 Perso AI 提供 BGM 輸出。 這份清單中沒有其他平台能讓你把獨立背景音樂下載成單獨的 WAV 檔。對於需要以自訂的人聲與音樂比例重新混音配音音訊的創作者來說,這是唯一不需要額外音軌分離工具的選擇。
2. 每月 6.99 美元即可取得所有檔案。 ElevenLabs 會將部分輸出限制在更高方案。HeyGen 需要 Pro+ 才能取得 SRT 與腳本下載。Synthesia 則將腳本輸出(XLIFF)限制在 Enterprise。Perso AI 讓 Starter 方案即可取得全部 10 個檔案。
3. 使用 XLSX,而不是 CSV。 ElevenLabs 以 CSV 輸出雙語腳本——對開發者很實用,但對行銷團隊、翻譯者與專案經理來說不夠直覺。Perso AI 以具結構的欄位輸出 XLSX,可直接在 Excel 或 Google 試算表中開啟,不需要轉換。
常見問題
Q. Starter 方案是否包含全部 10 種下載檔案,還是有些需要更高階方案?
Starter 方案(每月 6.99 美元)即可取得全部 10 種檔案類型。沒有任何單檔費用或額外加購費。唯一受方案層級限制的功能是 SRT Upload(在配音前自訂匯入字幕),且僅限 Enterprise 方案提供。相較之下,HeyGen 將 SRT 與腳本輸出限制在 Pro+,而 Synthesia 則把腳本輸出限制在 Enterprise。
Q. 我可以下載幾週前完成的專案檔案嗎?
可以。所有已完成的專案及其可下載檔案都會保留在你的 Perso AI 儀表板中。你可以隨時回到任何過去的專案,下載 10 種檔案類型中的任一種。
Q. WAV 輸出的音訊品質如何?
Perso AI 會以來源品質層級輸出 WAV 檔。WAV 是未壓縮的無損格式,因此不會因壓縮而造成品質損失。這使得輸出檔非常適合在 DAW 與影片編輯器中進行專業後製流程。
開始輸出不只是影片的內容
一個配音專案。十個檔案。影片、音訊、字幕、腳本——你需要的一切,讓內容可重新運用到受眾使用的各種格式中。
免費試用 Perso AI 無需信用卡。Starter 可輸出 10 種類型。支援 33+ 種配音語言。
內部連結:
繼續閱讀
瀏覽全部
ESTsoft Inc. 15770 Laguna Canyon Rd #250, Irvine, CA 92618
ESTsoft Inc. 15770 Laguna Canyon Rd #250, Irvine, CA 92618
ESTsoft Inc. 15770 Laguna Canyon Rd #250, Irvine, CA 92618





