產品指南

如何下載您的 AI 配音影片:逐步指南(MP4、MP3、SRT)

跳到部分

跳到部分

分享

分享

分享

人工智能視頻翻譯、定位和配音工具

免費試用

Perso AI 從單一配音專案即可輸出 10 個可下載檔案——不只是配音後的影片。你會取得配音後的 MP4、來源與翻譯音軌(WAV)、分離的說話者音訊(TAR)、獨立背景音樂(WAV)、來源與翻譯字幕(SRT),以及雙語腳本(XLSX)。Starter 方案每月 6.99 美元即可取得所有檔案。本指南將說明每個檔案是什麼、何時使用,以及如何下載。

從數據來看: 每個 AI 配音平台都會輸出配音後的影片。少數平台也會輸出字幕與音軌。Perso AI 可從每個配音專案輸出 10 種檔案類型——包括獨立背景音樂、雙語 XLSX 腳本,以及分離說話者音訊——而且全部都可從每月 6.99 美元的 Starter 方案取得。沒有 Enterprise 門檻。沒有額外加購費。

Perso AI 配音後會輸出哪些檔案?

以下是你在完成任何 Perso AI 配音專案後可下載的完整檔案清單:

#

檔案

格式

內容

可從何方案取得

1

配音影片輸出

MP4

完整影片,包含翻譯後的旁白、口型同步與原始畫面

Starter(每月 6.99 美元)

2

來源音訊輸出

WAV

從你上傳影片中擷取出的原始音軌

Starter

3

來源音訊(依說話者)

TAR

從原始影片中依說話者分離出的個別音訊檔案

Starter

4

翻譯音訊輸出

WAV

僅有配音後的旁白音訊——沒有影片、沒有背景音樂

Starter

5

翻譯音訊(含 BGM)

WAV

配音後旁白音訊,並混入原始背景音樂

Starter

6

BGM 輸出

WAV

僅有獨立背景音樂——人聲已完全移除

Starter

7

來源字幕

SRT

原始語言的自動生成字幕

Starter

8

翻譯字幕

SRT

目標語言字幕,時間軸與配音音訊同步

Starter

9

來源腳本

XLSX

原始音訊的完整逐字稿,以試算表格式呈現

Starter

10

來源與翻譯腳本

XLSX

左右並列的雙語腳本——原文與譯文以平行欄位呈現

Starter

Perso AI 會自動產生全部 10 個檔案。沒有加購、沒有額外點數、也不需要其他工具。一個配音專案,10 種輸出。

一次配音即可看到你取得的每個檔案

1. 配音影片輸出(MP4)

它是什麼: 最終的配音影片——將原始畫面保留,並以翻譯後的旁白取代來源音訊。語音克隆可保留原始說話者的語氣、速度與節奏。口型同步會自動套用。

何時使用:

  • 直接將配音版本發佈到 YouTube、TikTok 或你的 LMS

  • 嵌入登陸頁或產品頁面,供不同市場使用

  • 在發佈前分享給利害關係人審閱

有何不同: 口型同步是 Perso AI 配音工作流程中的可選步驟——使用者可自行決定專案何時需要它,結果會以單一 MP4 輸出交付。真正的差距其實在品質。多數提供口型同步的競品,仍會出現明顯的嘴型漂移、畫格不一致,或僵硬、機械式的動作,破壞觀眾信任。Perso AI 的口型同步經過精心設計,可經得起近距離檢視——嘴型精準、過渡自然、輸出可直接播出。

2. 來源音訊輸出(WAV)

它是什麼: 從你上傳影片中擷取出的原始音軌,以高品質 WAV 檔輸出。

何時使用:

  • 在配音前先封存乾淨的原始音訊

  • 在其他剪輯專案中使用原始旁白(Premiere Pro、DaVinci Resolve、Final Cut)

  • 並排比較原始與配音後的音訊品質

3. 依說話者分離的來源音訊(TAR)

它是什麼: 一個壓縮封存檔,內含原始影片中偵測到的每位說話者的個別音訊檔。如果你的影片有 3 位說話者,你會得到 3 個分開的 WAV 檔。

何時使用:

  • 需要獨立調整每位說話者音量或 EQ 的 Podcast 編輯者

  • 訪談影片中,只需要重錄其中一位說話者,其他人維持不變

  • 多說話者 QA——確認每位說話者的聲音是否正確克隆

這很重要的原因: 依說話者分離的音訊通常需要 Descript 或 Adobe Podcast 這類專用工具。Perso AI 會在每個配音專案中自動包含這項功能。若想深入了解,請參閱如何從影片匯出依說話者分離的音訊。

4. 翻譯音訊輸出(WAV)

它是什麼: 僅有配音後的旁白音訊——沒有影片、沒有背景音樂。只有翻譯後的語音軌。

何時使用:

  • Podcast 在地化:以其他語言發佈僅音訊版本

  • 在自己的剪輯時間軸中替換音訊(Premiere、Final Cut),進行客製化後製

  • 僅旁白的發佈用途,例如廣播、內部訓練音訊或有聲書風格內容

專業提示: 如果你要在自己的 NLE 中重新剪輯,請分別下載「翻譯音訊(不含 BGM)」與「BGM 輸出」。這樣你就能完整控制人聲與音樂的混音比例。完整流程請參閱如何在不含影片的情況下下載配音音訊。

5. 含 BGM 的翻譯音訊(WAV)

它是什麼: 將配音後的旁白與原始背景音樂混音在一起——可直接作為完整音訊軌使用,不含影片。

何時使用:

  • 以音訊為優先的發佈方式(Podcast、內部溝通、音訊電子報),你希望保留完整的「製作感」

  • 快速交付:不需要手動混音,BGM 平衡已經設定完成

  • 保留背景音樂的社群媒體音訊短片

6. BGM 輸出(WAV)

它是什麼: 從原始影片中分離出的背景音樂——所有人聲都已移除。僅保留乾淨的純音樂音軌。

何時使用:

  • 在 DAW 或剪輯軟體中,以自訂的人聲與音樂比例重新混音配音音訊

  • 將原始 BGM 用於宣傳短片、預告片或精華剪輯

  • 確認 AI 是否正確將音樂與語音分離(QA 步驟)

為何這很少見: 沒有其他 AI 配音平台會單獨輸出 BGM。Perso AI 的音訊分離引擎會在處理過程中將人聲與背景音樂分離,並提供兩者作為獨立下載檔。完整指南請參閱如何使用 AI 從影片中擷取背景音樂。

7. 來源字幕(SRT)

它是什麼: 影片原始語言的自動生成字幕,並以標準 SRT 檔輸出。Perso AI 的語音辨識可支援 100 種語言的轉錄。

何時使用:

  • 為 YouTube 或 Vimeo 上的原始影片加入隱藏式字幕

  • 為現有內容提供無障礙合規(ADA、WCAG)

  • 將 SRT 輸入其他翻譯工具或工作流程

  • SEO:將 SRT 上傳到 YouTube 可提升原始語言的可搜尋性

格式細節: 標準 SRT,包含序號、時間戳(HH:MM:SS,mmm)與字幕文字。可相容於 YouTube、Vimeo、Premiere Pro、Final Cut、DaVinci Resolve,以及所有主流影片平台。完整的 SRT 工作流程請參閱如何從任何影片自動生成 SRT 字幕。

8. 翻譯字幕(SRT)

它是什麼: 目標語言字幕,時間軸與配音音訊的實際時間同步——而不是與原始語音時間同步。

何時使用:

  • 雙語發佈:將來源字幕與翻譯字幕一起上傳到 YouTube,作為多重字幕軌

  • 目標市場的無障礙使用

  • 燒錄字幕工作流程:使用 FFmpeg 或你的編輯器將字幕硬編碼進影片

與競品的關鍵差異: 許多字幕翻譯工具會產生翻譯文字,但不會調整時間以符合配音節奏。Perso AI 的翻譯 SRT 會與實際的配音旁白同步,因此字幕會在正確的時刻出現——而不是原始說話者開口的時間。

9. 來源腳本(XLSX)

它是什麼: 你原始影片的完整逐字稿,以試算表形式輸出。每一列對應一個片段,欄位包含時間戳、說話者標籤與轉錄文字。

何時使用:

  • 內容再利用:把影片腳本轉成部落格文章、社群貼文或電子郵件文案

  • 法律/合規審查原始錄音中實際說了什麼

  • 可搜尋的檔案:XLSX 容易搜尋、排序與篩選

10. 來源與翻譯腳本(XLSX)

它是什麼: 一份雙語試算表,原文與譯文並排呈現。每一列都顯示同一片段的兩種語言,並包含時間戳與說話者標籤。

何時使用:

  • 翻譯 QA: 審核者可逐行檢查兩個版本,而不必在檔案間切換

  • 語言學習內容: 教學者將雙語腳本作為學習材料

  • 在地化團隊交接: 專案經理將 XLSX 分享給無法存取 Perso AI 的在地審核者

  • 合規文件: 受監管產業(醫療、法律、金融)保留說了什麼以及如何翻譯的雙語紀錄

為什麼是 XLSX 而不是 PDF? 試算表可編輯、可排序、可篩選。如果審核者在第 47 列標記了翻譯問題,編輯者可以直接跳到 Perso AI 編輯器中的該時間戳並修正該行。請參閱雙語腳本輸出:並列翻譯用於 QA 與學習,以了解使用情境與工作流程。

如何下載你的檔案:3 個步驟

步驟 1. 在 Perso AI 中完成你的配音專案(上傳 > 選擇語言 > 處理)。

步驟 2. 在專案結果頁面點擊 Download 按鈕。下拉選單會顯示所有可用的檔案類型。

步驟 3. 選擇你需要的檔案。每個檔案都會個別下載,因此你可以精準選取所需內容,不必下載整包封存檔。

全部 10 種檔案類型都可從 Starter 方案(每月 6.99 美元) 起取得。Free 方案不包含檔案輸出。

競品會輸出哪些檔案?

檔案類型

Perso AI

ElevenLabs

Descript

HeyGen

Synthesia

Rask AI

配音影片(MP4)

來源音訊(WAV)

部分

依說話者分離的音訊

是(TAR)

是(ZIP)

手動變通

僅翻譯音訊

間接

部分

部分

翻譯音訊 + BGM

BGM 輸出(獨立)

來源字幕(SRT)

是(SRT/VTT)

是(Pro+)

是(SRT/VTT)

翻譯字幕(SRT)

是(SRT/VTT)

是(SRT/VTT/ASS)

是(依語言)

來源腳本

是(XLSX)

是(CSV/TXT)

是(TXT/DOCX/MD)

是(XLSX,Pro+)

XLIFF(Enterprise)

是(TXT/DOCX)

雙語腳本

是(XLSX)

是(CSV)

已確認的輸出類型

10

8-9

6-7

5-6

5-6

4-5

Perso AI 的優勢在哪裡

ElevenLabs 最接近,提供 8-9 種輸出類型,包括依說話者分離的 WAV 音軌與 CSV 雙語腳本。但仍有三個差異:

1. 只有 Perso AI 提供 BGM 輸出。 這份清單中沒有其他平台能讓你把獨立背景音樂下載成單獨的 WAV 檔。對於需要以自訂的人聲與音樂比例重新混音配音音訊的創作者來說,這是唯一不需要額外音軌分離工具的選擇。

2. 每月 6.99 美元即可取得所有檔案。 ElevenLabs 會將部分輸出限制在更高方案。HeyGen 需要 Pro+ 才能取得 SRT 與腳本下載。Synthesia 則將腳本輸出(XLIFF)限制在 Enterprise。Perso AI 讓 Starter 方案即可取得全部 10 個檔案。

3. 使用 XLSX,而不是 CSV。 ElevenLabs 以 CSV 輸出雙語腳本——對開發者很實用,但對行銷團隊、翻譯者與專案經理來說不夠直覺。Perso AI 以具結構的欄位輸出 XLSX,可直接在 Excel 或 Google 試算表中開啟,不需要轉換。

常見問題

Q. Starter 方案是否包含全部 10 種下載檔案,還是有些需要更高階方案?

Starter 方案(每月 6.99 美元)即可取得全部 10 種檔案類型。沒有任何單檔費用或額外加購費。唯一受方案層級限制的功能是 SRT Upload(在配音前自訂匯入字幕),且僅限 Enterprise 方案提供。相較之下,HeyGen 將 SRT 與腳本輸出限制在 Pro+,而 Synthesia 則把腳本輸出限制在 Enterprise。

Q. 我可以下載幾週前完成的專案檔案嗎?

可以。所有已完成的專案及其可下載檔案都會保留在你的 Perso AI 儀表板中。你可以隨時回到任何過去的專案,下載 10 種檔案類型中的任一種。

Q. WAV 輸出的音訊品質如何?

Perso AI 會以來源品質層級輸出 WAV 檔。WAV 是未壓縮的無損格式,因此不會因壓縮而造成品質損失。這使得輸出檔非常適合在 DAW 與影片編輯器中進行專業後製流程。

開始輸出不只是影片的內容

一個配音專案。十個檔案。影片、音訊、字幕、腳本——你需要的一切,讓內容可重新運用到受眾使用的各種格式中。

免費試用 Perso AI 無需信用卡。Starter 可輸出 10 種類型。支援 33+ 種配音語言。

內部連結:

Perso AI 從單一配音專案即可輸出 10 個可下載檔案——不只是配音後的影片。你會取得配音後的 MP4、來源與翻譯音軌(WAV)、分離的說話者音訊(TAR)、獨立背景音樂(WAV)、來源與翻譯字幕(SRT),以及雙語腳本(XLSX)。Starter 方案每月 6.99 美元即可取得所有檔案。本指南將說明每個檔案是什麼、何時使用,以及如何下載。

從數據來看: 每個 AI 配音平台都會輸出配音後的影片。少數平台也會輸出字幕與音軌。Perso AI 可從每個配音專案輸出 10 種檔案類型——包括獨立背景音樂、雙語 XLSX 腳本,以及分離說話者音訊——而且全部都可從每月 6.99 美元的 Starter 方案取得。沒有 Enterprise 門檻。沒有額外加購費。

Perso AI 配音後會輸出哪些檔案?

以下是你在完成任何 Perso AI 配音專案後可下載的完整檔案清單:

#

檔案

格式

內容

可從何方案取得

1

配音影片輸出

MP4

完整影片,包含翻譯後的旁白、口型同步與原始畫面

Starter(每月 6.99 美元)

2

來源音訊輸出

WAV

從你上傳影片中擷取出的原始音軌

Starter

3

來源音訊(依說話者)

TAR

從原始影片中依說話者分離出的個別音訊檔案

Starter

4

翻譯音訊輸出

WAV

僅有配音後的旁白音訊——沒有影片、沒有背景音樂

Starter

5

翻譯音訊(含 BGM)

WAV

配音後旁白音訊,並混入原始背景音樂

Starter

6

BGM 輸出

WAV

僅有獨立背景音樂——人聲已完全移除

Starter

7

來源字幕

SRT

原始語言的自動生成字幕

Starter

8

翻譯字幕

SRT

目標語言字幕,時間軸與配音音訊同步

Starter

9

來源腳本

XLSX

原始音訊的完整逐字稿,以試算表格式呈現

Starter

10

來源與翻譯腳本

XLSX

左右並列的雙語腳本——原文與譯文以平行欄位呈現

Starter

Perso AI 會自動產生全部 10 個檔案。沒有加購、沒有額外點數、也不需要其他工具。一個配音專案,10 種輸出。

一次配音即可看到你取得的每個檔案

1. 配音影片輸出(MP4)

它是什麼: 最終的配音影片——將原始畫面保留,並以翻譯後的旁白取代來源音訊。語音克隆可保留原始說話者的語氣、速度與節奏。口型同步會自動套用。

何時使用:

  • 直接將配音版本發佈到 YouTube、TikTok 或你的 LMS

  • 嵌入登陸頁或產品頁面,供不同市場使用

  • 在發佈前分享給利害關係人審閱

有何不同: 口型同步是 Perso AI 配音工作流程中的可選步驟——使用者可自行決定專案何時需要它,結果會以單一 MP4 輸出交付。真正的差距其實在品質。多數提供口型同步的競品,仍會出現明顯的嘴型漂移、畫格不一致,或僵硬、機械式的動作,破壞觀眾信任。Perso AI 的口型同步經過精心設計,可經得起近距離檢視——嘴型精準、過渡自然、輸出可直接播出。

2. 來源音訊輸出(WAV)

它是什麼: 從你上傳影片中擷取出的原始音軌,以高品質 WAV 檔輸出。

何時使用:

  • 在配音前先封存乾淨的原始音訊

  • 在其他剪輯專案中使用原始旁白(Premiere Pro、DaVinci Resolve、Final Cut)

  • 並排比較原始與配音後的音訊品質

3. 依說話者分離的來源音訊(TAR)

它是什麼: 一個壓縮封存檔,內含原始影片中偵測到的每位說話者的個別音訊檔。如果你的影片有 3 位說話者,你會得到 3 個分開的 WAV 檔。

何時使用:

  • 需要獨立調整每位說話者音量或 EQ 的 Podcast 編輯者

  • 訪談影片中,只需要重錄其中一位說話者,其他人維持不變

  • 多說話者 QA——確認每位說話者的聲音是否正確克隆

這很重要的原因: 依說話者分離的音訊通常需要 Descript 或 Adobe Podcast 這類專用工具。Perso AI 會在每個配音專案中自動包含這項功能。若想深入了解,請參閱如何從影片匯出依說話者分離的音訊。

4. 翻譯音訊輸出(WAV)

它是什麼: 僅有配音後的旁白音訊——沒有影片、沒有背景音樂。只有翻譯後的語音軌。

何時使用:

  • Podcast 在地化:以其他語言發佈僅音訊版本

  • 在自己的剪輯時間軸中替換音訊(Premiere、Final Cut),進行客製化後製

  • 僅旁白的發佈用途,例如廣播、內部訓練音訊或有聲書風格內容

專業提示: 如果你要在自己的 NLE 中重新剪輯,請分別下載「翻譯音訊(不含 BGM)」與「BGM 輸出」。這樣你就能完整控制人聲與音樂的混音比例。完整流程請參閱如何在不含影片的情況下下載配音音訊。

5. 含 BGM 的翻譯音訊(WAV)

它是什麼: 將配音後的旁白與原始背景音樂混音在一起——可直接作為完整音訊軌使用,不含影片。

何時使用:

  • 以音訊為優先的發佈方式(Podcast、內部溝通、音訊電子報),你希望保留完整的「製作感」

  • 快速交付:不需要手動混音,BGM 平衡已經設定完成

  • 保留背景音樂的社群媒體音訊短片

6. BGM 輸出(WAV)

它是什麼: 從原始影片中分離出的背景音樂——所有人聲都已移除。僅保留乾淨的純音樂音軌。

何時使用:

  • 在 DAW 或剪輯軟體中,以自訂的人聲與音樂比例重新混音配音音訊

  • 將原始 BGM 用於宣傳短片、預告片或精華剪輯

  • 確認 AI 是否正確將音樂與語音分離(QA 步驟)

為何這很少見: 沒有其他 AI 配音平台會單獨輸出 BGM。Perso AI 的音訊分離引擎會在處理過程中將人聲與背景音樂分離,並提供兩者作為獨立下載檔。完整指南請參閱如何使用 AI 從影片中擷取背景音樂。

7. 來源字幕(SRT)

它是什麼: 影片原始語言的自動生成字幕,並以標準 SRT 檔輸出。Perso AI 的語音辨識可支援 100 種語言的轉錄。

何時使用:

  • 為 YouTube 或 Vimeo 上的原始影片加入隱藏式字幕

  • 為現有內容提供無障礙合規(ADA、WCAG)

  • 將 SRT 輸入其他翻譯工具或工作流程

  • SEO:將 SRT 上傳到 YouTube 可提升原始語言的可搜尋性

格式細節: 標準 SRT,包含序號、時間戳(HH:MM:SS,mmm)與字幕文字。可相容於 YouTube、Vimeo、Premiere Pro、Final Cut、DaVinci Resolve,以及所有主流影片平台。完整的 SRT 工作流程請參閱如何從任何影片自動生成 SRT 字幕。

8. 翻譯字幕(SRT)

它是什麼: 目標語言字幕,時間軸與配音音訊的實際時間同步——而不是與原始語音時間同步。

何時使用:

  • 雙語發佈:將來源字幕與翻譯字幕一起上傳到 YouTube,作為多重字幕軌

  • 目標市場的無障礙使用

  • 燒錄字幕工作流程:使用 FFmpeg 或你的編輯器將字幕硬編碼進影片

與競品的關鍵差異: 許多字幕翻譯工具會產生翻譯文字,但不會調整時間以符合配音節奏。Perso AI 的翻譯 SRT 會與實際的配音旁白同步,因此字幕會在正確的時刻出現——而不是原始說話者開口的時間。

9. 來源腳本(XLSX)

它是什麼: 你原始影片的完整逐字稿,以試算表形式輸出。每一列對應一個片段,欄位包含時間戳、說話者標籤與轉錄文字。

何時使用:

  • 內容再利用:把影片腳本轉成部落格文章、社群貼文或電子郵件文案

  • 法律/合規審查原始錄音中實際說了什麼

  • 可搜尋的檔案:XLSX 容易搜尋、排序與篩選

10. 來源與翻譯腳本(XLSX)

它是什麼: 一份雙語試算表,原文與譯文並排呈現。每一列都顯示同一片段的兩種語言,並包含時間戳與說話者標籤。

何時使用:

  • 翻譯 QA: 審核者可逐行檢查兩個版本,而不必在檔案間切換

  • 語言學習內容: 教學者將雙語腳本作為學習材料

  • 在地化團隊交接: 專案經理將 XLSX 分享給無法存取 Perso AI 的在地審核者

  • 合規文件: 受監管產業(醫療、法律、金融)保留說了什麼以及如何翻譯的雙語紀錄

為什麼是 XLSX 而不是 PDF? 試算表可編輯、可排序、可篩選。如果審核者在第 47 列標記了翻譯問題,編輯者可以直接跳到 Perso AI 編輯器中的該時間戳並修正該行。請參閱雙語腳本輸出:並列翻譯用於 QA 與學習,以了解使用情境與工作流程。

如何下載你的檔案:3 個步驟

步驟 1. 在 Perso AI 中完成你的配音專案(上傳 > 選擇語言 > 處理)。

步驟 2. 在專案結果頁面點擊 Download 按鈕。下拉選單會顯示所有可用的檔案類型。

步驟 3. 選擇你需要的檔案。每個檔案都會個別下載,因此你可以精準選取所需內容,不必下載整包封存檔。

全部 10 種檔案類型都可從 Starter 方案(每月 6.99 美元) 起取得。Free 方案不包含檔案輸出。

競品會輸出哪些檔案?

檔案類型

Perso AI

ElevenLabs

Descript

HeyGen

Synthesia

Rask AI

配音影片(MP4)

來源音訊(WAV)

部分

依說話者分離的音訊

是(TAR)

是(ZIP)

手動變通

僅翻譯音訊

間接

部分

部分

翻譯音訊 + BGM

BGM 輸出(獨立)

來源字幕(SRT)

是(SRT/VTT)

是(Pro+)

是(SRT/VTT)

翻譯字幕(SRT)

是(SRT/VTT)

是(SRT/VTT/ASS)

是(依語言)

來源腳本

是(XLSX)

是(CSV/TXT)

是(TXT/DOCX/MD)

是(XLSX,Pro+)

XLIFF(Enterprise)

是(TXT/DOCX)

雙語腳本

是(XLSX)

是(CSV)

已確認的輸出類型

10

8-9

6-7

5-6

5-6

4-5

Perso AI 的優勢在哪裡

ElevenLabs 最接近,提供 8-9 種輸出類型,包括依說話者分離的 WAV 音軌與 CSV 雙語腳本。但仍有三個差異:

1. 只有 Perso AI 提供 BGM 輸出。 這份清單中沒有其他平台能讓你把獨立背景音樂下載成單獨的 WAV 檔。對於需要以自訂的人聲與音樂比例重新混音配音音訊的創作者來說,這是唯一不需要額外音軌分離工具的選擇。

2. 每月 6.99 美元即可取得所有檔案。 ElevenLabs 會將部分輸出限制在更高方案。HeyGen 需要 Pro+ 才能取得 SRT 與腳本下載。Synthesia 則將腳本輸出(XLIFF)限制在 Enterprise。Perso AI 讓 Starter 方案即可取得全部 10 個檔案。

3. 使用 XLSX,而不是 CSV。 ElevenLabs 以 CSV 輸出雙語腳本——對開發者很實用,但對行銷團隊、翻譯者與專案經理來說不夠直覺。Perso AI 以具結構的欄位輸出 XLSX,可直接在 Excel 或 Google 試算表中開啟,不需要轉換。

常見問題

Q. Starter 方案是否包含全部 10 種下載檔案,還是有些需要更高階方案?

Starter 方案(每月 6.99 美元)即可取得全部 10 種檔案類型。沒有任何單檔費用或額外加購費。唯一受方案層級限制的功能是 SRT Upload(在配音前自訂匯入字幕),且僅限 Enterprise 方案提供。相較之下,HeyGen 將 SRT 與腳本輸出限制在 Pro+,而 Synthesia 則把腳本輸出限制在 Enterprise。

Q. 我可以下載幾週前完成的專案檔案嗎?

可以。所有已完成的專案及其可下載檔案都會保留在你的 Perso AI 儀表板中。你可以隨時回到任何過去的專案,下載 10 種檔案類型中的任一種。

Q. WAV 輸出的音訊品質如何?

Perso AI 會以來源品質層級輸出 WAV 檔。WAV 是未壓縮的無損格式,因此不會因壓縮而造成品質損失。這使得輸出檔非常適合在 DAW 與影片編輯器中進行專業後製流程。

開始輸出不只是影片的內容

一個配音專案。十個檔案。影片、音訊、字幕、腳本——你需要的一切,讓內容可重新運用到受眾使用的各種格式中。

免費試用 Perso AI 無需信用卡。Starter 可輸出 10 種類型。支援 33+ 種配音語言。

內部連結:

繼續閱讀

瀏覽全部

如何使用 AI 將西班牙語影片翻譯成英語——Perso AI 為 LATAM 創作者提供的指南,幫助你觸及規模達 2.3 兆美元的美國西語裔市場與全球英語受眾
Product Guide

如何使用 AI 將西班牙語影片翻譯成英文

Growth Marketer Minjae Lee

Minjae Lee

成長行銷人員

如何使用 AI 將英文影片翻譯成俄文——給創作者的 Perso AI 指南,觸及 2.58 億俄語使用者與遊戲導向受眾
Product Guide

如何使用 AI 將英文影片翻譯成俄文

Growth Marketer Minjae Lee

Minjae Lee

成長行銷人員

AI 配音下載檔案
Product Guide

如何下載您的 AI 配音影片:逐步指南(MP4、MP3、SRT)

成長負責人及產品擁有者Untae Bae

Untae Bae

成長主管與產品擁有人