製品ガイド

AI吹き替え動画のダウンロード方法：ステップごとのガイド（MP4、MP3、SRT）

最終更新日

2026年5月12日

Written By

ペ・ウンテ

成長担当責任者およびプロダクトオーナー

まとめる

Chat GPT

Perplexity

Claude

Gemini

Grok

セクションにジャンプ

まとめる

Chat GPT

Perplexity

Claude

Gemini

Grok

共有する

AIビデオ翻訳、ローカリゼーション、および吹き替えツール

無料でお試しください

Perso AIでは、1つの吹き替えプロジェクトからダビング済み動画だけでなく、10種類のダウンロード可能ファイルを出力できます。ダビング済みのMP4、元音声と翻訳音声のトラック（WAV）、話者ごとに分離した音声（TAR）、背景音楽のみを抽出したファイル（WAV）、元字幕と翻訳字幕（SRT）、バイリンガルスクリプト（XLSX）が含まれます。すべてのファイルは、月額$6.99のStarterプランから利用できます。このガイドでは、各ファイルの内容、使いどころ、ダウンロード方法を説明します。

数字で見ると: すべてのAI吹き替えプラットフォームは、ダビング済み動画を出力します。字幕や音声トラックまで出力するものも少数あります。Perso AIは、背景音楽のみを抽出したファイル、バイリンガルXLSXスクリプト、話者分離音声を含む10種類のファイルを、すべての吹き替えプロジェクトから出力します。しかも、月額$6.99のStarterプランからすべて利用可能です。Enterpriseの壁はありません。追加料金もありません。

吹き替え後にPerso AIが出力するファイルは何ですか？

Perso AIの任意の吹き替えプロジェクト完了後にダウンロードできるファイルの完全一覧はこちらです。

#	ファイル	形式	内容	利用可能プラン
1	ダビング済み動画の出力	MP4	翻訳されたナレーション、リップシンク、元の映像を含む完全な動画	Starter（$6.99/月）
2	元音声の出力	WAV	アップロードした動画から抽出した元の音声トラック	Starter
3	元音声（話者別）	TAR	元動画の各話者ごとに分離された個別音声ファイル	Starter
4	翻訳音声の出力	WAV	ダビング済みのナレーション音声のみ — 動画なし、背景音楽なし	Starter
5	翻訳音声（BGM付き）	WAV	元の背景音楽をミックスしたダビング済みナレーション	Starter
6	BGMの出力	WAV	背景音楽のみを抽出 — ボーカルは完全に除去	Starter
7	元字幕	SRT	元の言語で自動生成された字幕	Starter
8	翻訳字幕	SRT	ダビング音声に同期したターゲット言語の字幕	Starter
9	元スクリプト	XLSX	元音声の全文書き起こしをスプレッドシート形式で出力	Starter
10	元&翻訳スクリプト	XLSX	原文と翻訳文を左右に並べたバイリンガルスクリプト — 両言語のテキストを並列列で表示	Starter

Perso AIは、これら10種類のファイルをすべて自動生成します。追加機能も、追加クレジットも、別ツールも不要です。1つの吹き替えプロジェクトで、10個の成果物が得られます。

1回の吹き替えで得られるすべてのファイルを見る

1. ダビング済み動画の出力（MP4）

内容: 最終的なダビング済み動画です。元の映像に、元音声の代わりとして翻訳されたナレーションが入ります。音声クローンにより、元話者のトーン、間、リズムが保たれます。リップシンクは自動で適用されます。

使いどころ:

ダビング版をそのままYouTube、TikTok、LMSに公開する
異なる市場向けにランディングページや製品ページへ埋め込む
配信前のレビュー用に関係者へ共有する

何が違うのか: リップシンクはPerso AIの吹き替えワークフロー内で任意に有効化できるステップです。ユーザーが必要なときにのみ適用し、その結果は1つのMP4として出力されます。ただし本当の差は品質です。多くの競合はリップシンクを提供していても、口の形のズレ、フレームの不一致、硬く機械的な動きが目立ち、視聴者の信頼を損ないがちです。Perso AIのリップシンクは、精査しても耐えられるよう設計されており、正確な口形、自然な遷移、放送品質の出力を実現します。

2. 元音声の出力（WAV）

内容: アップロードした動画から抽出した元の音声トラックを、高品質なWAVファイルとして保存します。

使いどころ:

吹き替え前にクリーンな元音声を保管する
別の編集プロジェクト（Premiere Pro、DaVinci Resolve、Final Cut）で元のナレーションを使う
元音声とダビング音声の品質を並べて比較する

3. 話者別の元音声（TAR）

内容: 元動画で検出された各話者ごとの個別音声ファイルを含む圧縮アーカイブです。動画に3人の話者がいれば、3つのWAVファイルが得られます。

使いどころ:

話者ごとに音量やEQを個別調整したいポッドキャスト編集者
ある話者だけ再録音が必要で、他の話者はそのままにしたいインタビュー動画
複数話者のQA — 各話者の声が正しくクローンされたか確認する

重要な理由: 話者分離音声には通常、DescriptやAdobe Podcastのような専用ツールが必要です。Perso AIでは、これをすべての吹き替えプロジェクトに自動で含めています。詳しくは「動画から話者分離音声を出力する方法」をご覧ください。

4. 翻訳音声の出力（WAV）

内容: ダビング済みのナレーション音声のみです。動画も背景音楽もありません。翻訳された音声トラックだけを出力します。

使いどころ:

ポッドキャストのローカライズ: 別言語の音声版を公開する
自分の編集タイムライン（Premiere、Final Cut）で音声を差し替え、カスタムのポストプロダクションを行う
ラジオ、社内研修用音声、オーディオブック風コンテンツ向けの音声のみ配信

プロのヒント: 自分のNLEで再編集する場合は、翻訳音声（BGMなし）とBGMの出力を別々にダウンロードしてください。これにより、音声と音楽のミックス比率を自由に調整できます。完全な手順は「動画なしでダビング音声をダウンロードする方法」をご覧ください。

5. BGM付き翻訳音声（WAV）

内容: ダビング済みのナレーションと元の背景音楽をミックスしたものです。動画なしで、そのまま完全な音声トラックとして使えます。

使いどころ:

音声先行の配信（ポッドキャスト、社内コミュニケーション、音声ニュースレター）で、完成された音作りを求める場合
短納期対応: 手動ミキシング不要で、BGMのバランスはすでに調整済み
背景音楽を残したまま使うSNS向け音声クリップ

6. BGMの出力（WAV）

内容: 元動画から背景音楽だけを分離したものです。ボーカルはすべて除去されています。クリーンなインストゥルメンタルトラックのみです。

使いどころ:

DAWやエディタで、音声と音楽の比率を任意にしてダビング音声を再ミックスする
元のBGMをプロモーションクリップ、予告編、ハイライト映像に使う
AIが音声と音楽を正しく分離できたか確認する（QAステップ）

珍しい理由: BGMを別出力できるAI吹き替えプラットフォームは他にありません。Perso AIの音声分離エンジンは処理中にボーカルと背景音楽を分離し、それぞれを個別にダウンロードできます。詳しくは「AIで動画から背景音楽を抽出する方法」をご覧ください。

7. 元字幕（SRT）

内容: 動画の元言語で自動生成された字幕を、標準的なSRTファイルとして出力します。Perso AIの音声認識は、100言語の書き起こしに対応しています。

使いどころ:

YouTubeやVimeoで元動画にクローズドキャプションを追加する
既存コンテンツのアクセシビリティ対応（ADA、WCAG）
SRTを他の翻訳ツールやワークフローに渡す
SEO: YouTubeにSRTをアップロードすると、元言語での発見性が向上する

形式の詳細: 標準SRT形式で、連番、タイムスタンプ（HH:MM:SS,mmm）、字幕テキストを含みます。YouTube、Vimeo、Premiere Pro、Final Cut、DaVinci Resolve、その他主要な動画プラットフォームと互換性があります。完全なSRTワークフローは「任意の動画からSRT字幕を自動生成する方法」をご覧ください。

8. 翻訳字幕（SRT）

内容: ダビング音声のタイミングに合わせて同期したターゲット言語の字幕です。元の発話タイミングではありません。

使いどころ:

二言語公開: Source SubtitlesとTranslated Subtitlesの両方をYouTubeにアップロードし、複数の字幕トラックとして使う
ターゲット市場でのアクセシビリティ確保
FFmpegやエディタで字幕を動画に焼き付けるワークフロー

競合との主な違い: 多くの字幕翻訳ツールは翻訳文を生成するだけで、ダビング音声のテンポに合わせてタイミングを調整しません。Perso AIの翻訳SRTは実際のダビング音声に同期するため、字幕は適切なタイミングで表示されます。元の話者が話していた瞬間ではなく、実際の吹き替え音声に合わせて出ます。

9. 元スクリプト（XLSX）

内容: 元動画の全文書き起こしをスプレッドシート形式で出力します。各行は1つのセグメントに対応し、タイムスタンプ、話者ラベル、書き起こしテキストの列があります。

使いどころ:

コンテンツの再活用: 動画スクリプトをブログ記事、SNSキャプション、メール文面に変換する
元の録画で実際に何が言われたかの法務・コンプライアンス確認
検索可能なアーカイブ: XLSXは検索、並べ替え、絞り込みが容易

10. 元&翻訳スクリプト（XLSX）

内容: 原文と翻訳文を並べて表示したバイリンガルのスプレッドシートです。各行に、タイムスタンプと話者ラベル付きで、同じセグメントが両言語で表示されます。

使いどころ:

翻訳QA: レビュアーがファイルを切り替えずに、両方の版を行ごとに確認できる
語学学習コンテンツ: 教育者が学習教材としてバイリンガルスクリプトを使う
ローカライズチームへの引き継ぎ: プロジェクトマネージャーが、Perso AIにアクセスできない現地レビュアーへXLSXを共有する
コンプライアンス文書: 規制業界（医療、法務、金融）では、発言内容と翻訳内容のバイリンガル記録を保管する

PDFではなくXLSXなのはなぜですか？ スプレッドシートは編集、並べ替え、絞り込みが可能です。レビュアーが47行目の翻訳に問題を指摘した場合、編集者はPerso AIエディタでそのタイムスタンプに直接移動し、その行を修正できます。用途やワークフローについては「QAと学習のためのバイリンガルスクリプト出力: 横並び翻訳」をご覧ください。

ファイルのダウンロード方法: 3ステップ

ステップ1. Perso AIで吹き替えプロジェクトを完了します（Upload > 言語選択 > 処理）。

ステップ2. プロジェクト結果ページでDownloadボタンをクリックします。ドロップダウンメニューに利用可能なすべてのファイル形式が表示されます。

ステップ3. 必要なファイルを選択します。各ファイルは個別にダウンロードされるため、まとめてアーカイブを落とすことなく、必要なものだけを選べます。

10種類のファイルはすべてStarterプラン（$6.99/月）から利用できます。Freeプランにはファイル出力は含まれません。

競合他社はどのファイルを出力できるのか？

ファイル種別	Perso AI	ElevenLabs	Descript	HeyGen	Synthesia	Rask AI
ダビング済み動画（MP4）	Yes	Yes	Yes	Yes	Yes	Yes
元音声（WAV）	Yes	Yes	Yes	Partial	Yes	No
話者分離音声	Yes (TAR)	Yes (ZIP)	Manual workaround	No	No	No
翻訳音声のみ	Yes	Yes	Indirect	Partial	No	Partial
翻訳音声 + BGM	Yes	Yes	No	No	No	No
BGM出力（分離済み）	Yes	No	No	No	No	No
元字幕（SRT）	Yes	Yes	Yes (SRT/VTT)	Yes (Pro+)	Yes (SRT/VTT)	Yes
翻訳字幕（SRT）	Yes	Yes	Yes (SRT/VTT)	Yes (SRT/VTT/ASS)	Yes (per lang)	Yes
元スクリプト	Yes (XLSX)	Yes (CSV/TXT)	Yes (TXT/DOCX/MD)	Yes (XLSX, Pro+)	XLIFF (Enterprise)	Yes (TXT/DOCX)
バイリンガルスクリプト	Yes (XLSX)	Yes (CSV)	No	No	No	No
確認済みの出力種類	10	8-9	6-7	5-6	5-6	4-5

Perso AIが際立つ点

ElevenLabsが最も近く、話者分離WAVトラックやCSVのバイリンガルスクリプトを含む8〜9種類の出力に対応しています。しかし、なお3つの違いがあります。

1. BGM出力はPerso AIだけ。 この一覧の他のプラットフォームでは、分離した背景音楽を別のWAVファイルとしてダウンロードできません。吹き替え音声を音声と音楽の任意比率で再ミックスしたい制作者にとって、別のステム分離ツールを使わなくて済むのはこれだけです。

2. 月額$6.99ですべて利用可能。 ElevenLabsでは、一部の出力が上位プラン限定です。HeyGenはSRTとスクリプトのダウンロードにPro+が必要です。Synthesiaはスクリプト出力（XLIFF）をEnterpriseに限定しています。Perso AIはStarterプランから10種類すべてを利用できます。

3. CSVではなくXLSX。 ElevenLabsはバイリンガルスクリプトをCSVで出力します。開発者には便利ですが、マーケティングチーム、翻訳者、プロジェクトマネージャーには直感的ではありません。Perso AIは、ExcelやGoogle Sheetsで変換なしにそのまま開ける、構造化された列付きのXLSXで出力します。

よくある質問

Q. Starterプランには10種類すべてのダウンロードファイルが含まれますか？それとも上位プランが必要ですか？

10種類のファイルはすべてStarterプラン（月額$6.99）から利用できます。ファイルごとの追加料金やアドオン料金はありません。プラン階層で制限されている唯一の機能はSRT Upload（吹き替え前のカスタム字幕インポート）で、Enterpriseプランのみで利用できます。比較として、HeyGenはSRTとスクリプトの出力をPro+に制限し、Synthesiaはスクリプト出力をEnterpriseに限定しています。

Q. 数週間前に完了したプロジェクトからでもファイルをダウンロードできますか？

はい。完了済みのすべてのプロジェクトとそのダウンロードファイルは、Perso AIのダッシュボードから引き続きアクセスできます。過去の任意のプロジェクトに戻り、10種類のファイルのどれでもいつでもダウンロードできます。

Q. WAV出力の音質はどのくらいですか？

Perso AIは、元の品質レベルでWAVファイルを出力します。WAVは非圧縮のロスレス形式なので、圧縮による品質低下はありません。そのため、DAWや動画編集ソフトでのプロフェッショナルなポストプロダクションに適しています。

動画以上のものを出力し始めましょう

1つの吹き替えプロジェクト。10個のファイル。動画、音声、字幕、スクリプト — 視聴者が使うあらゆる形式に合わせてコンテンツを再活用するために必要なすべてがそろいます。

Perso AIを無料で試す クレジットカードは不要です。Starterで10種類の出力。33以上の吹き替え言語。

内部リンク:

数字で見ると: すべてのAI吹き替えプラットフォームは、ダビング済み動画を出力します。字幕や音声トラックまで出力するものも少数あります。Perso AIは、背景音楽のみを抽出したファイル、バイリンガルXLSXスクリプト、話者分離音声を含む10種類のファイルを、すべての吹き替えプロジェクトから出力します。しかも、月額$6.99のStarterプランからすべて利用可能です。Enterpriseの壁はありません。追加料金もありません。

吹き替え後にPerso AIが出力するファイルは何ですか？

Perso AIの任意の吹き替えプロジェクト完了後にダウンロードできるファイルの完全一覧はこちらです。

#	ファイル	形式	内容	利用可能プラン
1	ダビング済み動画の出力	MP4	翻訳されたナレーション、リップシンク、元の映像を含む完全な動画	Starter（$6.99/月）
2	元音声の出力	WAV	アップロードした動画から抽出した元の音声トラック	Starter
3	元音声（話者別）	TAR	元動画の各話者ごとに分離された個別音声ファイル	Starter
4	翻訳音声の出力	WAV	ダビング済みのナレーション音声のみ — 動画なし、背景音楽なし	Starter
5	翻訳音声（BGM付き）	WAV	元の背景音楽をミックスしたダビング済みナレーション	Starter
6	BGMの出力	WAV	背景音楽のみを抽出 — ボーカルは完全に除去	Starter
7	元字幕	SRT	元の言語で自動生成された字幕	Starter
8	翻訳字幕	SRT	ダビング音声に同期したターゲット言語の字幕	Starter
9	元スクリプト	XLSX	元音声の全文書き起こしをスプレッドシート形式で出力	Starter
10	元&翻訳スクリプト	XLSX	原文と翻訳文を左右に並べたバイリンガルスクリプト — 両言語のテキストを並列列で表示	Starter

1回の吹き替えで得られるすべてのファイルを見る

1. ダビング済み動画の出力（MP4）

使いどころ:

ダビング版をそのままYouTube、TikTok、LMSに公開する
異なる市場向けにランディングページや製品ページへ埋め込む
配信前のレビュー用に関係者へ共有する

2. 元音声の出力（WAV）

内容: アップロードした動画から抽出した元の音声トラックを、高品質なWAVファイルとして保存します。

使いどころ:

吹き替え前にクリーンな元音声を保管する
別の編集プロジェクト（Premiere Pro、DaVinci Resolve、Final Cut）で元のナレーションを使う
元音声とダビング音声の品質を並べて比較する

3. 話者別の元音声（TAR）

内容: 元動画で検出された各話者ごとの個別音声ファイルを含む圧縮アーカイブです。動画に3人の話者がいれば、3つのWAVファイルが得られます。

使いどころ:

話者ごとに音量やEQを個別調整したいポッドキャスト編集者
ある話者だけ再録音が必要で、他の話者はそのままにしたいインタビュー動画
複数話者のQA — 各話者の声が正しくクローンされたか確認する

4. 翻訳音声の出力（WAV）

内容: ダビング済みのナレーション音声のみです。動画も背景音楽もありません。翻訳された音声トラックだけを出力します。

使いどころ:

ポッドキャストのローカライズ: 別言語の音声版を公開する
自分の編集タイムライン（Premiere、Final Cut）で音声を差し替え、カスタムのポストプロダクションを行う
ラジオ、社内研修用音声、オーディオブック風コンテンツ向けの音声のみ配信

5. BGM付き翻訳音声（WAV）

内容: ダビング済みのナレーションと元の背景音楽をミックスしたものです。動画なしで、そのまま完全な音声トラックとして使えます。

使いどころ:

音声先行の配信（ポッドキャスト、社内コミュニケーション、音声ニュースレター）で、完成された音作りを求める場合
短納期対応: 手動ミキシング不要で、BGMのバランスはすでに調整済み
背景音楽を残したまま使うSNS向け音声クリップ

6. BGMの出力（WAV）

内容: 元動画から背景音楽だけを分離したものです。ボーカルはすべて除去されています。クリーンなインストゥルメンタルトラックのみです。

使いどころ:

DAWやエディタで、音声と音楽の比率を任意にしてダビング音声を再ミックスする
元のBGMをプロモーションクリップ、予告編、ハイライト映像に使う
AIが音声と音楽を正しく分離できたか確認する（QAステップ）

7. 元字幕（SRT）

使いどころ:

YouTubeやVimeoで元動画にクローズドキャプションを追加する
既存コンテンツのアクセシビリティ対応（ADA、WCAG）
SRTを他の翻訳ツールやワークフローに渡す
SEO: YouTubeにSRTをアップロードすると、元言語での発見性が向上する

8. 翻訳字幕（SRT）

内容: ダビング音声のタイミングに合わせて同期したターゲット言語の字幕です。元の発話タイミングではありません。

使いどころ:

二言語公開: Source SubtitlesとTranslated Subtitlesの両方をYouTubeにアップロードし、複数の字幕トラックとして使う
ターゲット市場でのアクセシビリティ確保
FFmpegやエディタで字幕を動画に焼き付けるワークフロー

9. 元スクリプト（XLSX）

使いどころ:

コンテンツの再活用: 動画スクリプトをブログ記事、SNSキャプション、メール文面に変換する
元の録画で実際に何が言われたかの法務・コンプライアンス確認
検索可能なアーカイブ: XLSXは検索、並べ替え、絞り込みが容易

10. 元&翻訳スクリプト（XLSX）

使いどころ:

翻訳QA: レビュアーがファイルを切り替えずに、両方の版を行ごとに確認できる
語学学習コンテンツ: 教育者が学習教材としてバイリンガルスクリプトを使う
ローカライズチームへの引き継ぎ: プロジェクトマネージャーが、Perso AIにアクセスできない現地レビュアーへXLSXを共有する
コンプライアンス文書: 規制業界（医療、法務、金融）では、発言内容と翻訳内容のバイリンガル記録を保管する

ファイルのダウンロード方法: 3ステップ

ステップ1. Perso AIで吹き替えプロジェクトを完了します（Upload > 言語選択 > 処理）。

10種類のファイルはすべてStarterプラン（$6.99/月）から利用できます。Freeプランにはファイル出力は含まれません。

競合他社はどのファイルを出力できるのか？

ファイル種別	Perso AI	ElevenLabs	Descript	HeyGen	Synthesia	Rask AI
ダビング済み動画（MP4）	Yes	Yes	Yes	Yes	Yes	Yes
元音声（WAV）	Yes	Yes	Yes	Partial	Yes	No
話者分離音声	Yes (TAR)	Yes (ZIP)	Manual workaround	No	No	No
翻訳音声のみ	Yes	Yes	Indirect	Partial	No	Partial
翻訳音声 + BGM	Yes	Yes	No	No	No	No
BGM出力（分離済み）	Yes	No	No	No	No	No
元字幕（SRT）	Yes	Yes	Yes (SRT/VTT)	Yes (Pro+)	Yes (SRT/VTT)	Yes
翻訳字幕（SRT）	Yes	Yes	Yes (SRT/VTT)	Yes (SRT/VTT/ASS)	Yes (per lang)	Yes
元スクリプト	Yes (XLSX)	Yes (CSV/TXT)	Yes (TXT/DOCX/MD)	Yes (XLSX, Pro+)	XLIFF (Enterprise)	Yes (TXT/DOCX)
バイリンガルスクリプト	Yes (XLSX)	Yes (CSV)	No	No	No	No
確認済みの出力種類	10	8-9	6-7	5-6	5-6	4-5

Perso AIが際立つ点

よくある質問

Q. Starterプランには10種類すべてのダウンロードファイルが含まれますか？それとも上位プランが必要ですか？

Q. 数週間前に完了したプロジェクトからでもファイルをダウンロードできますか？

Q. WAV出力の音質はどのくらいですか？

動画以上のものを出力し始めましょう

Perso AIを無料で試す クレジットカードは不要です。Starterで10種類の出力。33以上の吹き替え言語。

内部リンク:

続きを読む

すべてを閲覧する

製品ガイド

ビデオから背景の音楽やノイズを削除する方法

2026/07/14

ペ・ウンテ

成長担当責任者およびプロダクトオーナー

製品ガイド

TikTokやリールに字幕を自動追加する方法 — あらゆる言語に対応

2026/07/09

シン・ヘソン

成長マーケター

AIダビングはなぜ不自然に聞こえるのか？ — リップシンク（口元の同期）を改善する、元動画の5つの修正ポイント「Perso Dubbing」ガイド

製品ガイド

なぜAIダビングは不自然に聞こえるのか？元の動画から始める5つの改善策

2026/07/07

シン・ヘソン

成長マーケター