
AIオーディオ分離
ボーカル、話者、BGMを分離
Perso AI Audio Separation は、音声ファイルと動画ファイルを個別のトラックに分離し、AIでボーカル、話者、背景音楽を切り分けます。Full Background(笑い声や環境音を保持)または Clean Background(音楽のみ)から選択できます。各トラックをプレビューし、必要なものを選んで、カスタムミックスを1つのファイルとして書き出せます。自動文字起こしを含め、99以上の言語に対応しています。



速い · 安全 · 正確
コア機能
コア機能
1つの画面で分離 + 文字起こし
1つの画面で分離 + 文字起こし
任意の音声または動画ファイルをアップロードするだけで、音声を分離し、著作権付きBGMを削除し、きれいなトラックを数秒で書き出せます。
任意の音声または動画ファイルをアップロードするだけで、音声を分離し、著作権付きBGMを削除し、きれいなトラックを数秒で書き出せます。
オーディオトラックの分離
Perso AIは、1つの音声または動画ファイルから、AIを使ってボーカル、バックグラウンド音楽、各話者の声を分離できる唯一のプラットフォームです。しかも、スタジオ品質の精度で。
自動文字起こし
すべての分離処理には、自動テキスト文字起こしが付属し、分離したトラックと並んで表示されます。追加のツールも手順も不要です。99以上の言語に対応しています。
✨ Perso AI 限定
デュアル背景モード
Background Music は純粋なBGMを抽出します。Background with Reaction は笑い声や環境音を保持します。これを提供する他のツールはありません。
話者の再割り当て
検出された話者間で音声セグメントを再割り当てします。誤って識別された部分を即座に修正 — エクスポートされたすべてのトラックと文字起こしに、修正後の割り当てが反映されます。
個別トラックのプレビュー
ダウンロードする前に、各分離トラックを試聴してください。ボーカル、話者、両方のバックグラウンドモードをそれぞれ個別にプレビューできます。
動画ファイルに対応
必要な形式でエクスポート—MP4、MOV、WebM—埋め込み字幕付きまたは別のSRTファイルとして。
オーディオトラックの分離
Perso AIは、1つの音声または動画ファイルから、AIを使ってボーカル、バックグラウンド音楽、各話者の声を分離できる唯一のプラットフォームです。しかも、スタジオ品質の精度で。
✨ Perso AI でのみ
デュアル背景モード
Background Music は純粋なBGMを抽出します。Background with Reaction は笑い声や環境音を保持します。これを提供する他のツールはありません。
個別トラックのプレビュー
ダウンロードする前に、各分離トラックを試聴してください。ボーカル、話者、両方のバックグラウンドモードをそれぞれ個別にプレビューできます。
自動文字起こし
すべての分離処理には、自動テキスト文字起こしが付属し、分離したトラックと並んで表示されます。追加のツールも手順も不要です。99以上の言語に対応しています。
話者の再割り当て
検出された話者間で音声セグメントを再割り当てします。誤って識別された部分を即座に修正 — エクスポートされたすべてのトラックと文字起こしに、修正後の割り当てが反映されます。
動画ファイルに対応
必要な形式でエクスポート—MP4、MOV、WebM—埋め込み字幕付きまたは別のSRTファイルとして。
オーディオトラックの分離
Perso AIは、1つの音声または動画ファイルから、AIを使ってボーカル、バックグラウンド音楽、各話者の声を分離できる唯一のプラットフォームです。しかも、スタジオ品質の精度で。
個別トラックのプレビュー
ダウンロードする前に、各分離トラックを試聴してください。ボーカル、話者、両方のバックグラウンドモードをそれぞれ個別にプレビューできます。
話者の再割り当て
検出された話者間で音声セグメントを再割り当てします。誤って識別された部分を即座に修正 — エクスポートされたすべてのトラックと文字起こしに、修正後の割り当てが反映されます。
✨ Perso AI 限定
デュアル背景モード
Background Music は純粋なBGMを抽出します。Background with Reaction は笑い声や環境音を保持します。これを提供する他のツールはありません。
自動文字起こし
すべての分離処理には、自動テキスト文字起こしが付属し、分離したトラックと並んで表示されます。追加のツールも手順も不要です。99以上の言語に対応しています。
動画ファイルに対応
必要な形式でエクスポート—MP4、MOV、WebM—埋め込み字幕付きまたは別のSRTファイルとして。
バックグラウンド音声を分離する2つの方法
ポッドキャストの笑い声トラック、ライブの観客の反応、基調講演中の咳——ほとんどのツールでは、これらを音声と区別できません。Perso AIなら、あなたが選べます。
モード 1
BGM
純粋な音楽、人の声はゼロ
人が発する音をすべて除去します — 話し声、笑い声、咳、拍手、息づかい。背景音楽と環境音だけをクリーンに残します。
🗣️音声 / ボイス
🗣️音声 / ボイス
削除済み
😂笑い / 拍手
😂笑い / 拍手
削除済み
🎵BGM
保存済み
🌿アンビエント / 環境
保存済み
おすすめ
音楽の抽出、著作権フリーのBGM、クリーンな音声ベッド、クリーンな背景音への再吹き替え
モード 2
リアクション付き背景
人間らしい瞬間を大切に
音声だけを削除します。笑い声、拍手、観客の反応、咳などの人の非発話音と、バックグラウンドミュージックはそのまま保持します。
🗣️音声 / ボイス
🗣️音声 / ボイス
削除済み
😂笑い / 拍手
保存済み
🎵BGM
保存済み
🌿アンビエント / 環境
保存済み
おすすめ
ポッドキャスト、ライブイベント、バラエティ番組、インタビュー――雰囲気が重要なあらゆる場面で
違いを聞いてみてください
違いを聴いてください
動画を3つの簡単なステップで文字起こし・翻訳
Perso AIが、ミックスされた音声ファイルをクリアで分離されたトラックに分ける様子をご覧ください。まず元の音声を再生し、その後、分離された各レイヤーを個別に聴いてみましょう。聞こえるものが、そのまま得られるものです。
Perso AI が、混在した音声ファイルをどのようにクリーンで分離されたトラックに分けるのかをご覧ください。まず元の音声を再生し、その後で分離された各レイヤーを個別に聴いてみましょう。聞こえるものが、そのまま得られる結果です。
Perso AIが、混ざった音声ファイルをクリーンに分離されたトラックへと分ける様子をご覧ください。元の音声を再生し、そのあとで分離された各レイヤーをそれぞれ個別に聴いてみましょう。聞こえるものが、そのまま得られるものです。


今すぐ始めましょう
今すぐ始めましょう
今すぐ始めましょう
ユースケース
ユースケース
音声分離を使うのは誰ですか?
著作権コンプライアンスからポッドキャスト編集まで — クリエイター、チーム、企業がPerso AIのオーディオ分離をどのように活用しているかをご覧ください。
著作権の解決
再録音せずにクレームを解決
著作権のあるBGMを削除しつつ、会話はそのまま保持します。ロイヤリティフリーの音楽に差し替えて、申し立てのない状態で再アップロードします。
著作権の解決
再録音せずにクレームを解決
著作権のあるBGMを削除しつつ、会話はそのまま保持します。ロイヤリティフリーの音楽に差し替えて、申し立てのない状態で再アップロードします。
ポッドキャスト編集
雰囲気をそのままに編集
フィラー語や不要な発話を取り除きつつ、観客の笑い声、拍手、周囲の反応はそのまま完全に残します。
ポッドキャスト編集
雰囲気をそのままに編集
フィラー語や不要な発話を取り除きつつ、観客の笑い声、拍手、周囲の反応はそのまま完全に残します。
動画吹き替え
多言語向けのクリーントラック
話し声が一切混入しない、きれいなBGMトラックを抽出し、99以上の言語で新しいナレーションを重ねます。
動画吹き替え
多言語向けのクリーントラック
話し声が一切混入しない、きれいなBGMトラックを抽出し、99以上の言語で新しいナレーションを重ねます。
会議・カンファレンス
会議の話者を自動で分離
Zoom、Teams、またはMeetの録音から、各参加者の音声を分離します。話者ラベル付きの文字起こしを自動で取得できます。
会議・カンファレンス
会議の話者を自動で分離
Zoom、Teams、またはMeetの録音から、各参加者の音声を分離します。話者ラベル付きの文字起こしを自動で取得できます。
ソーシャルメディアクリップ
短尺動画のBGMを差し替える
ショートフォーム動画の元のBGMを削除し、ナレーションやセリフに影響を与えることなく、トレンドの楽曲に差し替えます。
ソーシャルメディアクリップ
短尺動画のBGMを差し替える
ショートフォーム動画の元のBGMを削除し、ナレーションやセリフに影響を与えることなく、トレンドの楽曲に差し替えます。
コンサート&ファンカム
ライブ演奏の音声をクリーンアップ
コンサートのファンカムやライブ映像から、観客のざわめき、歓声、会場の残響を除去します。アーティストの声や音楽だけを分離し、クリアな再生と共有を実現します。
コンサート&ファンカム
ライブ演奏の音声をクリーンアップ
コンサートのファンカムやライブ映像から、観客のざわめき、歓声、会場の残響を除去します。アーティストの声や音楽だけを分離し、クリアな再生と共有を実現します。
ジャーナリズムとインタビュー
フィールド音声から音源を分離
雑音の多い現場録音から、各インタビュイーの声を分離します。ファクトチェックに使える、話者ラベル付きのきれいな文字起こしを取得できます。
ジャーナリズムとインタビュー
フィールド音声から音源を分離
雑音の多い現場録音から、各インタビュイーの声を分離します。ファクトチェックに使える、話者ラベル付きのきれいな文字起こしを取得できます。
コンテンツを再利用する
1回のアップロードで、複数のアセット
1回のアップロードで、ポッドキャスト音声、プロモ用BGM、SNS向けの話者クリップ、ブログ用の全文書き起こしまで。すべて1つのファイルから。
コンテンツを再利用する
1回のアップロードで、複数のアセット
1回のアップロードで、ポッドキャスト音声、プロモ用BGM、SNS向けの話者クリップ、ブログ用の全文書き起こしまで。すべて1つのファイルから。
今すぐ始める
今すぐ始める
今すぐ始める
Perso AIで音声を分離する方法
動画を3つの簡単なステップで文字起こし・翻訳
音声または動画ファイルをアップロードするだけで、Perso AI があらゆる音のレイヤーを自動で分離します。ボーカル、音楽、音声、環境音などの各トラックを個別にプレビューし、個別にダウンロードしたり、選択したトラックを1つのファイルにまとめたりできます。ソフトウェアのインストールも、アカウントの登録も不要です。
音声または動画ファイルをアップロードするだけで、Perso AIがすべての音のレイヤーを自動で分離します。ボーカル、音楽、音声、環境音など、個別のトラックをプレビューしたり、別々にダウンロードしたり、選択したトラックを1つのファイルにまとめたりできます。インストール不要、アカウント登録も不要です。
任意の音声または動画ファイルをアップロードすると、Perso AIがすべての音のレイヤーを自動で分離します。ボーカル、音楽、音声、環境音などの個別トラックをプレビューし、個別にダウンロードするか、選択したトラックを1つのファイルにまとめることができます。インストール不要、アカウント登録も不要です。
今すぐ始めましょう
今すぐ始めましょう
今すぐ始めましょう
よくある質問
よくある質問
AIオーディオ分離とは何ですか?
AIオーディオ分離は、機械学習を使用して音声または動画ファイルを個別のトラックに分割します。たとえば、ボーカル、バックグラウンドミュージック、個々の話者の音声などに分けられるため、各トラックを個別にプレビュー、編集、またはダウンロードできます。
選択した音声トラックを1つのファイルにまとめることはできますか?
はい。Perso AIでは、たとえば背景音楽と話者1のように、分離されたトラックの任意の組み合わせを選択し、1つの結合された音声ファイルとして書き出すことができます。この選択的ミックス機能は、Perso AIならではのものです。
選択した音声トラックを1つのファイルにまとめることはできますか?
動画から著作権で保護されたBGMを削除できますか?
はい。動画をアップロードすると、AIが音声トラックを分離し、バックグラウンドミュージックを除いたボーカル/話者トラックだけを書き出せます。これは、コンテンツを再録音することなく、YouTube、TikTok、Instagramなどのプラットフォームでの著作権申し立てを解決する最も速い方法です。
動画から著作権で保護されたBGMを削除できますか?
Perso AIのオーディオ分離には文字起こし機能が含まれていますか?
はい。音声または動画ファイルをアップロードすると、AIが音声を自動的に文字起こしし、話者ラベル付きで、分離された音声トラックとともに同じ結果ページに表示します。
Perso AIのオーディオ分離には文字起こし機能が含まれていますか?
どのファイル形式がサポートされていますか?
音声ファイル(MP3、WAVなど)と動画ファイルの両方に対応しています。AIが入力形式に関係なく、音声トラックを自動で抽出・分離します。
どのファイル形式がサポートされていますか?
分離後に話者を再割り当てできますか?
はい。AIが誰の発言かを誤認した場合でも、同じファイル内で検出された別の話者に、任意の発話セグメントを再割り当てできます。たとえば、話者Aの文を話者Bに移動できます。エクスポートされたすべての音声トラックと文字起こしファイルには、修正後の話者割り当てが自動的に反映されます。
分離後に話者を再割り当てできますか?
LALAL.AI や Moises と比べて、これは何が違いますか?
音楽中心のツールとは異なり、Perso AIは、1つのプロジェクト内で音声分離、文字起こし、話者の再割り当て、2つの背景モード、選択的なトラックミキシングを組み合わせています。音楽家だけでなく、動画クリエイターやコンテンツ編集者向けに設計されています。
LALAL.AI や Moises と比べて、これは何が違いますか?
バックグラウンドミュージックとリアクション付きのバックグラウンドの違いは何ですか?
Background Music は、人間が生成した音声をすべて除去し、会話、笑い、拍手、咳などを取り除いて、純粋なBGMとアンビエントトラックのみを提供します。Background with Reaction は、会話のみを除去しつつ、笑い声や観客の反応のような人間の非発話音を保持するため、ライブ録音の自然な雰囲気を維持するのに最適です。Perso AI は、両方のモードを提供する唯一のツールです。
バックグラウンドミュージックとリアクション付きのバックグラウンドの違いは何ですか?
切り抜き後に、背景モードを切り替えることはできますか?
はい。ファイルをアップロードすると、バックグラウンドミュージックとリアクション付きバックグラウンドトラックの両方が同時に生成されます。プレビュー、比較、どちらかのモードを選択することができ、エクスポートに両方を含めることもできます。再アップロードや再処理は不要です。
切り抜き後に、背景モードを切り替えることはできますか?
私たちの製品機能を探る
私たちの製品機能を探る
ESTsoft株式会社 15770 Laguna Canyon Rd #250, アーバイン, CA 92618
ESTsoft株式会社 15770 Laguna Canyon Rd #250, アーバイン, CA 92618
ESTsoft株式会社 15770 Laguna Canyon Rd #250, アーバイン, CA 92618
