話者管理、AI要約、字幕エクスポート対応のAI音声文字起こし

任意の動画または音声ファイルをアップロードしてください。Perso AIは、99以上の言語に自動話者検出付きで文字起こしし、アクションアイテム付きのAI要約を生成し、字幕、スクリプト、または字幕埋め込み動画としてエクスポートできます。処理時間は1時間あたり2分未満。すべて自動です。

インストール不要 · 無料プランあり · 数秒で開始

最高のオーディオ分離ツール
最高のオーディオ分離ツール
最高のオーディオ分離ツール

アクション項目付きのAI要約を含む

アクション項目付きのAI要約を含む

エクスポート形式 SRT · VTT · XLSX · JSON · MP4

エクスポート形式 SRT · VTT · XLSX · JSON · MP4

99以上の言語を自動検出

99以上の言語を自動検出

単語レベルのタイムスタンプ

単語レベルのタイムスタンプ

自動話者検出

自動話者検出

数分で使える高速

数分で使える高速

スピーカー管理: 追加、名前変更、削除

スピーカー管理: 追加、名前変更、削除

速い · 安全 · 正確

コア機能

コア機能

1つのプロジェクトで文字起こし、編集、書き出し

1つのプロジェクトで文字起こし、編集、書き出し

アクションアイテム付きのAI要約

アクションアイテム付きのAI要約

文字起こしを超えて。 簡潔な要約を自動生成し、すぐにコピーしたり、新しい内容で再生成したり、会議やインタビューからアクションアイテムを抽出できます。

字幕エンコード済み動画のダウンロード

字幕エンコード済み動画のダウンロード

字幕を恒久的に埋め込んだ、すぐに共有できるMP4をダウンロード。 別途の字幕ファイルや動画編集ソフトは不要です。アップロードして、文字起こしし、字幕付き動画をダウンロード。

自動言語検出: 99以上の言語

自動言語検出: 99以上の言語

任意の音声または動画ファイルをアップロードできます。Perso AIは、99以上の対応言語にわたって話されている言語を自動検出します。手動で選択する必要はありません。

スクリプトと字幕の編集

ウェブエディターで、書き起こされた各行を直接編集できます。認識誤りの単語を修正し、句読点を整え、変更をすべてのエクスポート形式に自動で同期します。

マルチフォーマット書き出し + 字幕埋め込み動画

任意の音声または動画ファイルをアップロードできます。Perso AIは、99以上の対応言語にわたって話されている言語を自動検出します。手動で選択する必要はありません。

スピーカー管理:追加、名前の変更、削除

スピーカー管理:追加、名前の変更、削除

すべての話者を自動検出し、その後は完全に自由に管理できます。新しい話者を追加したり、ラベルを実名に変更したり、不要なセグメントを削除したりできます。すべての変更はエクスポートしたファイルに反映されます。

吹き替えと翻訳に直接接続

吹き替えと翻訳に直接接続

任意の音声または動画ファイルをアップロードできます。Perso AIは、99以上の対応言語にわたって話されている言語を自動検出します。手動で選択する必要はありません。

今すぐ始める

今すぐ始める

今すぐ始める

文字起こしの先へ

文字起こしを超えて

Perso AI Speech to Textは、音声をテキストに変換するだけでは終わりません。AI搭載の要約を取得し、会議からアクションアイテムを抽出し、共有できる字幕付き動画をダウンロードできます。1回のアップロードでこの3つすべてを実現する、唯一の文字起こしツールです。

📝

AI要約

録画の自動生成サマリーです。結果はすぐにコピーすることも、新しく生成し直すこともできます。長時間のコンテンツを、手早い要約に変えましょう。

アクション項目

会議やインタビューから実行可能なタスクを自動で抽出します。手作業のメモ取りは不要で、次のアクションを整理された一覧で受け取れます。

🎥

字幕エンコード済み動画

字幕が永久に焼き込まれたMP4をダウンロードできます。別途字幕ファイルを用意せずに、SNS、社内チャンネル、またはプレゼンテーションで共有できます。

ユースケース

ユースケース

字幕、会議メモ、講義スクリプト

同じツールでも、必要に応じて異なる出力が得られます。

コンテンツクリエーター

Vlog、ポッドキャスト、動画を、数分でそのまま公開できる字幕に。アップロード、編集、書き出しまで、手作業の文字起こしは不要です。

YouTube、TikTok、Reels向けの自動字幕

エクスポート前にキャプションをその場で編集

99以上の言語に対応

アップロードできる字幕入りMP4をダウンロード

SRT · VTT · MP4 エクスポート

チーム&ビジネス

会議の録音を、検索可能で話者ラベル付きのノートに変換します。あらゆる会議プラットフォームやボイスレコーダーで利用できます。

ワンクリックでコピーできるAI要約

会議の録音からアクションアイテムを抽出する

話者ラベルを追加、名前変更、または削除する

自動話者分離

構造化されたExcel会議議事録

引用用の単語単位のタイムスタンプ

XLSX・JSON・MP4のエクスポート

XLSXのエクスポート

教育者

講義や授業コンテンツを高精度で文字起こし。アクセシビリティ向上や学習用のスクリプト用に字幕を生成します。

講義の要点をすばやく把握できるAI要約

アクセシビリティのための字幕付き動画

長時間講義の精度

LMS用の字幕生成

世界中の学生向けの多言語対応

アクセシビリティ対応

動画制作者

文字起こしから始めて、再アップロードすることなく、吹き替えや翻訳へ進めます。1回のアップロードで、ローカライズの全工程をカバーします。

文字起こし、編集、エクスポートを一連の流れで

字幕焼き込み済みのMP4をダウンロード

AI吹き替えと翻訳に接続します

オーディオ分離が含まれています

完全ローカライズ

今すぐ始める

今すぐ始める

今すぐ始める

1回のアップロードで、複数のエクスポート

1回のアップロードで、複数のエクスポート

字幕、スクリプト、またはタイムスタンプ付きの生データ。必要な形式を選択してください。

SRT

SRT字幕

業界標準の字幕形式。YouTube、Vimeo、および主要な動画プラットフォームでご利用いただけます。

VTT

WebVTT

スタイル対応のWebネイティブ字幕形式。HTML5動画プレーヤーやWeb埋め込みで利用できます。

XLS

Excel スクリプト

スプレッドシート形式の話者ラベル付き完全な文字起こしです。会議議事録、ドキュメント作成、アーカイブにご利用ください。

{ }

JSONデータ

単語レベルのタイムスタンプ、話者ID、信頼度スコアを含む構造化データ。API連携やカスタムワークフローに便利です。

MP4

字幕エンコード済みMP4

字幕が永久に焼き込まれた動画。別途字幕ファイルなしですぐに共有できます。

なぜ私たちを選ぶのか

なぜ私たちを選ぶのか

Perso AI と手動文字起こしの比較

時間、コスト、出力品質を横並びで比較。

大切なこと

大切なこと

大切なこと

Perso AI 音声をテキストに変換

Perso AI 音声をテキストに変換

Perso AI 音声をテキストに変換

手動文字起こし

手動文字起こし

手動文字起こし

処理速度

処理速度

音声1時間あたり約2分 · 結果は数時間ではなく数分で完了

音声1時間あたり約2分 · 結果は数時間ではなく数分で完了

音声1時間あたり3〜6時間の作業 · 事前予約が必要

音声1時間あたり3〜6時間の作業 · 事前予約が必要

対応言語

対応言語

99以上の言語 · 自動検出 · ネイティブレベルの精度

99以上の言語 · 自動検出 · ネイティブレベルの精度

書き起こし担当者の母語に限定 · 混在言語のファイルには複数人が必要です

書き起こし担当者の母語に限定 · 混在言語のファイルには複数人が必要です

話者ダイアリゼーション

話者ダイアリゼーション

すべての話者を自動検出 · 各セグメントを別の検出済み話者に再割り当て可能 · 変更はエクスポートした字幕に反映されます

すべての話者を自動検出 · 各セグメントを別の検出済み話者に再割り当て可能 · 変更はエクスポートした字幕に反映されます

セグメントごとの手動タグ付け · 長時間録音では一貫性がなく · 話者が混同された場合は再タグ付けが必要

セグメントごとの手動タグ付け · 長時間録音では一貫性がなく · 話者が混同された場合は再タグ付けが必要

ダイアログ編集と同期

ダイアログ編集と同期

文字起こしされた対話をその場で編集 · 編集内容はSRT・VTT・XLSX・JSONエクスポートに自動で同期

文字起こしされた対話をその場で編集 · 編集内容はSRT・VTT・XLSX・JSONエクスポートに自動で同期

文字起こしをプレーンテキストとして編集 · 変更ごとに字幕のタイミングを再調整し、個別に再エクスポート

文字起こしをプレーンテキストとして編集 · 変更ごとに字幕のタイミングを再調整し、個別に再エクスポート

タイムスタンプ

タイムスタンプ

単語レベルの精度 · ミリ秒単位の正確さ · すべてのエクスポート形式に組み込み済み

単語レベルの精度 · ミリ秒単位の正確さ · すべてのエクスポート形式に組み込み済み

手動セグメント調整・長時間の録音ではずれやすい

手動セグメント調整・長時間の録音ではずれやすい

字幕のエクスポート

字幕のエクスポート

ワンクリックで SRT・VTT・XLSX・JSON にエクスポート — YouTube、DaVinci、Premiere、またはあらゆる LLM パイプラインですぐに使えます

ワンクリックで SRT・VTT・XLSX・JSON にエクスポート — YouTube、DaVinci、Premiere、またはあらゆる LLM パイプラインですぐに使えます

別途の字幕作成ツールが必要です · タイミングは手動で再追加する必要があります

別途の字幕作成ツールが必要です · タイミングは手動で再追加する必要があります

精度

精度

95%以上のAI精度・組み込みエディタで単語単位の制御により微調整可能

95%以上のAI精度・組み込みエディタで単語単位の制御により微調整可能

個々の書き起こし担当者と音声品質によって85〜98%の範囲で変動します

個々の書き起こし担当者と音声品質によって85〜98%の範囲で変動します

話者管理

スピーカー管理

スピーカー管理

エディター内で話者を直接追加、名前変更、削除できます。変更はすべてのエクスポート形式に自動的に同期されます。

エディター上で話者を直接追加、名前変更、または削除できます。変更はすべてのエクスポート形式に自動的に同期されます。

エディター上で話者を直接追加、名前変更、または削除できます。変更はすべての書き出し形式に自動的に同期されます。

セグメントごとに手動で話者をタグ付けします。話者が変わった場合は再タグ付けが必要です。

セグメントごとに手動で話者をタグ付けします。話者が変わった場合は再タグ付けが必要です。

セグメントごとに手動で話者タグを付けます。話者が変わった場合は再タグ付けが必要です。

AIの要約とアクション項目

AI要約と対応事項

AI要約とアクション項目

コピー、再生成、アクションアイテム抽出を備えた自動生成サマリー。1時間の録画を数秒で要約。

コピー、再生成、アクションアイテムの抽出ができる自動生成サマリー。1時間の録音を数秒で要約します。

コピー、再生成、アクション項目の抽出付きの自動生成サマリー。1時間分の録音を数秒で要約します。

聞いた後に手動で会議メモを作成します。アクションアイテムは別のツールで管理されます。

聞いた後に手動で会議メモを作成します。アクションアイテムは別のツールで管理されます。

聞きながら会議のメモを手作業で作成。アクションアイテムは別のツールで追跡。

今すぐ始める

今すぐ始める

今すぐ始める

Perso AIの音声テキスト変換はどのように機能しますか?

Perso AIの音声をテキストに変換する仕組みは?

動画を3つの簡単なステップで文字起こし・翻訳

任意の動画または音声ファイルをアップロードするだけ。Perso AI が話者を自動で分離し、99以上の言語で文字起こしを行い、AI要約を生成し、SRT、VTT、XLSX、JSON、または字幕埋め込みMP4としてエクスポートします。それだけです。

動画または音声ファイルをアップロードするだけ。Perso AIが話者を自動で分離し、99以上の言語で文字起こしを行い、AI要約を生成し、SRT、VTT、XLSX、JSON、または字幕付きMP4として書き出します。これだけです。

動画または音声ファイルをアップロードするだけ。Perso AI が話者を自動で分離し、99以上の言語で文字起こしし、AI要約を生成し、SRT、VTT、XLSX、JSON、または字幕付き MP4 として書き出します。それだけです。

今すぐ始めましょう

今すぐ始めましょう

今すぐ始めましょう

よくある質問

よくある質問

Perso AI Speech to Textとは何ですか?また、基本的な文字起こしツールとどう違いますか?

Perso AI Speech to Textは、動画や音声ファイルを99以上の言語で、話者ごとに分けた正確な文字起こしに変換します。基本的な文字起こしツールとは異なり、すべての話者を自動で検出し、任意のセグメントを別の検出済み話者に再割り当てでき、さらに編集可能なSRT、VTT、XLSX、JSONファイルとして書き出せるため、字幕制作、アーカイブ、コンテンツのワークフローに活用できます。

Perso AI の Speech to Text の利用料金はどのように請求されますか?

Perso AI 針對語音轉文字與人聲分離,會依媒體長度每分鐘扣除 1 點數,費率與 AI 配音相同。只有唇形配音需要 3 倍點數。各功能沒有使用上限,因此您可以依工作流程需求,自由分配點數到語音轉文字、人聲分離與配音。

Perso AI の Speech to Text の利用料金はどのように請求されますか?

Perso AI の音声をテキストに変換する機能は無料プランで利用できますか?

はい。Speech to Text は、Perso AI の無料プランで付帯の1分間の無料クレジット内で完全にご利用いただけます。これにより、短いクリップを書き起こしたり、話者分離の精度を確認したり、SRT または VTT のエクスポート品質をテストしたりしてから、より長いメディア向けに有料プランへアップグレードできます。

Perso AI の音声をテキストに変換する機能は無料プランで利用できますか?

Speech to Text は、より高い精度のために低速モードをサポートしていますか?

いいえ。Low SpeedモードはSpeech to TextまたはVoice Separationではサポートされていません。これは、よりゆっくりとした、丁寧な処理によって翻訳品質が向上するAI DubbingとLip Dubbingでのみ利用できます。Speech to Textは、翻訳よりも文字起こしに最適化された、高速で高精度なパイプラインで動作します。

Speech to Text は、より高い精度のために低速モードをサポートしていますか?

Speech to Text の出力に対象言語を設定できますか?

いいえ。Speech to Text は、話された言語をそのまま文字起こしする機能です。翻訳機能ではないため、ターゲット言語の設定はありません。動画を別の言語に翻訳し、音声も差し替えたい場合は、文字起こし、翻訳、音声合成を1つのワークフローで処理できる Perso AI Dubbing をご利用ください。

Speech to Text の出力に対象言語を設定できますか?

Perso AI Speech to Text はどのエクスポート形式をサポートしていますか?

Perso AI Speech to Textでは、4つの形式でエクスポートできます。字幕や動画プレーヤー向けのSRTとVTT、編集レビューや翻訳ワークフロー向けのXLSX、開発者向けの連携や自動化のためのJSONです。どの形式にも、話者ラベル、タイムスタンプ、そしてWebエディターで加えた編集内容が含まれます。

Perso AI Speech to Text はどのエクスポート形式をサポートしていますか?

Perso AI Speech to Text は何言語に対応していますか?

Perso AIの音声テキスト変換は、英語、韓国語、日本語、スペイン語、ドイツ語、フランス語、ポルトガル語、ロシア語を含む99以上の言語を自動で検出し、文字起こしします。言語検出は自動なので、ソース言語を事前に選択せずに多言語コンテンツをアップロードできます。

Perso AI Speech to Text は何言語に対応していますか?

エクスポートする前に、文字起こししたテキストを編集できますか?

はい。Perso AI のウェブエディタ内で、文字起こしされた各行を直接編集し、誤認識された単語を修正したり、句読点を整えたりできます。編集内容は SRT、VTT、XLSX、JSON の各エクスポートに自動で同期されるため、修正後に字幕ファイルを手作業で照合し直す必要はありません。

エクスポートする前に、文字起こししたテキストを編集できますか?

Perso AIの音声テキスト変換は、会議、インタビュー、YouTube動画に適していますか?

はい。Perso AI Speech to Text は、チーム会議、ポッドキャストのインタビュー、ウェビナー、長尺のYouTube動画など、複数話者のメディア向けに最適化されています。自動話者分離、正確なタイムスタンプ、SRT/VTTへの直接エクスポートにより、コンテンツチームやリサーチチームにおける手動文字起こしのワークフローをそのまま置き換えられます。

Perso AIの音声テキスト変換は、会議、インタビュー、YouTube動画に適していますか?

文字起こし後に話者を追加、名前変更、または削除できますか?

はい。Perso AIの結果ページでは、新しい話者を追加したり、既存のラベルを実名に変更したり、不要な話者を削除したりできます。すべての変更は、SRT、VTT、XLSX、JSON、または字幕付き動画ファイルをダウンロードすると自動的に反映されます。

文字起こし後に話者を追加、名前変更、または削除できますか?

字幕エンコーディングとは何ですか?また、字幕付き動画はどのようにダウンロードできますか?

字幕エンコードでは、文字起こしされた内容が動画に直接焼き込まれ、消せない字幕として表示されます。文字起こしの完了後、ダウンロードメニューから字幕エンコード済みMP4オプションを選択してください。書き出した動画は、SNS、社内チャネル、プレゼンテーションですぐに共有できます。

字幕エンコーディングとは何ですか?また、字幕付き動画はどのようにダウンロードできますか?

Perso AI Speech to Text で AI Summary はどのように機能しますか?

文字起こしの後、Perso AI はコンテンツの簡潔な要約を自動で生成します。要約はワンクリックでコピーでき、再生成して新しいバージョンを作成したり、会議やインタビューからアクション項目を抽出したりすることもできます。AI 要約は、音声をテキスト化するプロジェクトでご利用いただけます。

Perso AI Speech to Text で AI Summary はどのように機能しますか?

Perso AIで動画の文字起こしを始めましょう

動画をテキストに変換し、翻訳済みで口の動きに同期したバージョンをわずか数分で作成

Perso AIを無料で試す

Dashboard

Perso AIで動画の文字起こしを始めましょう

動画をテキストに変換し、翻訳済みで口の動きに同期したバージョンをわずか数分で作成

Perso AIを無料で試す

Dashboard

Perso AIで動画の文字起こしを始めましょう

動画をテキストに変換し、翻訳済みで口の動きに同期したバージョンをわずか数分で作成

Perso AIを無料で試す

Dashboard