音声テキスト変換(文字起こし)

4 min read

音声ファイル(ポッドキャスト、動画の音声トラック、ボイスメモ)をアップロードすると、テキストの文字起こしが得られます。この機能はElevenLabsのScribeモデルで動作します。ProプランとAgencyプランで利用できます。

使うべき場面

  • 動画やポッドキャストエピソードのテキスト文字起こしを作成する(アクセシビリティとSEOの向上)
  • ボイスメモや口述録音を下書きに変換する
  • インタビュー録音から検索可能なコンテンツを生成する

対応音声フォーマット

  • MP3(推奨)
  • WAV
  • M4A
  • FLAC
  • OGG

ファイルサイズは最大500MBまで対応しています。長いコンテンツはチャンクに分割して、個別に文字起こしを行ってください。

対応言語

ElevenLabs Scribeは30以上の言語に対応しており、英語、スペイン語、フランス語、ドイツ語、イタリア語、ポルトガル語、オランダ語、ポーランド語、ロシア語、日本語、中国語、アラビア語、ノルウェー語が含まれます。音声テキスト変換のページで言語を選択してください。

音声ファイルを文字起こしする

  1. ツール → 音声テキスト変換 に移動します。
  2. 音声ファイルをアップロード をクリックするか、既存ファイルのURLを貼り付けます。
  3. 音声の言語を選択します。
  4. 文字起こし をクリックします。
  5. 処理が完了するまで待ちます。30分のファイルは約1〜2分かかります。
  6. 準備ができると、文字起こし結果が下のエディターに表示されます。

文字起こし結果の活用方法

  • コピー: 全テキストをクリップボードにコピーする
  • ダウンロード: .txtファイルとしてダウンロードする
  • 下書き投稿として保存: 文字起こし内容を本文とした新しいWordPressの下書きを作成する
  • 編集: 保存前に文字起こしエディターで直接編集する

クレジットの消費について

音声テキスト変換は、テキスト音声変換とは別のクレジットプールを使用します。ProプランとAgencyプランでは、十分な利用枠が含まれています。正確な数量は音声テキスト変換のページとプランの詳細ページで確認できます。

音声テキスト変換の権限が有効な独自のElevenLabsキーをお持ちの場合、プラグインはそちらを使用できます。

精度を高めるヒント

  • 最良の結果を得るには、クリーンな音声(背景ノイズが少ない)を使用してください
  • はっきりと話す - 声の重なりを避けてください
  • 文と文の間に短い間を設けると、句読点の精度が向上します
  • 現時点では話者の分離には対応していません(シングルスピーカーの文字起こしのみ)

制限事項

  • 同時処理は1ファイルのみ(このリリースではバッチ文字起こし非対応)
  • 最大ファイルサイズは500MB
  • 文字起こしは自動保存されません。ページを離れる前に、コピー、ダウンロード、または下書き保存を行ってください

関連ページ