语音转文字转录

4 min read

上传音频文件(播客、视频音轨、语音备忘录),获取文字记录。该功能基于 ElevenLabs 的 Scribe 模型运行,适用于 Pro 和 Agency 计划。

适用场景

  • 为视频或播客生成文字记录(提升无障碍访问体验和 SEO 效果)
  • 将语音备忘录或口述内容转换为草稿
  • 从采访录音中生成可搜索的内容

支持的音频格式

  • MP3(推荐)
  • WAV
  • M4A
  • FLAC
  • OGG

文件大小上限为 500 MB。如内容较长,请分段上传并分别转录。

支持的语言

ElevenLabs Scribe 支持 30 多种语言,包括英语、西班牙语、法语、德语、意大利语、葡萄牙语、荷兰语、波兰语、俄语、日语、中文、阿拉伯语和挪威语。在语音转文字页面选择对应语言即可。

转录音频文件

  1. 前往 工具 → 语音转文字
  2. 点击 上传音频文件,或粘贴现有文件的 URL。
  3. 选择音频所用语言。
  4. 点击 转录
  5. 等待处理完成。一个 30 分钟的文件大约需要 1-2 分钟。
  6. 完成后,转录文本将显示在下方编辑器中。

转录文本的后续操作

  • 复制 全文到剪贴板
  • 下载 为 .txt 文件
  • 保存为草稿 - 以转录内容创建一篇新的 WordPress 草稿
  • 编辑 - 在保存前直接在转录编辑器中修改

积分消耗方式

语音转文字使用独立的积分池,与文字转语音分开计算。Pro 和 Agency 计划包含充足的额度。具体数量显示在语音转文字页面及您的计划详情中。

如果您拥有已开启语音转文字权限的 ElevenLabs 密钥,插件可直接使用该密钥。

提升准确率的技巧

  • 使用干净的音频(背景噪音少)可获得最佳效果
  • 说话清晰,避免多人同时说话
  • 句子之间适当停顿,有助于提高标点符号的准确性
  • 该插件目前不支持多说话人分离(仅适用于单一说话人转录)

使用限制

  • 每次只能处理一个文件(当前版本不支持批量转录)
  • 文件大小上限为 500 MB
  • 转录文本不会自动保存,离开页面前请复制、下载或保存为草稿

相关页面