Транскрипция речи в текст

4 min read

Загрузите аудиофайл (подкаст, звуковую дорожку видео, голосовую заметку) и получите письменный транскрипт. Функция работает на модели Scribe от ElevenLabs. Доступно на планах Pro и Agency.

Когда использовать

  • Создавайте текстовые транскрипты для видео или эпизодов подкастов (доступность + SEO)
  • Превращайте голосовые заметки и диктовки в черновики
  • Генерируйте доступный для поиска контент из записей интервью

Поддерживаемые форматы аудио

  • MP3 (рекомендуется)
  • WAV
  • M4A
  • FLAC
  • OGG

Файлы размером до 500 МБ. Для длинного контента разделите файл на части и транскрибируйте каждую отдельно.

Поддерживаемые языки

ElevenLabs Scribe поддерживает более 30 языков, включая английский, испанский, французский, немецкий, итальянский, португальский, нидерландский, польский, русский, японский, китайский, арабский и норвежский. Выберите язык на странице «Речь в текст».

Транскрибирование аудиофайла

  1. Перейдите в Инструменты → Речь в текст.
  2. Нажмите Загрузить аудиофайл или вставьте URL существующего файла.
  3. Выберите язык аудио.
  4. Нажмите Транскрибировать.
  5. Дождитесь обработки. Файл длительностью 30 минут обрабатывается около 1-2 минут.
  6. Когда всё готово, транскрипт появится в редакторе ниже.

Что можно сделать с транскриптом

  • Скопировать полный текст в буфер обмена
  • Скачать в виде файла .txt
  • Сохранить как черновик записи - создаёт новый черновик WordPress с транскриптом в качестве содержимого
  • Редактировать прямо в редакторе транскриптов перед сохранением

Как списываются кредиты

Речь в текст использует отдельный пул кредитов, отличный от синтеза речи. На планах Pro и Agency в него входит щедрый лимит. Точные суммы отображаются на странице «Речь в текст» и в деталях вашего плана.

Если у вас есть собственный ключ ElevenLabs с включённым разрешением для речи в текст, плагин может использовать его вместо встроенного.

Советы для повышения точности

  • Используйте чистое аудио (минимум фонового шума) для лучших результатов
  • Говорите чётко - избегайте перекрывающихся голосов
  • Короткие паузы между предложениями улучшают точность расстановки знаков препинания
  • Плагин пока не разделяет дикторов (транскрипты рассчитаны на одного говорящего)

Ограничения

  • Один файл за раз (пакетная транскрипция в этой версии недоступна)
  • Максимальный размер файла - 500 МБ
  • Транскрипты не сохраняются автоматически - скопируйте, скачайте или сохраните как черновик перед уходом со страницы

Связанные страницы