10 онлайн-сервисов для расшифровки речи в 2024

Сравнение лучших сервисов для транскрибации аудио и видео в текст

Время прочтения: 5 минут
Мы сравнили функционал 10 сервисов перевода аудио и видео в текст, которые поддерживают русский язык и оплату из России. В этой статье рассказываем, по каким параметрам сравнивали и делимся результатами в цифрах.
В этой статье:

Как мы оценивали

Мы взяли три ролика из разных сфер: новости экономики, образование и наука, нейросети. Длительность записей варьируется от 20 минут до часа — по длинным роликам проще оценить частоту ошибок и скорость расшифровки.

Сначала мы транскрибировали ролики вручную, чтобы сделать эталонную расшифровку — с абзацами, знаками препинания и идеальной орфографией. С этим текстом впоследствии сравнивали расшифровки из онлайн-сервисов.

За основной параметр сравнения мы взяли метрику WER (Word Error Rate) — она показывает процент ошибок из общего числа слов. Например, если исходный текст содержит 100 слов, а расшифровка содержит 10 ошибок, WER будет равен 10%. Чем ниже WER, тем точнее распознавание речи.
По каким критериям оценивали:

● наличие онлайн-редактора;
● поддерживаемые форматы импорта и экспорта;
● тестовый период и стоимость за минуту расшифровки;
● поддержка нескольких языков;
● скорость обработки аудио и видео;
● наличие функции разбивки текста по спикерам;
● грамотность: частота ошибок, расстановка знаков препинания, деление текста на абзацы, заглавные буквы;
● возможности сервисов для бизнеса;
● дополнительный функционал
Teamlogs.ru — онлайн-сервис транскрибации, который принимает любые форматы аудио- и видеофайлов до 1,5 Гб на русском и английском языке.

При регистрации новые пользователи получают 15 бесплатных минут — для теста. Затем минимальная стоимость расшифровки — 6 рублей за минуту. Чем больше минут вы покупаете, тем выгоднее будет цена
видеоконтент

Скриншот с сайта Teamlogs

В сервисе есть редактор. Воспроизведение записи синхронизировано с бегунком в тексте расшифровки — не нужно вручную искать фрагмент аудио. Готовый файл можно выгрузить в форматах DOCX, XLSX, SRT. При экспорте можно отключить проставление таймкодов или изменить их частоту, а еще включить или выключить нумерацию реплик, указание имен спикеров.
видеоконтент

Скриншот редактора Teamlogs

Результат теста:
● WER или частота ошибок в словах: 11,46%
● Скорость расшифровки 20-ти минутного видео: около 2 минут
● Тестовый период: 15 минут
● Редактор: есть
● Деление по спикерам: есть
● Расстановка знаков препинания: есть
● Экспорт в форматах: DOCX, SRT и XLSX
Особенности сервиса:
● Не разбивает текст на абзацы
● Есть функции конспектирования и выделения ключевых слов
Возможности для бизнеса:
● Можно работать в команде
● Есть возможность оплаты со счета организаций
● Данные обрабатываются на территории РФ и не передаются третьим лицам
Попробуйте Teamlogs бесплатно и получите 15 тестовых минут
Есть бесплатный тариф, однако на нем транскрибацию в общей очереди можно прождать более суток — сервис не принимает больше одного файла одновременно. Для срочных случаев есть платные тарифы, самый дешевый из них — 2.2 рубля за минуту.

Писец поддерживает любые форматы, расшифровывает файлы на русском и английском языке
видеоконтент

Скриншот главной страницы с сайта Писец

Результат теста:
● WER или частота ошибок в словах: 13,82%
● Скорость расшифровки 20-ти минутного видео: около 2 минут на платном тарифе
● Тестовый период: есть бесплатный тариф
● Редактор: нет
● Деление по спикерам: есть
● Расстановка знаков препинания: есть
● Экспорт в форматах: DOCX на почту
Особенности сервиса:
● Разбивает текст на абзацы
Возможности для бизнеса:
● Можно создать корпоративный аккаунт
Сервис для транскрибации медиа-файлов на 6 языках. Поддерживает практически все популярные форматы. Загрузить в сервис можно практически все популярные форматы, а готовый материал скачать в формате TXT — с таймкодами или без них.

Стоимость минуты расшифровки — 5 рублей. При регистрации в подарок начисляется 90 рублей для тестовой транскрибации
расшифровка интервью

Скриншот главной страницы с сайта WordVoice

Результат теста:
● WER или частота ошибок в словах: 12,47%
● Скорость расшифровки 20-ти минутного видео: около 5 минут
● Тестовый период: есть
● Редактор: есть, но изменения в нем не сохраняются
● Деление по спикерам: нет
● Расстановка знаков препинания: есть
● Экспорт в форматах: TXT
Подойдет компаниям — рассчитан на расшифровку онлайн-встреч. После регистрации доступно 180 минут для транскрибации, затем минимальный тариф — 850 рублей в месяц или 500 минут для расшифровки встреч. Загрузить можно файлы в форматах MP3, M4A, WAV, MP4.

На сайте указано, что сервис никому не передает данные, но также указано, что сервис использует ChatGPT 🤷‍♀️
расшифровка интервью

Скриншот с сайта Mymeet. ai

Результат теста:
● WER или частота ошибок в словах: 11,76%
● Скорость расшифровки: около 8 минут
● Тестовый период: 180 минут онлайн-встреч
● Редактор: нет
● Деление по спикерам: есть
● Расстановка знаков препинания: есть
● Экспорт в форматах: DOCX, SRT, XLSX
Особенности сервиса:
● Распознает 58 языков
● Генерирует краткое содержание встречи с помощью ChatGPT-4
● Умеет выделять из текста задачи и исполнителей
● Делит текст на абзацы
Возможности для бизнеса:
● Есть возможность интеграции с ZOOM и Google Meet
● Может автоматически записывать встречи и присылать отчеты всем участникам на почту
Принимает для расшифровки большинство популярных форматов на 50-ти языках. Первые 15 минут бесплатно, далее при регистрации можно получить еще 60 бонусных или оплатить тариф — от 4-х рублей за минуту
расшифровка интервью

Скриншот главной страницы с сайта Any2text

Результат теста:
● WER или частота ошибок в словах: 13,69%
● Скорость расшифровки 20-ти минутного видео: около 2 минут
● Тестовый период: 15 минут
● Редактор: нет
● Деление по спикерам: нет
● Расстановка знаков препинания: есть
● Экспорт в форматах: DOCX, XLSX, SRT, TXT
Бесплатный сервис расшифровки аудио в текст. Принимает файлы на русском, английском, немецком и испанском языках. Не поддерживает самый популярный формат видео MP4
расшифровка интервью

Скриншот главной страницы с сайта Silero

Результат теста:
● WER или частота ошибок в словах: 17,07%
● Скорость расшифровки 20-ти минутного видео: около 2 минут
● Тестовый период: сервис бесплатный
● Редактор: нет
● Деление по спикерам: нет
● Расстановка знаков препинания: нет
● Экспорт в форматах: XLSX таблица на почту
Особенности сервиса:
● Не поддерживает видео MP4
● Есть ограничения на загрузку видео: длина до часа, размер до 100 Мб
Поддерживает более 300 форматов и 50 языков. Бесплатно можно расшифровать файл длительностью до минуты, платный тариф — от 3 рублей за минуту
расшифровка интервью

Скриншот главной страницы с сайта Conspecto

Результат теста:
● WER или частота ошибок в словах: 11,99%
● Скорость расшифровки 20-ти минутного видео: около 2 минут
● Тестовый период: минута
● Редактор: нет
● Деление по спикерам: нет
● Расстановка знаков препинания: есть
● Экспорт в форматах: TXT, HTML, DOCX, SRT
Особенности сервиса:
● При оплате от 4 рублей за минуту дополнительно извлекается конспект транскрибируемого файла
● Есть Telegram-бот
Бесплатный сервис. Расшифровывает файлы на русском языке, поддерживает все основные форматы. Есть встроенный конвертер файлов
расшифровка интервью

Скриншот главной страницы с сайта Converter App

Результат теста:
● WER или частота ошибок в словах: 24,45%
● Скорость расшифровки 20-ти минутного видео: около 2 минут, но файлы грузятся очень долго
● Тестовый период: сервис бесплатный
● Редактор: нет
● Деление по спикерам: есть
● Расстановка знаков препинания: есть
● Экспорт в форматах: TXT
Особенности сервиса:
● Есть конвертер файлов
При регистрации пользователю доступно 10 тестовых минут, дальше расшифровка стоит 100 рублей за 1 час. Из интересного — можно загружать файлы через Telegram-бота
расшифровка интервью

Скриншот главной страницы с сайта Speech to text

Результат теста:
● WER или частота ошибок в словах: 14,29%
● Скорость расшифровки 20-ти минутного видео: около 2 минут
● Тестовый период: 10 минут
● Редактор: есть
● Деление по спикерам: нет
● Расстановка знаков препинания: есть
● Экспорт в форматах: TXT
Особенности сервиса:
● Не принимает формат видео mp4
Платформа для транскрибации аудио — только на русском языке
расшифровка интервью

Скриншот главной страницы с сайта Wonderscribe

Результат теста:
● WER или частота ошибок в словах: 16,39%
● Скорость расшифровки 20-ти минутного видео: около 2 минут
● Тестовый период: сервис бесплатный
● Редактор: есть
● Деление по спикерам: есть
● Расстановка знаков препинания: есть
● Экспорт в форматах: PDF, WORD, TXT, CSV

Сравнительная таблица

Мы подготовили итоговую таблицу с основными критериями — отсортировали сервисы по показателю WER, чтобы наглядно сравнить все 10
расшифровка интервью

Таблица сравнения сервисов транскрибации на русском языке за 2024 год

Попробуйте Teamlogs бесплатно и получите 15 тестовых минут
Тестовый доступ