Перейти к основному содержимому

Расшифровка аудио в текст онлайн

EdWord — онлайн-сервис перевода аудио в текст на базе нейросети Whisper. Загрузите аудиофайл — получите точную расшифровку за минуты. Точность до 98%, поддержка MP3, WAV, M4A, FLAC, OGG и других форматов.

60 бесплатных минут — без регистрации карты

Как перевести аудио в текст

1

Загрузите файл

Перетащите аудиофайл на сайт или отправьте в Telegram-бот @mywhisperedbot

2

Нейросеть распознаёт речь

Whisper обработает аудио: расставит знаки препинания и разделит на абзацы

3

Скачайте текст

Скопируйте результат или скачайте в формате TXT. Текст сохранится в личном кабинете

Какие форматы поддерживаются

MP3 / WAV

Самые популярные аудиоформаты — загружайте записи с диктофона, телефона, компьютера. Подробнее про MP3 →

M4A / FLAC

Форматы Apple и lossless-аудио. Идеально для качественных записей

OGG / WebM

Голосовые сообщения из Telegram и другие веб-форматы

Видеоформаты

MP4, AVI, MOV, MKV — извлечём аудиодорожку и расшифруем

Таблица форматов и ограничений

EdWord принимает все распространённые аудиоконтейнеры и кодеки. Ниже — сводка по максимальному размеру, рекомендуемому битрейту и особенностям каждого формата.

Формат Макс. размер Рекомендуемый битрейт Особенности
MP3 2 ГБ 128–192 kbps Универсальный формат. Подходит для подкастов, диктофонных записей, интервью. Лёгкий, быстро загружается. Отдельная страница про расшифровку MP3 →
WAV 2 ГБ 16 bit / 44,1 kHz Несжатый PCM-звук. Максимальное качество, но большой вес — час записи занимает около 600 МБ.
M4A 2 ГБ 128–256 kbps Формат Apple на базе AAC. Стандартный вывод диктофона iPhone и QuickTime.
FLAC 2 ГБ lossless Сжатие без потерь. Идеально для студийных записей и архивных материалов.
OGG 2 ГБ 96–192 kbps Открытый контейнер Vorbis/Opus. Часто встречается в веб-приложениях и играх.
WebM 2 ГБ 96–160 kbps Браузерный формат с кодеком Opus. Типичный вывод онлайн-звонилок и записей экрана.
OPUS 2 ГБ 32–128 kbps Кодек голосовых Telegram и WhatsApp. Экономичный, сохраняет разборчивость речи даже на низком битрейте.
AAC 2 ГБ 128–256 kbps Современный аналог MP3 с лучшим качеством на тех же килобитах. Используется в YouTube и стриминге.
WMA 2 ГБ 128–192 kbps Windows Media Audio. Встречается в старых диктофонах и записях с ПК на Windows.

Что влияет на точность распознавания

Whisper показывает до 98% точности на чистой студийной речи, но на реальных записях результат зависит от нескольких факторов. Учтите их заранее — это сэкономит время на правке.

  • Качество записи

    Битрейт 128 kbps и выше, частота дискретизации от 16 kHz. На записях ниже 64 kbps «съедаются» согласные, растёт процент ошибок.

  • Количество спикеров

    Один голос распознаётся точнее всего. При двух и более собеседниках без перебиваний точность сохраняется; хоровая речь и наложения усложняют работу модели.

  • Фоновый шум

    Улица, кафе, гудящая вентиляция снижают точность на 5–15%. Записывайте в тихом помещении или используйте микрофон с направленной диаграммой.

  • Акцент и дикция

    Whisper обучен на 50+ языках и хорошо справляется с региональными акцентами. Чёткая артикуляция и умеренный темп речи всегда дают лучший результат.

  • Длина файла

    Ограничений на длину нет — обработаем и десятиминутный, и четырёхчасовой файл. Длинные записи разбиваются на сегменты автоматически.

  • Встроенное шумоподавление Whisper

    Модель умеет игнорировать равномерные шумы: ветер, эхо, низкочастотный гул. Дополнительно чистить звук перед загрузкой обычно не требуется.

Для каких задач подходит

Подкастеры

Расшифровка эпизодов для шоунотов, нарезка цитат в соцсети, подготовка тайм-кодов и пост-продакшн черновика.

Журналисты

Быстрая расшифровка интервью и диктофонных записей под статью или большое исследование. Цитаты готовы к вычитке за минуты.

Студенты

Конспект лекций и семинаров автоматически. Загружайте запись с диктофона — получите структурированный текст для подготовки к экзаменам.

Специалисты

Расшифровка телефонных звонков с клиентами, разборов и голосовых заметок. Удобно для юристов, риелторов, консультантов.

10 000+ файлов обработано
98% точность
50+ языков
до 2 ГБ файлы

Кому полезна расшифровка аудио

Бизнес

Транскрибация совещаний, звонков, планёрок. Ничего не потеряется

Студенты

Конспектируйте лекции автоматически. Экономьте часы на записях

Журналисты

Расшифровка интервью для статей и исследований

Подкастеры

Готовые транскрипты для шоунотов и SEO

Выберите пакет

60 бесплатных минут для новых пользователей. Без подписки — покупайте пакеты минут

1 час
390 ₽
6.50 ₽/мин
3 часа
990 ₽
5.50 ₽/мин
−15%
Популярный
10 часов
2 990 ₽
4.98 ₽/мин
−23%
50 часов
12 900 ₽
4.30 ₽/мин
−34%

Частые вопросы

Как расшифровать аудио в текст онлайн?

Загрузите аудиофайл на edword.ru или отправьте его в Telegram-бот @mywhisperedbot. Нейросеть Whisper автоматически распознает речь, расставит знаки препинания и разделит текст на абзацы. Результат можно скопировать или скачать в формате TXT.

Какие аудиоформаты поддерживаются?

EdWord принимает все популярные аудиоформаты: MP3, WAV, M4A, FLAC, OGG, WebM. Также поддерживаются видеоформаты: MP4, AVI, MOV, MKV — мы автоматически извлечём аудиодорожку. Максимальный размер файла — 2 ГБ.

Расшифровка аудио бесплатная?

Новые пользователи получают 60 бесплатных минут расшифровки — без привязки карты и подписки. Далее доступны пакеты от 390 ₽ за 1 час. Купленные минуты не сгорают.

Какая точность распознавания речи?

До 98% при хорошем качестве записи. EdWord использует нейросеть Whisper от OpenAI — одну из лучших моделей распознавания речи. Поддерживается более 50 языков, включая русский, английский, немецкий, французский и испанский.

Можно ли расшифровать длинную запись?

Да, EdWord принимает файлы размером до 2 ГБ. Для длинных записей доступны пакеты до 100 часов для бизнеса (17 900 ₽). Минуты не сгорают — используйте в своём темпе.

Какой максимальный размер аудиофайла?

До 2 ГБ на один файл — этого хватает на 15–20 часов аудио в MP3 при среднем битрейте. Если у вас файл больше, разбейте его на части или обратитесь в поддержку — для бизнес-тарифов возможна обработка более длинных записей.

Как повысить точность расшифровки?

Используйте внешний или петличный микрофон, записывайте в тихом помещении без эха, держите битрейт от 128 kbps и частоту дискретизации не ниже 16 kHz. Попросите собеседников говорить по очереди, без перебиваний — это даёт прирост точности на 5–10%.

Можно ли загрузить несколько файлов сразу?

Да, в личном кабинете доступна пакетная загрузка — перетащите несколько аудио в окно, они встанут в очередь и обработаются параллельно. Каждый файл списывается из общего баланса минут.

Есть ли API для расшифровки аудио?

Функция API находится в разработке. Сейчас вы можете использовать веб-интерфейс на edword.ru или Telegram-бот для расшифровки аудио в текст.

Попробуйте расшифровку аудио бесплатно

60 минут без оплаты и подписки

Начать бесплатно

Поддержка

Если что-то не работает или есть вопрос — пишите напрямую.