Перейти к основному содержимому

Нейросеть для перевода аудио в текст

Распознавание аудиозаписей нейросетью Whisper-класса через сайт и Telegram.

60 бесплатных минут — без регистрации карты

Нейросеть для перевода аудио в текст нужна, когда хочется быстро получить расшифровку без ручного набора. Запись может быть простой заметкой, интервью, лекцией, звонком или фрагментом подкаста. EdWord использует модели Whisper-класса и принимает аудио через сайт, Telegram-бота и запись с микрофона в /mini.

В EdWord такой материал можно загрузить на сайте или отправить в Telegram-бот @mywhisperedbot. Для опубликованных роликов подходит обработка по ссылке: YouTube, VK, Rutube и другие источники, которые поддерживает yt-dlp. Первые 60 минут можно использовать бесплатно, дальше обработка оплачивается пакетами от 390 ₽ за час; это честный пробный сценарий для ключей с запросом «бесплатно». Речь распознаётся моделями Whisper-класса, язык определяется автоматически; для длинных записей доступны таймкоды и экспорт в TXT, DOCX, SRT или VTT.

Первые 60 минут доступны бесплатно, дальше стоимость начинается от 390 ₽ за час без подписки. Авторы диктуют черновики, студенты разбирают лекции, исследователи готовят цитаты, а команды сохраняют голосовые договорённости в виде текста. В групповых Telegram-чатах бот помогает команде читать важные записи в общем диалоге, а веб-кабинет сохраняет историю результатов для дальнейшей правки.

Как перевести в текст

1

Загрузите файл

Перетащите файл на сайт или отправьте в Telegram-бот @mywhisperedbot

2

Нейросеть распознаёт речь

Whisper обработает запись: расставит знаки препинания и разделит текст на абзацы

3

Скачайте текст

Скопируйте результат или скачайте в формате TXT. Текст сохранится в личном кабинете

Характеристики формата

КодекРечь из аудио передается в Whisper после подготовки файла
Битрейтзависит от исходного файла; важнее чистота речи
Макс. размер файла2 ГБ
Расширения.mp3, .m4a, .wav, .ogg, .flac
Типичное применениеГолосовые, диктофонные записи, интервью, лекции и созвоны

Выберите пакет

60 бесплатных минут для новых пользователей. Без подписки — покупайте пакеты минут

1 час
390 ₽
6.50 ₽/мин
3 часа
990 ₽
5.50 ₽/мин
−15%
Популярный
10 часов
2 990 ₽
4.98 ₽/мин
−23%
50 часов
12 900 ₽
4.30 ₽/мин
−34%

Частые вопросы

Как нейросеть переводит аудио в текст?

EdWord передаёт подготовленную запись модели распознавания речи. На выходе пользователь получает текст, который можно отредактировать, скачать или сверить по таймкодам.

Можно ли попробовать нейросеть бесплатно?

Да. Новому пользователю доступны первые 60 минут бесплатно, дальше стоимость начинается от 390 ₽ за час. Это пробный объём для проверки качества на своих реальных записях.

Какие аудио подходят для нейросети?

Лучше всего подходят записи с хорошо слышимой речью: диктофон, микрофон ноутбука, интервью, лекции и голосовые. Шум, эхо и перебивания снижают качество текста.

Нейросеть исправляет ошибки говорящего?

Нет. EdWord распознаёт сказанную речь и не переписывает смысл. Если в записи есть оговорки, термины или имена, финальный текст стоит проверить вручную.

Сколько стоит расшифровка в EdWord?

Новые пользователи получают 60 минут бесплатно — без привязки карты и подписки. Далее доступны пакеты: 1 час за 390 ₽ (6.50 ₽/мин), 3 часа за 990 ₽ (5.50 ₽/мин), 10 часов за 2 990 ₽ (4.98 ₽/мин). Для команд и компаний — пакеты до 100 часов от 9 900 ₽. Купленные минуты не сгорают, списываются только за реально обработанное аудио.

Какая точность распознавания?

До 98% при качественной записи. EdWord использует нейросеть Whisper от OpenAI — одну из лучших моделей speech-to-text в мире. Поддерживается более 50 языков, включая русский, английский, немецкий, французский, испанский, украинский, казахский. Точность зависит от качества звука: внешний микрофон, отсутствие эха и битрейт от 128 kbps дают прирост 5–10%.

Безопасно ли загружать файлы в EdWord?

Да. Файлы шифруются при передаче по HTTPS и удаляются с серверов EdWord сразу после транскрибации. Мы не используем ваши записи для обучения моделей и не передаём третьим лицам. В личном кабинете хранится только текст расшифровки — вы можете удалить его в любой момент.

Есть ли ограничения по длительности или размеру?

Максимальный размер файла — 2 ГБ, максимальная длительность одной записи — 6 часов. Этого хватает на большинство совещаний, интервью, лекций и подкастов. Если нужно расшифровать более длинную запись — разбейте её на части или напишите в поддержку: для бизнес-тарифов возможны индивидуальные условия.

Попробуйте EdWord прямо сейчас

60 бесплатных минут для новых пользователей. Регистрация через Telegram или Яндекс — без карты.

Поддержка

Если что-то не работает или есть вопрос — пишите напрямую.