Перейти к основному содержимому

Транскрибация английской речи в текст

Лекции, подкасты и созвоны на английском превращаются в точный английский текст: модели Whisper-класса обучены на тысячах часов англоязычной речи.

60 бесплатных минут — без привязки карты

Запись на английском появляется в жизни по десятку поводов: подкаст для подготовки к IELTS, лекция зарубежного университета, созвон с иностранным заказчиком, доклад с конференции, интервью с экспатом. Переслушивать чужой язык тяжелее, чем родной: мешают акцент, темп, незнакомые термины. Текстовая расшифровка снимает эту нагрузку — вы читаете в своём темпе, выделяете новые слова, копируете цитаты в заметки или переводчик.

  • Точность 98%
  • 50+ языков
  • TXT, DOCX, SRT, VTT
  • Таймкоды реплик

Модели Whisper-класса, на которых работает EdWord, обучались прежде всего на английском — это их сильнейший язык. На чистой записи точность достигает ~98%, устойчиво распознаются британское, американское, австралийское и индийское произношение. Язык определяется автоматически: загрузили файл — получили английский текст без ручного выбора настроек. Расшифровка выдаётся на языке оригинала, поэтому цитаты сохраняют исходные формулировки; для перевода готовый текст удобно отправить в любой переводчик.

Загрузить запись можно тремя путями: на сайте edword.ru перетащить файл до 2 ГБ (MP3, WAV, M4A, MP4, MOV и другие форматы), отправить в Telegram-бот @mywhisperedbot или вставить ссылку на YouTube, VK Видео, Rutube. Час английской речи обрабатывается примерно за 4-6 минут. Результат — текст с таймкодами по желанию и экспорт в TXT, DOCX, SRT или VTT: последние два формата сразу годятся как английские субтитры.

Новым пользователям выдаётся 60 бесплатных минут без привязки карты. Дальше пакеты от 390 ₽ за час, купленные минуты остаются на балансе без срока годности. Студент разбирает курс с Coursera, аспирант цитирует англоязычные доклады в диссертации, менеджер фиксирует договорённости после звонка с зарубежным партнёром — каждому хватает одного окна браузера или чата в Telegram.

Как перевести в текст

1

Загрузите файл

Перетащите файл на сайт или отправьте в Telegram-бот @mywhisperedbot

2

Нейросеть распознаёт речь

Whisper обработает запись: расставит знаки препинания и разделит текст на абзацы

3

Скачайте текст

Скопируйте результат или скачайте в формате TXT. Текст сохранится в личном кабинете

Почему английский — самый сильный язык Whisper

Обучающая выборка моделей Whisper-класса на две трети состоит из англоязычной речи: подкасты, лекции, аудиокниги, разговорные записи. Отсюда практический эффект — на английском модель увереннее всего разбирает быструю речь, редуцированные окончания и профессиональную лексику: юридические, медицинские и IT-термины пишутся корректно, имена собственные вроде названий компаний и продуктов распознаются чаще, чем на любом другом языке. Чтобы выжать максимум точности, позаботьтесь об исходнике: записывайте с микрофона ближе 30-50 см, избегайте наложения голосов и фоновой музыки. Час чистой английской записи EdWord обрабатывает за 4-6 минут и отдаёт текст, готовый к цитированию.

Кому пригодится английский транскрипт

Студенты превращают эпизоды подкастов в материал для подготовки к IELTS и TOEFL: читают текст параллельно с прослушиванием и выписывают конструкции. Аспиранты и исследователи расшифровывают доклады с конференций, чтобы точно цитировать источники. Команды, работающие с зарубежными клиентами, сохраняют текст созвонов — договорённости и сроки потом ищутся поиском по документу за секунды. Авторы контента вытаскивают из англоязычных интервью цитаты для статей и постов. Во всех сценариях путь одинаковый: файл или ссылка — текст через несколько минут — экспорт в удобный формат.

Что говорят клиенты

«Раньше тратил 3 часа на расшифровку часовой лекции. Сейчас загружаю в EdWord и забираю готовый текст через 4 минуты.»

Алексей М. автор подкаста, 120+ выпусков

«Добавили бот в рабочий чат — теперь все голосовые становятся текстом сразу. Не надо переслушивать.»

Ирина С. продакт-менеджер, команда 8 человек

«Русский язык распознаёт хорошо — пропускаю всего пару слов на 15-минутном интервью. И что важно — без подписки и прямо из Telegram.»

Дмитрий К. журналист, расследования

Выберите пакет

60 бесплатных минут для новых пользователей. Без подписки — покупайте пакеты минут

1 час
390 ₽
6.50 ₽/мин
3 часа
990 ₽
5.50 ₽/мин
−15%
Популярный
10 часов
2 990 ₽
4.98 ₽/мин
−23%
50 часов
12 900 ₽
4.30 ₽/мин
−34%

Частые вопросы

Переводит ли EdWord английскую речь на русский?

Сервис выдаёт расшифровку на языке оригинала: из английской записи получается английский текст. Готовый транскрипт удобно прогнать через любой переводчик — с текстом это занимает секунды, тогда как перевод на слух отнимает часы. Заодно у вас остаются исходные английские формулировки для точных цитат.

Справится ли распознавание с акцентом?

Whisper обучался на речи носителей из разных стран, поэтому британский, американский, австралийский и канадский варианты распознаются уверенно. Индийский и азиатский акценты тоже расшифровываются, хотя точность может просесть на пару процентов. Сильнее акцента на результат влияет качество записи: близкий микрофон и тихая комната дают больше, чем идеальное произношение на фоне улицы.

Можно ли получить английские субтитры к видео?

Да. Загрузите MP4, MOV или другой видеофайл до 2 ГБ либо вставьте ссылку на ролик — на выходе выберите экспорт в SRT или VTT. Эти файлы понимают YouTube, монтажные программы и большинство плееров, так что субтитры подключаются к видео без правок вручную.

Что будет, если в записи английский вперемешку с русским?

Язык определяется автоматически по звучанию записи. Когда языки чередуются длинными блоками — например, доклад на английском и обсуждение на русском, — основная часть распознаётся корректно. Короткие вставки на втором языке внутри фразы иногда расшифровываются с ошибками, такие места удобно проверить по таймкодам.

Сколько стоит расшифровать час английского аудио?

Первые 60 минут бесплатны и карту привязывать никто не просит. Дальше пакеты: 1 час — 390 ₽, 3 часа — 990 ₽, 10 часов — 2 990 ₽, 50 часов — 12 900 ₽. Оплаченные минуты лежат на балансе сколько угодно, подписки и автосписаний в сервисе нет.

Сколько стоит расшифровка в EdWord?

Новые пользователи получают 60 минут бесплатно — без привязки карты и подписки. Далее доступны пакеты: 1 час за 390 ₽ (6.50 ₽/мин), 3 часа за 990 ₽ (5.50 ₽/мин), 10 часов за 2 990 ₽ (4.98 ₽/мин). Для команд и компаний — пакеты до 100 часов от 9 900 ₽. Купленные минуты не сгорают, списываются только за реально обработанное аудио.

Какая точность распознавания?

До 98% при качественной записи. EdWord использует нейросеть Whisper от OpenAI — одну из лучших моделей speech-to-text в мире. Поддерживается более 50 языков, включая русский, английский, немецкий, французский, испанский, украинский, казахский. Точность зависит от качества звука: внешний микрофон, отсутствие эха и битрейт от 128 kbps дают прирост 5–10%.

Безопасно ли загружать файлы в EdWord?

Да. Файлы шифруются при передаче по HTTPS и удаляются с серверов EdWord сразу после транскрибации. Мы не используем ваши записи для обучения моделей и не передаём третьим лицам. В личном кабинете хранится только текст расшифровки — вы можете удалить его в любой момент.

Есть ли ограничения по длительности или размеру?

Максимальный размер файла — 2 ГБ, максимальная длительность одной записи — 6 часов. Этого хватает на большинство совещаний, интервью, лекций и подкастов. Если нужно расшифровать более длинную запись — разбейте её на части или напишите в поддержку: для бизнес-тарифов возможны индивидуальные условия.

Похожие форматы

Whisper-транскрибация онлайн: без Python, GPU и терминала

Качество распознавания уровня Whisper прямо в браузере и Telegram: точность ~98%, 50+ языков, субтитры SRT/VTT на выходе. Окружение настраивать незачем.

Транскрибация YouTube-видео

Вставьте ссылку на ролик YouTube и получите текст с таймкодами без скачивания файла.

Лекция в текст: расшифровка записи пары и видеолекции

Диктофонная запись пары или видеолекция превращается в полный текст с таймкодами — ищите определения через Ctrl+F вместо перемотки полутора часов аудио.

Субтитры из видео в текст

Получите расшифровку речи и экспорт SRT/VTT для YouTube, LMS и видеоредакторов.

Транскрибация интервью

Расшифруйте интервью с диктофона, Zoom, Telegram или видео и получите текст для статьи.

Распознавание речи в текст: технология и практика

Нейросети Whisper-класса превращают живую речь в текст: диктовка в браузере, голосовые в Telegram, записи разговоров.

Попробуйте EdWord прямо сейчас

60 бесплатных минут для новых пользователей. Регистрация через Telegram или Яндекс — без карты.

Поддержка

Если что-то не работает или есть вопрос — пишите напрямую.