Перейти к основному содержимому

MP4 в текст — расшифровка видеофайла

Загрузите видео в MP4 до 2 ГБ и получите текст с таймкодами: вебинар, урок, интервью или ролик, снятый на телефон.

60 бесплатных минут — без привязки карты

MP4 — контейнер, в котором видео живёт почти везде: съёмка на смартфон, экспорт из монтажных программ, записи вебинаров, скачанные уроки, скринкасты из OBS. Когда из такого файла нужен текст, привычный путь мучителен: выдирать звук конвертером, потом искать сервис под аудио, потом склеивать результат. EdWord принимает MP4 целиком — сервис сам достаёт аудиодорожку и превращает речь в текст за один заход, без промежуточных программ и ручных манипуляций с файлом.

  • Точность 98%
  • 50+ языков
  • TXT, DOCX, SRT, VTT
  • Таймкоды реплик

Технически поддерживаются типовые связки кодеков: видео H.264/AVC или H.265/HEVC, звук AAC — именно так пишут айфоны, андроиды, GoPro, Zoom и OBS по умолчанию. Разрешение картинки роли не играет: распознаётся только звуковая дорожка, поэтому 4K-файл и версия в 480p с одинаковой речью дадут одинаковый текст. Лимит — 2 ГБ на файл; двухчасовой вебинар в 1080p обычно укладывается с запасом, а для более тяжёлых исходников есть обходные пути через ссылку на видеохостинг.

Загрузить MP4 можно перетаскиванием на сайте edword.ru или отправкой файла в Telegram-бот @mywhisperedbot. Час видео обрабатывается за 4-6 минут моделями Whisper-класса с точностью около 98% на разборчивой речи; язык из 50+ поддерживаемых определяется автоматически. На выходе — текст с таймкодами и четыре формата экспорта: TXT и DOCX для документов, SRT и VTT для субтитров, которые монтажка или YouTube подхватят без правок.

Каждому новому пользователю — 60 минут бесплатно, дальше от 390 ₽ за час записи; оплаченное время копится на балансе и остаётся там сколько угодно. Методисты вытаскивают текст видеоуроков для базы знаний, маркетологи цитируют вебинары в статьях, студенты собирают конспекты из скринкастов, продюсеры готовят субтитры к роликам — всё из одного MP4-файла.

Как перевести в текст

1

Загрузите файл

Перетащите файл на сайт или отправьте в Telegram-бот @mywhisperedbot

2

Нейросеть распознаёт речь

Whisper обработает запись: расставит знаки препинания и разделит текст на абзацы

3

Скачайте текст

Скопируйте результат или скачайте в формате TXT. Текст сохранится в личном кабинете

Характеристики формата

Кодеквидео H.264/AVC, H.265/HEVC; аудио AAC (реже MP3, AC-3)
Битрейтлюбой типовой; на распознавание влияет только аудиодорожка
Макс. размер файла2 ГБ
Расширения.mp4, .m4v
Типичное применениеСъёмка со смартфона, записи Zoom и вебинаров, скринкасты OBS, экспорт из видеоредакторов

Почему качество картинки на текст влияет слабо

Распознавание работает со звуком: перед обработкой EdWord извлекает из MP4 аудиодорожку, а видеоряд отбрасывает. Отсюда практические выводы. Пережатие ролика в низкое разрешение перед загрузкой безопасно — главное, чтобы кодировщик сохранил исходное качество звука. А вот аудиопараметры имеют значение: речь с петличного микрофона в тихой комнате даст точность около 98%, запись с камеры через всю аудиторию — заметно ниже. Если планируете расшифровку заранее, пишите звук отдельной дорожкой или хотя бы держите источник речи ближе к микрофону: эти минуты подготовки экономят часы вычитки.

MP4 рядом с MOV, MKV и AVI

MP4 — самый распространённый контейнер, но EdWord принимает и его соседей: MOV с техники Apple, MKV из скринкастеров и рипов, AVI из старых архивов, WebM из браузерных записей. Все они обрабатываются одинаково — сервис распаковывает контейнер, находит аудиодорожку и отправляет её в распознавание. Конвертировать между контейнерами перед загрузкой смысла нет: это трата времени при том же результате. Единственное общее ограничение — 2 ГБ на файл; для более тяжёлых исходников работает трюк с пережатием разрешения или загрузкой по ссылке с видеохостинга.

Что говорят клиенты

«Раньше тратил 3 часа на расшифровку часовой лекции. Сейчас загружаю в EdWord и забираю готовый текст через 4 минуты.»

Алексей М. автор подкаста, 120+ выпусков

«Добавили бот в рабочий чат — теперь все голосовые становятся текстом сразу. Не надо переслушивать.»

Ирина С. продакт-менеджер, команда 8 человек

«Русский язык распознаёт хорошо — пропускаю всего пару слов на 15-минутном интервью. И что важно — без подписки и прямо из Telegram.»

Дмитрий К. журналист, расследования

Выберите пакет

60 бесплатных минут для новых пользователей. Без подписки — покупайте пакеты минут

1 час
390 ₽
6.50 ₽/мин
3 часа
990 ₽
5.50 ₽/мин
−15%
Популярный
10 часов
2 990 ₽
4.98 ₽/мин
−23%
50 часов
12 900 ₽
4.30 ₽/мин
−34%

Частые вопросы

Нужно ли вытаскивать звук из MP4 перед загрузкой?

Отдельная конвертация в MP3 или WAV лишняя: EdWord принимает видеофайл как есть и сам извлекает аудиодорожку перед распознаванием. Загружайте исходный MP4 на сайт или отправляйте его боту @mywhisperedbot — результат будет тем же, что и при загрузке чистого аудио, а шаг с конвертером экономится.

Моё видео в 4K весит больше 2 ГБ — как быть?

Три варианта. Пережмите ролик в 720p — звук останется прежним, а вес упадёт в разы, текст получится идентичным. Либо вытащите только аудиодорожку любым конвертером: час речи в MP3 весит 50-100 МБ. Либо опубликуйте видео на YouTube или VK Видео хотя бы по закрытой ссылке и дайте эту ссылку EdWord — сервис скачает и расшифрует ролик со своей стороны.

Можно ли сделать субтитры из MP4-файла?

Да, это один из главных сценариев. После обработки выберите экспорт в SRT или VTT — получите файл субтитров с таймкодами, готовый к загрузке на YouTube, в VK Видео или монтажную программу вроде Premiere и DaVinci Resolve. Перед публикацией субтитры стоит пробежать глазами: имена и редкие термины иногда требуют ручной правки.

iPhone снимает в HEVC — такой MP4 поддерживается?

Поддерживается. Ролики с iPhone и современных Android-флагманов в кодеке H.265/HEVC обрабатываются наравне с классическим H.264: звуковая дорожка там в AAC, и именно она идёт в распознавание. Файлы .mov с айфона тоже принимаются, как и .m4v.

Сколько времени занимает расшифровка часового MP4?

Порядка 4-6 минут после окончания загрузки файла. Само скачивание зависит от вашего канала: часовой вебинар в 1080p весит 500-1500 МБ, по обычному домашнему интернету это ещё несколько минут. Готовый текст появится в личном кабинете, а при работе через бота придёт уведомление в Telegram.

Сколько стоит расшифровка в EdWord?

Новые пользователи получают 60 минут бесплатно — без привязки карты и подписки. Далее доступны пакеты: 1 час за 390 ₽ (6.50 ₽/мин), 3 часа за 990 ₽ (5.50 ₽/мин), 10 часов за 2 990 ₽ (4.98 ₽/мин). Для команд и компаний — пакеты до 100 часов от 9 900 ₽. Купленные минуты не сгорают, списываются только за реально обработанное аудио.

Какая точность распознавания?

До 98% при качественной записи. EdWord использует нейросеть Whisper от OpenAI — одну из лучших моделей speech-to-text в мире. Поддерживается более 50 языков, включая русский, английский, немецкий, французский, испанский, украинский, казахский. Точность зависит от качества звука: внешний микрофон, отсутствие эха и битрейт от 128 kbps дают прирост 5–10%.

Безопасно ли загружать файлы в EdWord?

Да. Файлы шифруются при передаче по HTTPS и удаляются с серверов EdWord сразу после транскрибации. Мы не используем ваши записи для обучения моделей и не передаём третьим лицам. В личном кабинете хранится только текст расшифровки — вы можете удалить его в любой момент.

Есть ли ограничения по длительности или размеру?

Максимальный размер файла — 2 ГБ, максимальная длительность одной записи — 6 часов. Этого хватает на большинство совещаний, интервью, лекций и подкастов. Если нужно расшифровать более длинную запись — разбейте её на части или напишите в поддержку: для бизнес-тарифов возможны индивидуальные условия.

Попробуйте EdWord прямо сейчас

60 бесплатных минут для новых пользователей. Регистрация через Telegram или Яндекс — без карты.

Поддержка

Если что-то не работает или есть вопрос — пишите напрямую.