MP4 в текст — расшифровка видеофайла
Загрузите видео в MP4 до 2 ГБ и получите текст с таймкодами: вебинар, урок, интервью или ролик, снятый на телефон.
MP4 — контейнер, в котором видео живёт почти везде: съёмка на смартфон, экспорт из монтажных программ, записи вебинаров, скачанные уроки, скринкасты из OBS. Когда из такого файла нужен текст, привычный путь мучителен: выдирать звук конвертером, потом искать сервис под аудио, потом склеивать результат. EdWord принимает MP4 целиком — сервис сам достаёт аудиодорожку и превращает речь в текст за один заход, без промежуточных программ и ручных манипуляций с файлом.
- Точность 98%
- 50+ языков
- TXT, DOCX, SRT, VTT
- Таймкоды реплик
Технически поддерживаются типовые связки кодеков: видео H.264/AVC или H.265/HEVC, звук AAC — именно так пишут айфоны, андроиды, GoPro, Zoom и OBS по умолчанию. Разрешение картинки роли не играет: распознаётся только звуковая дорожка, поэтому 4K-файл и версия в 480p с одинаковой речью дадут одинаковый текст. Лимит — 2 ГБ на файл; двухчасовой вебинар в 1080p обычно укладывается с запасом, а для более тяжёлых исходников есть обходные пути через ссылку на видеохостинг.
Загрузить MP4 можно перетаскиванием на сайте edword.ru или отправкой файла в Telegram-бот @mywhisperedbot. Час видео обрабатывается за 4-6 минут моделями Whisper-класса с точностью около 98% на разборчивой речи; язык из 50+ поддерживаемых определяется автоматически. На выходе — текст с таймкодами и четыре формата экспорта: TXT и DOCX для документов, SRT и VTT для субтитров, которые монтажка или YouTube подхватят без правок.
Каждому новому пользователю — 60 минут бесплатно, дальше от 390 ₽ за час записи; оплаченное время копится на балансе и остаётся там сколько угодно. Методисты вытаскивают текст видеоуроков для базы знаний, маркетологи цитируют вебинары в статьях, студенты собирают конспекты из скринкастов, продюсеры готовят субтитры к роликам — всё из одного MP4-файла.
Как перевести в текст
Нейросеть распознаёт речь
Whisper обработает запись: расставит знаки препинания и разделит текст на абзацы
Скачайте текст
Скопируйте результат или скачайте в формате TXT. Текст сохранится в личном кабинете
Характеристики формата
Почему качество картинки на текст влияет слабо
Распознавание работает со звуком: перед обработкой EdWord извлекает из MP4 аудиодорожку, а видеоряд отбрасывает. Отсюда практические выводы. Пережатие ролика в низкое разрешение перед загрузкой безопасно — главное, чтобы кодировщик сохранил исходное качество звука. А вот аудиопараметры имеют значение: речь с петличного микрофона в тихой комнате даст точность около 98%, запись с камеры через всю аудиторию — заметно ниже. Если планируете расшифровку заранее, пишите звук отдельной дорожкой или хотя бы держите источник речи ближе к микрофону: эти минуты подготовки экономят часы вычитки.
MP4 рядом с MOV, MKV и AVI
MP4 — самый распространённый контейнер, но EdWord принимает и его соседей: MOV с техники Apple, MKV из скринкастеров и рипов, AVI из старых архивов, WebM из браузерных записей. Все они обрабатываются одинаково — сервис распаковывает контейнер, находит аудиодорожку и отправляет её в распознавание. Конвертировать между контейнерами перед загрузкой смысла нет: это трата времени при том же результате. Единственное общее ограничение — 2 ГБ на файл; для более тяжёлых исходников работает трюк с пережатием разрешения или загрузкой по ссылке с видеохостинга.
Что говорят клиенты
«Раньше тратил 3 часа на расшифровку часовой лекции. Сейчас загружаю в EdWord и забираю готовый текст через 4 минуты.»
«Добавили бот в рабочий чат — теперь все голосовые становятся текстом сразу. Не надо переслушивать.»
«Русский язык распознаёт хорошо — пропускаю всего пару слов на 15-минутном интервью. И что важно — без подписки и прямо из Telegram.»
Выберите пакет
60 бесплатных минут для новых пользователей. Без подписки — покупайте пакеты минут
Частые вопросы
Нужно ли вытаскивать звук из MP4 перед загрузкой?
Отдельная конвертация в MP3 или WAV лишняя: EdWord принимает видеофайл как есть и сам извлекает аудиодорожку перед распознаванием. Загружайте исходный MP4 на сайт или отправляйте его боту @mywhisperedbot — результат будет тем же, что и при загрузке чистого аудио, а шаг с конвертером экономится.
Моё видео в 4K весит больше 2 ГБ — как быть?
Три варианта. Пережмите ролик в 720p — звук останется прежним, а вес упадёт в разы, текст получится идентичным. Либо вытащите только аудиодорожку любым конвертером: час речи в MP3 весит 50-100 МБ. Либо опубликуйте видео на YouTube или VK Видео хотя бы по закрытой ссылке и дайте эту ссылку EdWord — сервис скачает и расшифрует ролик со своей стороны.
Можно ли сделать субтитры из MP4-файла?
Да, это один из главных сценариев. После обработки выберите экспорт в SRT или VTT — получите файл субтитров с таймкодами, готовый к загрузке на YouTube, в VK Видео или монтажную программу вроде Premiere и DaVinci Resolve. Перед публикацией субтитры стоит пробежать глазами: имена и редкие термины иногда требуют ручной правки.
iPhone снимает в HEVC — такой MP4 поддерживается?
Поддерживается. Ролики с iPhone и современных Android-флагманов в кодеке H.265/HEVC обрабатываются наравне с классическим H.264: звуковая дорожка там в AAC, и именно она идёт в распознавание. Файлы .mov с айфона тоже принимаются, как и .m4v.
Сколько времени занимает расшифровка часового MP4?
Порядка 4-6 минут после окончания загрузки файла. Само скачивание зависит от вашего канала: часовой вебинар в 1080p весит 500-1500 МБ, по обычному домашнему интернету это ещё несколько минут. Готовый текст появится в личном кабинете, а при работе через бота придёт уведомление в Telegram.
Сколько стоит расшифровка в EdWord?
Новые пользователи получают 60 минут бесплатно — без привязки карты и подписки. Далее доступны пакеты: 1 час за 390 ₽ (6.50 ₽/мин), 3 часа за 990 ₽ (5.50 ₽/мин), 10 часов за 2 990 ₽ (4.98 ₽/мин). Для команд и компаний — пакеты до 100 часов от 9 900 ₽. Купленные минуты не сгорают, списываются только за реально обработанное аудио.
Какая точность распознавания?
До 98% при качественной записи. EdWord использует нейросеть Whisper от OpenAI — одну из лучших моделей speech-to-text в мире. Поддерживается более 50 языков, включая русский, английский, немецкий, французский, испанский, украинский, казахский. Точность зависит от качества звука: внешний микрофон, отсутствие эха и битрейт от 128 kbps дают прирост 5–10%.
Безопасно ли загружать файлы в EdWord?
Да. Файлы шифруются при передаче по HTTPS и удаляются с серверов EdWord сразу после транскрибации. Мы не используем ваши записи для обучения моделей и не передаём третьим лицам. В личном кабинете хранится только текст расшифровки — вы можете удалить его в любой момент.
Есть ли ограничения по длительности или размеру?
Максимальный размер файла — 2 ГБ, максимальная длительность одной записи — 6 часов. Этого хватает на большинство совещаний, интервью, лекций и подкастов. Если нужно расшифровать более длинную запись — разбейте её на части или напишите в поддержку: для бизнес-тарифов возможны индивидуальные условия.
Похожие форматы
Перевести видео в текст онлайн
Получите текст речи из видеофайла, Telegram-видео или ролика по ссылке.
Расшифровка видео в текст
Видеофайлы, вебинары и записи встреч становятся текстом с таймкодами и субтитрами.
Субтитры из видео в текст
Получите расшифровку речи и экспорт SRT/VTT для YouTube, LMS и видеоредакторов.
Звук из видео в текст
Извлеките речь из видео и получите текст для конспекта, статьи, протокола или субтитров.
Программа для перевода видео в текст
Работайте с видео через веб-кабинет и Telegram без установки десктопного софта.
WAV в текст — расшифровка несжатого звука
Студийные и диктофонные WAV-записи распознаются с максимальной точностью: PCM без потерь отдаёт модели самый чистый исходник речи.
Попробуйте EdWord прямо сейчас
60 бесплатных минут для новых пользователей. Регистрация через Telegram или Яндекс — без карты.