Перейти к основному содержимому

Как сделать субтитры к видео: автоматическая генерация SRT и VTT

Субтитры к часовому ролику вручную набирают за 4–6 часов. Автоматика справляется за 4–6 минут и сразу отдаёт готовый файл SRT или VTT с таймкодами. Разберём весь путь: от исходного видео до файла, который принимают YouTube, VK Видео и любой видеоплеер.

Коротко

Загрузите видео на edword.ru → дождитесь распознавания → скачайте SRT или VTT → при желании поправьте пару реплик → залейте файл на платформу. Новым пользователям — 60 минут бесплатно, карта не нужна.

Зачем видео нужны субтитры

Цифры говорят сами за себя. Огромная доля роликов в ленте смотрится без звука: в транспорте, на работе, ночью рядом со спящим ребёнком. Видео с текстом на экране удерживает такого зрителя, немое видео он пролистывает за секунду.

Есть и другие причины добавить субтитры:

  • Доступность. Слабослышащие зрители получают полный доступ к содержанию.
  • SEO для видео. Поисковики и рекомендательные алгоритмы читают текст субтитров и лучше понимают тему ролика.
  • Иностранная аудитория. Человеку с базовым русским проще читать, чем воспринимать беглую речь на слух.
  • Шумные записи. Если спикер говорит тихо или микрофон был далеко, текст спасает просмотр.

SRT и VTT: чем отличаются форматы

Два стандарта покрывают 99% задач. Оба — обычные текстовые файлы, которые открываются в любом редакторе, хоть в «Блокноте».

SRT (SubRip) — ветеран среди форматов. Каждый блок состоит из номера, таймкода через запятую в миллисекундах и текста реплики. SRT принимают YouTube, VK Видео, монтажные программы и все популярные плееры.

VTT (WebVTT) — веб-стандарт для HTML5-видео. Файл начинается со строки WEBVTT, миллисекунды отделяются точкой, поддерживается позиционирование и стили текста. Выбирайте VTT, когда субтитры нужны для плеера на сайте через тег <track>.

Критерий SRT VTT
Разделитель миллисекунд Запятая Точка
Стили и позиция текста Нет Есть
YouTube, VK Видео Принимают Принимают
HTML5-плеер на сайте Частично Родной формат

Сомневаетесь — берите SRT. Его понимает максимум площадок, а сконвертировать в VTT можно позже. В EdWord доступны оба варианта экспорта, плюс TXT и DOCX, если понадобится чистый текст без таймкодов.

Способ 1. Делаем субтитры из файла через сайт EdWord

Базовый сценарий: ролик лежит на компьютере, нужен файл субтитров. Пошагово:

  1. Откройте страницу генерации субтитров из видео на edword.ru и войдите через Telegram или Яндекс. Новый аккаунт сразу получает 60 бесплатных минут.
  2. Перетащите видео в окно загрузки. Подходят MP4, MOV, AVI, MKV, WebM и аудиоформаты вроде MP3 или WAV. Лимит на файл — 2 ГБ, этого хватает на полнометражную запись вебинара.
  3. Запустите обработку. Сервис распознаёт речь моделями класса Whisper: язык определяется сам, точность на чистой записи держится около 98%. Часовая лекция обрабатывается за 4–6 минут — успеете налить кофе.
  4. Скачайте результат в SRT или VTT. Таймкоды уже расставлены, реплики нарезаны на блоки.
  5. Пробегитесь по тексту глазами и поправьте редкие термины или фамилии — об этом ниже.

Все расшифровки сохраняются в истории личного кабинета: через месяц вернётесь и скачаете тот же файл заново, в другом формате.

Сделайте субтитры к своему ролику
60 бесплатных минут распознавания, экспорт в SRT и VTT, карта не требуется
Создать субтитры

Способ 2. Видео через Telegram-бота

Когда ролик уже лежит в телефоне или его прислали в мессенджере, удобнее бот @mywhisperedbot. Схема из двух действий: пересылаете видео боту — получаете расшифровку в ответ. Бот принимает видеофайлы, кружки, голосовые и аудио.

Для команд есть отдельный трюк: добавьте бота в рабочий чат, и он будет автоматически переводить в текст все голосовые и видеосообщения участников. Материал для субтитров к внутренним видеоинструкциям копится сам собой.

Способ 3. Ролик по ссылке, без скачивания

Видео уже опубликовано на YouTube, VK Видео или Rutube? Скачивать его на диск незачем. Вставьте ссылку на страницу извлечения текста из видео — EdWord сам заберёт ролик с площадки, вытащит аудиодорожку и распознает речь. Поддерживаются сотни источников, которые умеет обрабатывать yt-dlp.

Типичный кейс: конкурент выложил вебинар без субтитров, а вам нужны цитаты с точными таймкодами для разбора. Ссылка → расшифровка → готовые тайминги.

Как устроен тайминг внутри файла

Загляните внутрь SRT — структура прозрачна:

14
00:03:12,480 --> 00:03:16,200
Переходим ко второму блоку —
настройке рекламного кабинета.

Первая строка — порядковый номер блока. Вторая — время появления и исчезновения фразы с точностью до миллисекунды. Дальше — сам текст, одна или две строки.

Автогенерация расставляет эти метки по реальным границам фраз в речи. Руками такой точности добиться тяжело: на слух человек промахивается на 200–500 мс, и субтитры начинают «отставать» от губ спикера. Если рассинхрон всё же появился (например, вы обрезали начало ролика после генерации), сдвиньте все таймкоды разом — такая функция есть в бесплатных редакторах субтитров вроде Subtitle Edit или Aegisub.

Совет

Сначала финализируйте монтаж, потом делайте субтитры. Каждая склейка после генерации сдвигает тайминг, и файл придётся править или создавать заново.

Правка субтитров: 6 правил читаемости

Машина отдаёт точный текст, а комфорт чтения на экране — зона ответственности редактора. Проверенные ориентиры:

  1. До 42 символов в строке. Длинные строки заставляют глаз бегать и перекрывают картинку.
  2. Максимум две строки на блок. Три строки съедают треть кадра.
  3. Скорость чтения — до 17 символов в секунду. Блок из 60 символов должен висеть на экране минимум 3,5 секунды.
  4. Минимальная длительность блока — 1 секунда. Короткие вспышки текста зритель прочитать физически неспособен.
  5. Разрывайте строки по смыслу. Предлог оставляйте со словом, к которому он относится: «на / встрече» читается хуже, чем «на встрече».
  6. Убирайте мусорные слова. «Эээ», «ну вот», «как бы» в субтитрах раздражают сильнее, чем в живой речи.

На практике правка автоматической расшифровки часового ролика занимает 15–30 минут: пробежаться по редким терминам, фамилиям и англицизмам. Сравните с 4–6 часами набора с нуля.

Куда загружать готовый файл

YouTube. Творческая студия → «Субтитры» → выберите ролик → «Добавить» → «Загрузить файл». Подойдёт и SRT, и VTT. Загруженные вручную субтитры вытесняют автоматические YouTube-титры, качество которых заметно слабее.

VK Видео. В настройках ролика есть пункт «Субтитры» — туда загружается SRT-файл с указанием языка.

Плеер на своём сайте. Положите VTT-файл рядом с видео и подключите строкой <track src="subs.ru.vtt" kind="subtitles" srclang="ru"> внутри тега <video>.

Вшитые субтитры (хардсаб). Для Reels, Shorts и клипов текст впечатывают прямо в картинку. Импортируйте SRT в монтажную программу — CapCut, DaVinci Resolve и Premiere Pro читают формат напрямую — и стилизуйте под свой бренд.

Если исходник у вас в MP4 и нужен просто текст расшифровки без видеоплатформ — страница конвертации MP4 в текст закрывает эту задачу тем же движком.

Ручной набор против автогенерации: считаем время и деньги

Возьмём часовой ролик — запись вебинара или интервью.

Подход Время Стоимость
Набор вручную самому 4–6 часов Ваше рабочее время
Фрилансер-расшифровщик 1–2 дня ожидания 1 000–2 500 ₽/час записи
EdWord + правка ~30 минут всего 0 ₽ в рамках триала, далее от 299 ₽/час в пакете

Про цены подробнее: час распознавания стоит 390 ₽, пакет на 10 часов — 2 990 ₽ (те самые 299 ₽ за час), на 50 часов — 12 900 ₽. Купленные минуты лежат на балансе без срока годности, подписку оформлять никто не заставляет. Командам, которые субтитруют контент потоком, подойдут пакеты 50 часов за 9 900 ₽ и 100 часов за 17 900 ₽.

Типичные ошибки новичков

  • Субтитры до финального монтажа. Обрезали интро — весь тайминг уехал. Генерируйте файл по финальной версии ролика.
  • Слепая публикация без вычитки. Автоматика путает редкие имена и профжаргон. Десять минут вычитки спасают репутацию.
  • VTT-файл со строкой WEBVTT, загруженный как SRT. Часть плееров молча откажется его читать. Следите за соответствием расширения и содержимого.
  • Кодировка Windows-1251. Кириллица превращается в кракозябры. Файлы EdWord сразу идут в UTF-8, а вот после правки в старых редакторах кодировку стоит проверить.
  • Расчёт на «потом переведу этим же файлом». Расшифровка выполняется на языке оригинала записи. Перевод субтитров — отдельная задача для переводчика.

Заключение

Схема рабочая и короткая: финальный монтаж → загрузка ролика на EdWord (файлом, через бота или по ссылке) → экспорт SRT/VTT → 15–30 минут правки → загрузка на платформу. Часовой ролик получает аккуратные субтитры за полчаса вместо рабочего дня, а первые 60 минут распознавания достаются бесплатно.

Проверьте на своём видео
Загрузите ролик и получите файл SRT или VTT — 60 минут в подарок новым пользователям
Сделать субтитры бесплатно

Частые вопросы

Какой формат субтитров выбрать — SRT или VTT?

SRT — универсальный выбор для YouTube, VK Видео и монтажных программ. VTT нужен для HTML5-плеера на собственном сайте. EdWord экспортирует оба формата, так что можно скачать сразу два файла из одной расшифровки.

Сколько стоит сделать субтитры к часовому видео?

Новый пользователь укладывает первый час в бесплатные 60 минут триала. Дальше час распознавания обойдётся в 390 ₽ разово или от 258 ₽ в крупных пакетах (50 часов за 12 900 ₽). Минуты остаются на балансе бессрочно.

Насколько точной будет автоматическая расшифровка?

На чистой записи с внятной речью точность держится около 98%. Модели Whisper-класса сами определяют язык и понимают более 50 языков. Правка сводится к редким терминам, фамилиям и аббревиатурам.

Можно ли сделать субтитры к чужому видео с YouTube?

Технически да: вставьте ссылку на ролик, и EdWord обработает его без скачивания — поддерживаются YouTube, VK Видео, Rutube и другие площадки. Публиковать чужой контент со своими субтитрами стоит только с разрешения автора.

Файл какого размера можно загрузить?

Через сайт принимаются файлы до 2 ГБ и до 3 часов длительности — этого достаточно для записи конференционной сессии в среднем качестве. Для более тяжёлых исходников сожмите видео или выгрузите из него аудиодорожку: для субтитров важен только звук.

Умеет ли сервис переводить субтитры на другой язык?

EdWord выполняет расшифровку на языке оригинала записи: русская речь станет русским текстом, английская — английским. Перевод готового SRT-файла на другие языки выполняется отдельными инструментами.

Читайте также

Поддержка

Если что-то не работает или есть вопрос — пишите напрямую.