Перейти к основному содержимому

Как расшифровать интервью в текст: способы, время и стоимость

Вы вернулись со встречи с диктофонной записью на 47 минут. Впереди статья, отчёт по исследованию или заметки для команды подбора — и всё упирается в одно: запись нужно превратить в текст. Разберём, какие есть варианты, сколько каждый съедает времени и денег, и как получить готовую расшифровку за пару кликов.

Коротко

Часовая запись интервью вручную печатается 4–6 часов. Сервис транскрибации интервью EdWord выдаёт текст той же записи за 4–6 минут. Новым пользователям — 60 минут бесплатно, карта для этого не нужна.

Сколько на самом деле занимает расшифровка вручную

Человек говорит со скоростью 120–150 слов в минуту. Печатает — 30–40. Уже из этой пары цифр видно: набивать текст со слуха придётся в разы дольше, чем длится сама запись.

На практике всё ещё медленнее. Собеседник тараторит, перебивает, глотает окончания. Приходится отматывать назад по пять раз, переслушивать фамилии и термины, ставить запись на паузу после каждой фразы. Опытные расшифровщики закладывают коэффициент 4–6: на один час аудио уходит от четырёх до шести часов работы. Если запись шумная или говорят несколько человек — до восьми.

Для журналиста это означает потерянный рабочий день на одно интервью. Для исследователя с серией из двадцати глубинных интервью — месяц монотонной печати вместо анализа.

Есть и скрытая цена. После третьего часа переслушивания внимание падает, начинаются пропуски и ослышки — «двадцать» превращается в «двенадцать», а такие ошибки в цитатах потом дорого обходятся. Усталый расшифровщик ошибается там, где свежая нейросеть держит стабильный уровень от первой минуты записи до последней.

Три пути: сам, фрилансер, автоматический сервис

Способов превратить запись разговора в текст по большому счёту три.

  • Расшифровать самостоятельно. Наушники, плеер с перемоткой, текстовый редактор. Бесплатно, зато медленно и выматывает.
  • Отдать фрилансеру. На биржах ручная расшифровка стоит ориентировочно от 600 до 2 000 ₽ за час записи, срок — от суток до трёх. Плюс вы передаёте конфиденциальный разговор постороннему человеку.
  • Загрузить в сервис расшифровки аудио в текст. Нейросети Whisper-класса дают около 98% точности на чистой записи и обрабатывают час аудио за 4–6 минут. Дальше остаётся вычитать текст и расставить реплики.

Первые два пути имеют смысл в редких случаях: художественная дословность с сохранением каждого «эээ» или запись настолько плохого качества, что её разберёт только человек. Во всех остальных ситуациях быстрее и дешевле начать с автоматической расшифровки.

Пошагово: расшифровываем интервью через сайт EdWord

Самый прямой сценарий — загрузить файл с диктофона или телефона на сайт. Вот весь процесс по шагам.

  1. Откройте edword.ru и войдите через Telegram или Яндекс. Новый аккаунт сразу получает 60 бесплатных минут.
  2. Перетащите файл в окно загрузки. Подходят аудиоформаты MP3, WAV, M4A, FLAC, OGG, WebM и видео MP4, AVI, MOV, MKV — размером до 2 ГБ. Запись двухчасовой беседы влезает с запасом.
  3. Дождитесь обработки. Язык определится автоматически, поддерживается более 50 языков. Часовое интервью будет готово примерно через 4–6 минут — как раз успеете налить кофе.
  4. Заберите текст. Включите таймкоды, если нужно быстро находить места в записи, скопируйте результат в один клик или скачайте файл в TXT, DOCX, SRT или VTT.

Все расшифровки сохраняются в истории личного кабинета — через месяц можно вернуться к старому интервью и вытащить из него цитату.

Расшифруйте первое интервью бесплатно
60 минут в подарок каждому новому пользователю, карта не нужна
Загрузить запись

Расшифровка через Telegram-бот

Когда интервью записано на телефон, путь через компьютер лишний. Откройте бота @mywhisperedbot, отправьте ему файл с диктофона — и текст придёт прямо в чат.

Бот принимает аудиофайлы, голосовые сообщения, видео и кружки. Типичная связка для полевой работы: записали разговор на стандартный диктофон смартфона, поделились файлом в Telegram, выбрали бота — расшифровка уже едет к вам. Как выжать максимум из телефонных записей, мы разобрали на странице «Диктофон в текст».

Отдельный приём для HR и команд: бота можно добавить в групповой чат. Если рекрутеры скидывают друг другу голосовые заметки после собеседований, каждая такая заметка автоматически превратится в текст — и её найдёт поиск по чату.

Интервью по ссылке: YouTube, VK Видео, Rutube

Публичные интервью, подкасты и записи вебинаров скачивать вручную незачем. Вставьте ссылку на видео с YouTube, VK Видео, Rutube и других площадок — EdWord сам вытащит аудиодорожку и превратит её в текст.

Сценарий любят исследователи и авторы: нужно процитировать эксперта из двухчасового подкаста — вставили ссылку, получили транскрибацию записи с таймкодами, нашли нужный фрагмент поиском по тексту за секунды вместо перемотки видео.

Сравнение: время и деньги на час записи

Сведём три способа в одну таблицу. Везде считаем обработку одного часа интервью.

Способ Время Стоимость Риски
Вручную 4–6 часов 0 ₽ Потерянный день
Фрилансер 1–3 дня 600–2 000 ₽ Запись у чужого человека
EdWord 4–6 минут от 258 ₽ Нужна вычитка имён

Откуда 258 ₽: пакет на 50 часов стоит 12 900 ₽, то есть час записи обходится в 258 ₽. Разовый час — 390 ₽, пакет на 10 часов — 2 990 ₽ (299 ₽/час). Купленные минуты лежат на балансе без срока годности, подписку оформлять не нужно. Первые 60 минут — подарок, на них удобно проверить качество на собственной записи.

Экономика для регулярной работы сходится быстро: серия из десяти часовых интервью у фрилансера обойдётся в 6 000–20 000 ₽ и растянется на неделю. Тот же объём через сервис — 2 990 ₽ и один вечер вместе с вычиткой.

Как записать интервью, чтобы расшифровка вышла точной

Точность около 98% достигается на чистой записи. Несколько привычек на этапе записи экономят потом часы правок.

  • Кладите телефон ближе к собеседнику, чем к себе. Свои вопросы вы и так помните, а вот тихие ответы — главный источник пропусков.
  • Выбирайте тихое место. Кофейня с фоновой музыкой и соседними разговорами снижает разборчивость любой системы распознавания. Переговорка или тихий угол дают заметно более чистый текст.
  • Просите говорить по очереди. Наложенные друг на друга голоса плохо разбирает и человек, и нейросеть.
  • Проговаривайте вслух редкие имена и термины по ходу беседы («правильно понимаю, компания называется…»). Так вы сами создадите себе опорные точки для вычитки.
  • Делайте контрольную запись на 30 секунд перед началом и переслушивайте её. Банально, спасает регулярно.
Совет

Формат записи волновать вас перестаёт: диктофоны телефонов пишут в M4A, рекордеры — в WAV или MP3, зум-встречи выгружаются в MP4. EdWord принимает всё перечисленное без конвертации.

Что делать с готовым текстом

Автоматическая расшифровка — это сырьё. Дальше начинается редакторская часть, и здесь помогают три вещи.

Таймкоды. Включите их при расшифровке — и каждый абзац получит метку времени. Сомневаетесь в цитате? Перематываете запись ровно на нужную минуту и сверяетесь с оригиналом, вместо того чтобы переслушивать всё подряд.

Форматы экспорта. TXT и DOCX закрывают работу с текстом: статью, отчёт, протокол. SRT и VTT пригодятся, если интервью выйдет как видео — файл субтитров уже готов, останется загрузить его на платформу.

Разметка реплик. Текст приходит сплошным потоком, поэтому реплики интервьюера и героя удобно пометить самостоятельно: вопросы вы задавали сами и узнаете их мгновенно, а таймкоды помогут в спорных местах. На часовую беседу такая разметка занимает 15–20 минут.

Из вычитанного транскрипта легко собрать конспект: пробежаться по тексту, выделить тезисы и цифры, убрать воду. Работать с текстом на порядок быстрее, чем с двухчасовой аудиодорожкой.

Типичные ошибки при расшифровке интервью

Несколько граблей, на которые наступают почти все, кто расшифровывает записи впервые.

  • Откладывать расшифровку на потом. Через две недели вы уже плохо помните контекст беседы и интонации собеседника. Вычитывать свежий транскрипт по горячим следам вдвое быстрее — детали ещё в голове.
  • Публиковать цитаты без сверки с записью. Любая система распознавания ошибается на редких фамилиях и узких терминах. Ключевые цитаты стоит сверить по таймкоду с оригиналом — на это уходит минута, а репутацию бережёт годами.
  • Конвертировать файлы перед загрузкой. Перегон WAV в MP3 через сомнительный онлайн-конвертер тратит время и порой режет качество звука. Загружайте исходник как есть — популярные форматы принимаются напрямую.
  • Резать длинную запись на куски руками. Лимита длительности бояться незачем: файл до 2 ГБ уходит целиком, а таймкоды удобнее считать по единой записи.
  • Хранить транскрипты россыпью по папкам. История в личном кабинете уже решает задачу архива: все расшифровки лежат в одном месте и открываются с любого устройства.

Кому и зачем: журналист, исследователь, HR

Журналисту расшифровка нужна в день сдачи. Схема: интервью на диктофон → файл боту в Telegram по дороге в редакцию → к моменту, когда вы открыли ноутбук, текст уже ждёт. Цитаты сверяются по таймкодам, фактура — поиском по документу.

Исследователю важен масштаб. Двадцать глубинных интервью по часу — это 20 часов аудио и при ручном подходе месяц печати. Пакет на 50 часов покрывает такой проект целиком, а все транскрипты копятся в личном кабинете и остаются под рукой на этапе кодирования и анализа.

HR и рекрутеру расшифровка даёт память о кандидатах. После пятого собеседования за день детали сливаются; текстовые версии интервью решают это — открываете транскрипт и вспоминаете, что кандидат отвечал про мотивацию, дословно. Групповой чат команды с ботом внутри превращает голосовые заметки коллег в поисковую базу знаний. Для отделов подбора с большим потоком есть командные пакеты: 50 часов за 9 900 ₽ или 100 часов за 17 900 ₽ — этого хватает на десятки собеседований в месяц.

Всем троим пригодится и EdWord Mini — диктовка голосом прямо в браузере. Надиктовать выводы после встречи быстрее, чем печатать, а Mini ставится на компьютер как обычное приложение.

Выводы

Расшифровка интервью перестала быть отдельной профессиональной услугой с ценником и сроками. Час записи превращается в текст за 4–6 минут и стоит от 258 ₽ при покупке пакета; первые 60 минут бесплатны. Ручной труд остался там, где он действительно нужен, — в вычитке имён и разметке реплик, а это минуты вместо часов.

Попробуйте на своей записи
Загрузите интервью — 60 бесплатных минут уже на балансе
Начать бесплатно

Частые вопросы

Сколько стоит расшифровать часовое интервью?

Новым пользователям EdWord даёт 60 бесплатных минут — первое часовое интервью выйдет в 0 ₽. Дальше разовый час стоит 390 ₽, пакет на 10 часов — 2 990 ₽ (299 ₽ за час), на 50 часов — 12 900 ₽ (258 ₽ за час). Баланс минут бессрочный.

Разделяет ли сервис реплики по говорящим?

Расшифровка приходит сплошным текстом, при желании — с таймкодами. Реплики интервьюера и собеседника размечаются вручную: свои вопросы вы узнаете сразу, а метки времени помогают в спорных фрагментах. На час беседы уходит 15–20 минут разметки.

Какие форматы записи можно загрузить?

Аудио: MP3, WAV, M4A, FLAC, OGG, WebM. Видео: MP4, AVI, MOV, MKV — аудиодорожка извлекается автоматически. Лимиты: 2 ГБ и до 3 часов записи на файл — этого хватает на самое длинное интервью.

Насколько точно распознаётся русская речь?

На чистой записи модели Whisper-класса дают около 98% точности. Качество падает при сильном фоновом шуме и наложении голосов, поэтому пишите интервью в тихом месте и ближе к собеседнику. Всего поддерживается более 50 языков, язык определяется сам.

Можно ли расшифровать интервью с YouTube без скачивания?

Да. Вставьте ссылку на видео — поддерживаются YouTube, VK Видео, Rutube и другие площадки. Сервис сам скачает ролик, извлечёт звук и вернёт текст с таймкодами.

Интервью записано на диктофон телефона — подойдёт?

Подойдёт. Диктофоны смартфонов пишут в M4A или AAC — эти форматы принимаются напрямую. Быстрее всего поделиться файлом из диктофона в Telegram и отправить боту @mywhisperedbot: текст придёт ответным сообщением.

Читайте также

Поддержка

Если что-то не работает или есть вопрос — пишите напрямую.