Как сделать транскрибацию аудио и видео в текст: лучшие способы

«Dragon Professional» — расшифровка аудиозаписей в текст

На момент написания данного материала цифровой англоязычный продукт «Dragon Professional Individual» является одним из мировых лидеров по качеству распознаваемых текстов. Программа понимает семь языков (с русским пока работает лишь мобильное приложение «Dragon Anywhere» на Android и iOS), обладает высоким качеством распознавания голоса, умеет выполнять ряд голосовых команд. При этом данный продукт имеет исключительно платный характер (цена за основную программу составляет 300 долларов США, а за «домашнюю» версия продукта «Dragon Home» покупателю придётся выложить 75 американских долларов).

Для своей работы данный продукт от «Nuance Communications» требует создания своего профиля, который призван адаптировать возможности программы под специфику вашего голоса. Кроме непосредственной диктовки текста, вы можете обучить программу выполнять ряд команд, тем самым делая своё взаимодействие с компьютером ещё более конгруэнтным и удобным.

Программы для транскрибации

В этом разделе я затрону основные категории программ, которые позволят вам быстро стартовать и «влиться» в работу. Если вам нужна подработка удаленно или вы предпочитаете фриланс, знайте, что заработок на транскрибации можно увеличить за счет использования некоторых программ.

В обязательном порядке

  • Текстовые редакторы – для удобной работы с текстом – советую обычный Word или LibreOffice Writer (их можно найти в офисных пакетах Microsoft Office или LibreOffice). Блокнот или Notepad проигрывают из-за ограниченного функционала.
  • Аудио- и видеоплееры – для воспроизведения, редактирования исходных или преобразованных файлов – из самых известных Winamp, KMP, либо другие в вашей операционной системе.
  • Конвертеры – для извлечения и (или) преобразования файлов из одного формата в другой и для улучшения звучания. Adobe Audition и Freemake Video Converter вполне подойдут.

Для оптимизации рабочего процесса

Обратите внимание на специальные программы для транскрибации. Функционал этих программ позволит вам работать с исходником и текстовым редактором одновременно, не переключаясь между окнами, снизить скорость воспроизведения исходника, автоматически вставлять тайм-код или имена собеседников, автоматически транскрибировать аудио в текст или использовать голосовой ввод, и многое другое

Функционал этих программ позволит вам работать с исходником и текстовым редактором одновременно, не переключаясь между окнами, снизить скорость воспроизведения исходника, автоматически вставлять тайм-код или имена собеседников, автоматически транскрибировать аудио в текст или использовать голосовой ввод, и многое другое.

  • Express Scribe;
  • Transcriber-pro;
  • Speechpad.ru;
  • Dictation.io;
  • LossPlay;
  • Dragon Dictation;
  • RSplayer.

Вспомогательные программы

Утилиты и сайты, чтобы работать было проще:

  1. Punto Switcher – программа для автоматического переключения раскладки клавиатуры. Позволит сэкономить много времени при быстром наборе текста, содержащего иностранные слова, избавит от необходимости смены языка вручную и исправления связанных с этим ошибок.
  2. AutoHotkey – программа для генерации и использования в работе скриптов. Эта и другие подобные утилиты значительно ускоряют процесс набора текста за счет автозамены сокращений, а также встроенных и настраиваемых шаблонов.
  3. Грамота, Тургенев, Главред – это онлайн-ресурсы для проверки содержания вашего текста на наличие ошибок. Необходимы, если исходник подлежит глубокой обработке. Помогут при чистке текста от речевых штампов, жаргонизмов, слов-паразитов, стоп-слов, стилистических ошибок и перегруженности.
  4. Тренажеры слепой и десятипальцевой печати, онлайн-измерители скорости – solo.nabiraem.ru позволит быстро измерить скорость вашей печати.
  5. Соло на клавиатуре – известный и проверенный сервис, где вы можете повысить уровень своего навыка и даже посоревноваться с другими «гонщиками на клавиатуре».

Реально ли на транскрибации заработать новичку

Зачастую новички задаются вопросом, реально ли здесь заработать? Эта работа проста, специальных навыков почти не требуется. Такая деятельность подойдет студентам, декретницам, и даже школьникам. Фактически будут платить за набор текста, проговариваемый спикером в предоставленном файле.

Рассмотрим подробнее, что это за процесс. Берется любой аудио или видеофайл и прослушивается через обычный плеер с остановками для перенесения услышанного в текстовой вариант. Для облегчения работы существуют специальные программы преобразующие аудио дорожки в текстовой файл. Но качество их работ очень разнится. Об этом мы поговорим позже.

На практике число запросов на услугу сильно превышает предложение. Поэтому, заработок на переводе аудиафайлов в текст, может стать серьезной прибавкой к  семейному бюджету. Поработав пару недель, вы получите постоянный поток заказов, а со временем и постоянных клиентов.

Способ 3. Speechpad.ru

Это онлайн блокнот, позволяющий переводить речь в текст. Работать можно как с регистрацией, так и без. Зарегистрированные пользователи могут сохранять сформированные тексты в упорядоченном виде, настраивать интерфейс блокнота, использовать голосовые команды. Приятно, что разработчики записали подробную инструкцию по голосовому вводу текста, которая находится прямо на главной странице сайта:

А с помощью кнопки «Транскрибация» можно записать текст с аудио, видеофайлов или с Youtube-хостинга. 

Плюсы блокнота: 

  • работа и с микрофоном, и с медиа файлами
  • набор текста происходит синхронно диктовке, поэтому правки в текст можно вносить сразу
  • сохранение готового текста в файл 

Минус пользователи отметили лишь один, и он несущественный  — корректно блокнот работает только в браузере Google Chrome. 

Рассмотрим транскрибацию видеоролика с Youtube.

Шаг 1. В строке поиска вводим speechpad.ru и попадаем на главную страницу блокнота.

Шаг 2. Прокрутив страницу до конца, нажимаем кнопку «+Транскрибацию».

Шаг 3. В открывшейся панели транскрибации отмечаем медиа тип «Youtube video»

Шаг 4. В поле «ID файла для проигрывания» вносим ID того ролика, который хотим транскрибировать.

 

ID ролика находится в адресной строке Youtube после знака «=». 

Нажимаем кнопку «Обновить».

 Шаг 5. Включаем воспроизведение видео и нажимаем кнопку «Включить запись»

Шаг 6. Проверяем текст, исправляем ошибки. Кнопка «Скачать» позволяет сохранить результат в формате текстового документа.

Что приходится расшифровывать

Сколько заказчиков, столько и требований к транскрибатору. Цели у ваших клиентов могут быть разными – от полного дословного перевода с оставленными словами-паразитами и прочим мусором до краткой выжимки самой сути выступления.

Что же приходится транскрибировать? Обозначим наиболее часто встречающиеся виды работ.

Вид транскрибации
Уровень сложности
Характеристика
Надиктовка
* тайм-код не нужен
Автор читает в расчете на последующую транскрибацию – медленно, четко, с выражением.
Лекция
**
тайм-код не нужен
Автор читает в Темп речи выше, чем в надиктовке. Часто встречаются незнакомые термины, названия, имена.
Интервью
**
тайм-код иногда
В основном хорошее качество записи, что упрощает работу, темп речи невысокий, обычно жесткая дословность не нужна.
Синхрон («говорящая голова»)
**
тайм-код нужен
Схож с интервью, часто приходится набирать слова-паразиты и прочий речевой мусор, т.к. большинство людей не способны четко выражать свои мысли.
Подкасты
**
тайм-код иногда
Подкасты напоминают радиопередачи – выходят регулярно, освещают какую-либо тему. Их расшифровка не сопряжена с какими-то большими сложностями, т.к. речь там обычно грамотная, без большого количества мусора, качество звучания на высоте.
Телевизионные передачи
** и выше
тайм-код иногда
Сложность транскрибации телепередач зависит от их направленности. Если это балаган типа «Пусть говорят» или «Время покажет», то нервные клетки транскрибатора будут массово гибнуть на поле боя, а неспешные интервью с телеканала «Культура» — бальзам на транскрибаторскую душу.
Простой вебинар
**
тайм-код иногда
Та же лекция. Один спикер, обучающий интернет аудиторию. Требуется расшифровка только его речи, иногда приходится вставлять реплики из чата.
Сложный вебинар
*** и выше
тайм-код иногда
Несколько участников, сложность вырастает пропорционально количеству говорящих.
Фокус-группа
*** и выше
тайм-код иногда
По форме похожа на сложный вебинар. Несколько говорящих ведут обсуждение по теме. В созыве фокус-группы обычно нуждается социологический опрос или маркетинговое исследование. Если сначала все высказываются по очереди, то ближе к концу обычно неразбериха, все говорят одновременно, перебивают друг друга.
Конференции, заседания любых видов комиссий, администраций, правительств, круглые столы и т.п.
*** и выше
тайм-код иногда
Когда на заседании есть председатель, ведущий дискуссию, работа транскрибатора упрощается. Без председателя все гораздо хуже – спикеры стремятся перебить друг друга, что усложняет расшифровку

Обычно не требуется полная дословность, важно близко к оригиналу передать основную мысль говорящего, убрав словесный мусор.
Прослушка, телефонные разговоры
*****
тайм-код иногда, в местах не подлежащих расшифровке
Высокий уровень сложности обусловлен крайне низким качеством записи, расшифровка прослушек занимает много времени.
Суд
*****
тайм-код иногда
Крайне тяжелая работа. Требует полного воспроизведения любого звука с идентификацией говорящего

При этом качество звучания, как правило, оставляет желать лучшего.

Вид транскрибации

Уровень сложности

Характеристика

Субтитры

** тайм-код обязательно

Не слишком сложная работа, но ее специфика в том, что субтитры необходимо четко маркировать тайм-кодом в начале и в конце реплики.

Простой монтажный лист

***
тайм-код обязательно

Перевод в текст реплик героев с их идентификацией, технические комментарии, обязательные тайм-коды.

Полный монтажный лист

*****
тайм-код обязательно

Усложненная и развернутая версия простого монтажного листа. Обычно это таблица, где описывается практически каждый кадр, здесь нужен не только перевод речи в текст, но и описание того, что происходит в кадре.

Особенности транскрибации

Спрос на расшифровку и запись в виде текста звуковой информации, записанной на какой-либо носитель, появился вместе с изобретением диктофонов.

Первый в мире фонограф (аппарат звукозаписи) изобрел Томас Эдисон в 1877 году. Эдисон создавал свое устройство, предполагая, что с его помощью будут записываться деловые переговоры.

С тех пор утекло много воды, диктофоны претерпели кардинальные изменения, но потребность в дешифровке аудиоинформации все также актуальна.

5 главных неприятностей

На первый взгляд занятие транскрибацией элементарно. Все писали диктанты на уроках русского, ничего сверхъестественного в этом нет – включаешь проигрыватель и записываешь звучащие предложения. Работа мечты!

Но у транскрибации нет ничего общего с диктантами. В обычной жизни никто, даже профессиональный лектор, не говорит так, как это делал ваш учитель.

Вот только часть неприятностей, с которыми сталкивается любой транскрибатор.

Невнятная речь спикера (т.е. говорящего человека)

Речь людей имеет массу дефектов и недочетов. В моем университете преподавал известнейший профессор, лучший в России специалист по русской литературе XVIII века, его имя настолько известно в кругу филологов, что не будем упоминать его всуе.

Так вот его лекции были настоящим адом на Земле. Никто из нас не понимал ни слова. У маститого ученого были практически все мыслимые проблемы с дикцией, к тому же он не выпускал папиросу изо рта, что не добавляло четкости его речи.

Конечно, не у всех такие грандиозные проблемы с речевым аппаратом, но люди могут говорить слишком тихо, невнятно, проглатывать окончания, жевать слова, сильно картавить или шепелявить, очень распространенная проблема для транскрибатора – чересчур высокий темп речи.

Нечитаемость текста, прямо передающего устную речь

Вы будете удивлены, но устная и письменная речь существуют по разным законам. Не будем углубляться в лингвистические изыскания, но стоит хоть раз написать подстрочник устного выступления, как пропасть между письмом и говорением станет очевидной и даже пугающей.

Некоторые заказчики требуют дословную расшифровку, но большинство хотят получить удобоваримый текст, так что транскрибатор обязательно столкнется с необходимостью редактуры того, что он услышал и набрал.

Чем больше народа участвует в беседе, тем сложнее расшифровка

Когда говорит один человек, к его речи привыкаешь, работа становится ритмичной. Интервью тет-а-тет тоже приятно транскрибировать, один спрашивает, второй отвечает, никто никого не перебивает – счастье!

Но с появлением третьего и последующих собеседников седых волос на голове у транскрибатора прибавляется, а нервных клеток, наоборот, становится меньше. Нет, не обладают наши люди искусством вести беседу, особенно полемическую.

Некачественная запись

Посторонние шумы очень затрудняют работу. К сожалению, качество присылаемых заказчиками записей часто бывает ниже среднего.

Невысокий уровень эрудиции транскрибатора

Вы можете быть прекрасным человеком, но при этом не знать каких-то элементарных и не очень элементарных вещей. Это беда дешифровщиков.

Среди заказов на транскрибацию часто попадаются лекции со специфической терминологией, беседы о предмете или о людях, о которых вы ничего не слышали, тренинги с массой англицизмов, а вы не знакомы с иностранными языками.

Из-за этого возникает масса ошибок, иногда очень смешных и обидных. Так появляется «книга Д.К. Мирона “Бокаччо”», «Трое в лодке, нищета и собака» и прочие ляпы.

Зачем переводить аудио в текст

Расшифровывать аудиозаписи и видеоматериалы полезно с точки зрения продвижения в поисковой выдаче и расширения информационного охвата, экономии чужого времени (некоторым банально некогда просматривать ролики на YouTube), уникализации контента.

А еще полезно давать потенциальным клиентам, зрителям или подписчикам выбор: кому-то проще читать, а кто-то с радостью половину прослушает, а вторую часть – бегло пробежит глазами.

Кто платит

В транскрибации заинтересованы вебмастера, создатели интернет-курсов, ведущие вебинаров, организаторы конференций и тематических онлайн-трансляций.

Виной тому аудитория: смотреть трехчасовой ролик на YouTube согласятся далеко не все, а вот пробежать глазами текст и найти полезную информацию готовы многие (а ведь еще и поиск по тексту доступен через Ctrl + F), в особенности, если Live-вещание давно закончилось, и приходится смотреть запись.

Стоит отметить, что транскрибация популярна среди журналистов, записывающих интервью на диктофон, а после – из-за нехватки времени и сил, прибегающих к чужой помощи для адаптации материалов перед публикацией в сети.

Заказ перевода аудио в текст у специалистов

Вообще, мне достаточно часто нужна услуга по расшифровке аудиозаписей в текст. Нужно переводить в текст мои видеоуроки. Иногда я сначала наговариваю мысли для статьи на диктофон, а потом транскрибирую. Можно конечно заниматься этим самостоятельно с помощью программ, но это отнимает много времени. Почему? Потому что программы для транскрибации не всегда верно расшифровывают слова и приходится долго править полученный текст, форматировать его, вставлять знаки препинания и таймкоды.

Поэтому я нанимаю фрилансеров. Но.. И тут есть “засады”! Очень сложно найти “правильного” фрилансера, который бы делал все четко и в срок. И особенная проблема в том, что фрилансеры (особенно молодые) плохо дружат с русским языком. И часто делают еще больше ошибок, чем программы 🙁 Поэтому я стал искать специализированный сервис, который занимается ручным переводом аудио в текст. И чтобы качественно и недорого. И… Я похоже, нашел такую фирму.

Сейчас я расскажу, чем мне приглянулся данный сервис. Итак, смотрим. Кстати, Все картинки увеличиваются по клику…

Это пока единственный российский сервис по транскрибации аудио с личными кабинетами, который “заточен” под бизнесменов, журналистов, юристов и т.п. То есть, для тех людей, для которых качество и скорость расшифровки аудиофайлов являются самыми важными факторами.

Из “приятных плюшек” хочу отметить еще три, особо мне понравившихся.

  • Тестовый заказ. Бесплатный. Для проверки качества работы этого сервиса. Можете попробовать, если не уверены в качестве расшифровки.
  • Работа с PayPal. Это означает, что с сервисом могут работать “забугорные” люди. Кстати, проблема с платежами, нередка в случае когда пытаются оплатить услуги российского сервиса из-за рубежа. Ну и PayPal дополнительно защищает Ваши покупки.
  • Работа с аудиозаписями из судов. Для меня это ничего не говорит, но мой друг, юрист, говорит, что это крутая фишка..

Короче, не буду навязывать Вам этот сервис. Лучше сами посмотрите и решите, стоит ли с ним работать.

Ну и как обещал выше, рекомендую посмотреть это видео, где я подробней разбираю этот сайт.

А вот и подоспели итоги полной расшифровки моего видеоролика. Посмотрим, что получилось!

Что нужно для работы?

Расшифровка видео или аудио в текст не требует каких-либо специальных знаний. Этим может заниматься любой человек, даже новичок. Но есть некоторые нюансы, которые нужно учитывать, чтобы начать трудиться.

Чтобы заработать на транскрибации онлайн, необходимо:

  1. Иметь ПК с безлимитным доступом к интернету.
  2. Скачать специальную программу для перевода аудио в текст. Конечно, полагаться только на нее не стоит, поскольку часто встречаются такие файлы, которые даже машинный транскрибатор не сможет сделать удобочитаемым текстом. В этом случае, «прогнав» через приложение фрагмент аудиозаписи, можно получить кое-как сгенерированный текст. Его уже придется дорабатывать вручную, вносить коррективы, и даже вырезать какие-то фрагменты. Но специальная программа для транскрибации аудио в текст помогает здорово сэкономить время на самостоятельном прослушивании и перепечатывании материалов. А это, в свою очередь, дает возможность выполнять больше работы, и получать больше денег.
  3. Иметь хорошую, удобную клавиатуру.

От этого будет зависеть не только качество работы, но и оплата. Чем быстрее вы проводите транскрибирование текста, тем больше вы успеваете сделать. К тому же, если вы сдадите задание, хотя бы, за несколько дней (либо за сутки) до назначенного дедлайна, вы сэкономите массу времени, и сможете сразу же взять в работу следующий заказ.

Какие программы помогут транскрибатору

Транскрибатор – это не только человек, который занимается переводом аудио в текстовый форма. Это еще и специальная программа, которая помогает ускорить этот процесс. Но многие пользователи, наоборот, жалуются, что такие разработки не ускоряют, а замедляют их работу, поскольку качество текста настолько низкое и плохое, что им приходится перерабатывать материал, полученный в ходе транскрибации видео в текст с помощью программы.

Но у каждого свое мнение, поэтому прежде чем ругать такие программы, можно попытаться с ними поработать. В любом случае, попробовать стоит, ведь всегда есть возможность отказаться от такого ПО и выполнять работу самостоятельно.

А вот программа Express Scribe является отличным способом, помогающим сэкономить массу времени на переводе аудиозаписи в текст. Ее главная суть заключается в замедлении скорости воспроизведения исходного материала. То есть, у транскрибатора отпадает возможность в том, чтобы постоянно ставить проигрываемую запись на паузу. Таким образом, затранскрибировать текст онлайн становится проще, а работа идет быстрее.

Правила перевода аудио или видео в текст

Хорошо в расшифровке видео и аудио в текст зарабатывают только те, кто готов учиться. Выйти на профессиональный уровень сразу невозможно, но нужно действовать, как настоящий специалист.

Усвойте полезные рекомендации:

  • ищите самые выгодные заказы, не беритесь за работу с низкой оплатой;
  • старайтесь красиво оформлять текст, появится шанс получить постоянного клиента;
  • правильно оформляйте диалоги в записях, указывая имена людей;
  • при отправке заявки, придумывайте что-нибудь интересное;
  • если заказ крупный, отписывайтесь по этапам его выполнения;
  • чаще задавайте вопросы для уточнения мелочей, тогда вряд ли придется дорабатывать текст;
  • если не укладываетесь в сроки, обязательно сообщите об этом заказчику;
  • совершенствуйте навыки, учитесь быстро печатать и грамотно форматировать текст;
  • учите иностранные языки, заказы на английском приносят в разы больше прибыли;
  • принимайте все заказы, а если не успеваете, передавайте их другим фрилансерам.

Преобразование аудио в текст способен выполнить только реальный человек. При использовании программ и приложений, результат получается не качественный. Помните об этом, не делайте результат такой же, как при использовании ботов. Старайтесь грамотно оформлять тексты для клиентов и они обязательно к вам вернутся.

Инструменты для перевода аудио в текст

Теперь хотелось бы рассмотреть, что вам потребуется для того чтобы грамотно и быстро выполнять такую работу. Первое о чем необходимо задуматься – это выбрать подходящий плеер для воспроизведения аудио.

  1. .

Конечно, вы можете использовать стандартный аудиоплеер, но в нем нет функции замедленного воспроизведения, поэтому мы советуем вам использовать Express Scribe:

Помимо удобного и простого интерфейса, в этой программе можно печатать текст (нижнее поле).

  1. .

Второй удобный инструмент для фрилансеров занимающихся переводами аудио в текст является блокнот для речевого ввода. Функционалом этого сервиса можно пользоваться онлайн на сайте speechpad.ru:

Воспользоваться им не сложно, нажимаем на «включить запись» и в микрофон произносим слова, которые должны быть переведены в текст. Программа автоматически переведет текст, и вы сможете скопировать его. К сожалению, работать с этой программой не так просто и довольно часто она выдает ошибки.

Заработок на переводе аудио в текст – это ещё одна возможность делать деньги не выходя из дома. Попробуйте перевести не большой видеоролик или не продолжительную аудиозапись, если вам понравится, и вы с легкостью выполните эти действия, можете отправляться за заказами и браться за работу.

Читайте другие статьи:

  • Обзор лучших бирж фриланса Profi ru и Weblancer
  • Интересная схема для поиска и получения заказов на фрилансе без бирж
  • Как фрилансеру найти работу — ТОП 20 лучших бирж фриланса

Для чего нужно переводить аудио в текст

Для начала поговорим, для чего вообще может понадобиться транскрибация. Тут на самом деле очень много вариантов.

  • Достаточно часто требуется расшифровка аудио какого-нибудь семинара очередного “гуру”. Он вещает час-два и его записывают на видео. А потом нужно все это дело издать в виде методички или книги. Это транскрибация так называемого вебинара. Кстати, вебинары расшифровывать немного легче, так как в случае невнятного звука можно иногда догадаться о чем речь по жестам и поведению спикера.
  • Иногда обращаются журналисты. Они могут надиктовывать себе заметки на диктофон в течение выполнения какого-нибудь журналисткого расследования. И потом все аудио это нужно перевести в текст.
  • Достаточно редкие “клиенты” транскрибатора это “настоящие писатели”. Они тоже сейчас часто любят надиктовывать книги в аудиофайл, а потом переносить на бумагу.

  • Часто нужно транскрибировать аудиоподкасты. Кстати, что такое аудиоподкаст? Если по русски- это устное сообщение владельца сайта или блога своим подписчикам.
  • Расшифровка аудио в текст разного рода интервью. Тут Вы понимаете, что нужно журналистам и всякого рода блоггерам.
  • Иногда нужна расшифровка телефонных переговоров. Чаще всего такие работы заказывают фирмы для фиксации внутрикорпоративных переговоров.
  • Еще бывает транскрибация совещаний. Но эту работу часто выполняют сами секретари и не отдают на аутсорсинг. Кстати, если Вы секретарь, то возьмите мои советы себе на вооружение.

Я перечислил только малую часть тех задач по транскрибации, для решения которых может понадобиться профессиональный транскрибатор. Этих задач может быть намного больше. Так что работа для “аудиопереводчика” всегда найдется.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector