Как перевести аудио звук или видео ролик в печатный текст. мой опыт транскрибирования

Google Документы

В облачное хранилище Google Диск встроен сервис Google Docs, в котором можно переводить аудио данные в текст. Этот способ работает в браузере Google Chrome, и в других браузерах, основанных на Chromium.

Пройдите несколько шагов:

  1. Войдите в Google Диск (Google Drive).
  2. Нажмите на кнопку «Создать».
  3. В контекстном меню выберите сначала «Google Документы», а затем «Создать новый документ».
  4. В окне «Новый документ» откройте меню «Инструменты», нажмите на пункт «Голосовой ввод» (вызывается сочетанием клавиш «Ctrl» + «Shift» + «S»).

  1. Нажмите на кнопку с изображением микрофона, а затем начните говорить.
  2. Произносимая в микрофон речь переводится в текст, который вводится на страницу документа.

  1. Сохраните документ в облачном хранилище, или скачайте файл на компьютер в одном из поддерживаемых текстовых форматов.

В Гугл Документах нет ограничения на количество вводимых символов.

Для извлечения текста из видео или аудио файлов в интернете, потребуется включить голосовой ввод, а затем запустить воспроизведение нужного файла в другой вкладке браузера.

Если вам нужно перевести голос в текст из видео или аудио файла, находящегося на компьютере, сделайте следующее:

  1. В окне Документы Google включите голосовой ввод.
  2. Включите воспроизведение видео или аудио файла в плеере на ПК.
  3. В документе появится текст из проигрываемого локального видео или аудио файла.

Программа Virtual Audio Cable

Для некоторых сервисов (например, для speechpad.ru) может понадобиться так называемый виртуальный кабель. Он нужен для того, чтобы напрямую передать аудиофайл в систему распознавания аудио, а не транслировать через микрофон. То есть, чтобы не терялось качество речи и все распознавалось как можно лучше.

Для настройки всего этого дела придется потанцевать с бубнами, то есть повозиться с настройками. Но, как я писал выше, некоторые программы без этой Virtual Audio Cable работать не будут.

К сожалению, проконсультировать по поводу настройки этих виртуальных кабелей я не смогу. У меня базовая система Линукс Минт. А эти программы предназначены для Windows. Впрочем, если будет интересно, скину ссылки на статьи других авторов, где все подробненько расписано.

Где брать заказы на транскрибацию

Вечная головная боль — где брать заказы? Я для вас подобрал несколько лучших сайтов, где можно искать заказчиков и предлагать свои услуги по переводу содержания из аудио в текст.

Work-Zilla

Основная масса заказчиков находится именно здесь и начинать лучше всего отсюда. Здесь много как мелких заказов в 100 рублей, так и больших на несколько тысяч

Новичкам я советую идти сначала сюда. За счет небольших заказов можно быстро набрать репутацию и выйти на достойный заработок в день.

Kwork

На сегодня это самая успешная биржа фриланс-услуг с фиксированный оплатой. Каждый куворк здесь стоит 500 рублей. Здесь вы уже не ищете заказчиков, а заказчик ищет исполнителей. Вот пример одного из исполнителей.

Данная исполнительница на сайте меньше года, а уже выполнила 104 задания. Конечно же у нее не все задания были по транскрибации, но все они связаны с набором текста. И конечно же она работает не только на kwork, но и на других сайтах по заработку. Это к вопросу, а можно ли на этом заработать. Как видите, да!

ToDo (биржа закрылась)

Почти брат-близнец сайта Kwork, за небольшим отличием. Здесь исполнители могут назначать цену за свои услуги и не ограничены в цене одного ворка. Можно создать ворк на 100 рублей за 10 минут, а можно и 1200 за час. Никто вас не ограничивает. По популярности уступает Kwork’у.

MoguZa

МогуЗа позиционирует себя как продавец цифровых услуг, где исполнители предлагают свои услуги за конкретную сумму. На сегодняшний день на сайте 108 предложений о переводе аудио в текст, вы можете стать 109-м.

YouDo.com

Юду — один из крупнейших сервисов в интернете по поиску исполнителей. В отличии от описанных выше конкурентов, он специализируется на всех сферах жизни, а не только на интернете. Здесь можно найти от уборщика туалетов, до конструктора космических короблей.

Есть в нем и сегмент для интернет работы Перейдите на freelance.yodo.com и вам будет доступна фриланс биржа, где и можно найти заказчиков по трансрибации.

Weblancer

Одна из популярнейших фриланс-бирж рунета. Здесь можно найти как разовые заказы, так и постоянную работу.

Увы, заказов здесь не так много.

FL.RU

Самая популярная фриланс биржа. Заказов здесь много, но идти сюда стоит уверенным в своих силах и с деньгами в кармане, точнее купленном PRO-аккаунтом. Да, по транскрибации здесь дают заказчики только исполнителям с платным аккаунтом.

Advego

Не лишним будет вам зарегистрироваться на бирже контента — Advego. Здесь может и не так часто, но все же, проскакивают интересные заказы по расшифровки аудио и видео в текст. А если активных заданий нет, то можно заработать и другими способами, коих здесь огромное множество (копирайт, рерайт, лайки, репосты, комментирование, создание тем на форуме и др.)

АудиоБюро

Если вы хотите найти постоянную работу с гарантированной заработной платой, то можете попробовать свои силы в «Аудио Бюро», специализирующихся на предоставления услуг в сфере аудио и видео услуг. В разделе «Вакансии» можно найти предложения трудоустройства в качестве расшифровщик аудиозаписей и некоторых других.

Эти сайты, которые я бы рекомендовал для старта заработка на транскрибации. Это конечно же не полный список, но здесь больше всего заказчиков и меньше шанс наткнуться на мошенников и обман. Многие исполнители открывают свои сайты и зарабатывают на них услугами по переводу содержимого аудиофайлов в текст. Ну или предлагают свои услуги через социальные сети.

Первое время вам потребуется поработать на свои:

  • Имя
  • Репутацию
  • Портфолио

Дальше они уже будут работать на вас, и заказчики сами будут к вам обращаться.

Советы по увеличению заработка

Для того чтобы доходность труда регулярно росла, есть несколько полезных советов. Даже если поначалу заработок будет скромным, развитие своих навыков и обучение спецпрограммам поспособствует расширению функцонала и как следствие, расценок за работу.

  • Не стоит хватать первый попавшийся заказ. Предложений чаще достаточно, можно выбирать тот, что устроит по оплате.
  • Применение распознавающих текст из аудио программ для мобильных и стационарных устройств существенно увеличивает производительность.
  • Более сложные заказы, к примеру судебные слушания, совещания, круглые столы и другие мероприятия, где высказывается несколько человек, стоят дороже. Поэтому будет плюсом освоить навык расшифровки подобных записей.
  • Работа, связанная не только с механическим набором текста, но подразумевающая еще и анализ информации, имеет более высокие расценки, поэтому следует научиться дополнять полученный текст полезными сведениями. Иными словами, выгоднее брать заказы, где присутствует элемент копирайтинга.
  • Наличие связей с постоянными заказчиками делает заработок более стабильным и повышает общий рейтинг аккаунта транскрибатора. Если клиенту понравится работа, он может предлагать заказы на более привлекательных условиях и даже рекомендовать качественного исполнителя другим заказчикам.
  • Владение хотя бы одним иностранным языком позволит расширить сферу поиска заказов и делает работу гораздо дороже.
  • Если заказ крупный, можно подключать компаньонов, чтобы соблюдать сроки и повышать скорость выполнения.
  • Также можно активно использовать партнерские программы большинства бирж, привлекая новых исполнителей по реферальной ссылке можно практически пассивно увеличивать доход.

Сколько можно заработать на транскрибации

Начинают транскрибирование обычно взяв заказы на биржах фриланса, оплата за работу чаще поминутная. Иногда расчет оплаты делается, исходя из особенностей материала. Стандартной расценкой считается от 5 до 15 руб. за 1 мин. Так, за расшифровку часовой записи можно заработать примерно 600 руб.

Итоговая сумма зависит от уровня сложности текста для восприятия и качества записи. В среднем за такую услугу на бирже платят 500-1000 рублей за одну работу. Пользователь с опытом может надеяться на повышение своего дохода за перевод видео или аудио в текстовый материал от 1500 до 2000 рублей в день, при работе около 5-7 часов.

Эффективность работы и количество переводимых аудио текстов в онлайн режиме во многом зависит и от скорости печатания. Если научиться применять в работе дополнительные программы транскрибирования, то это может привести к существенному повышению ставки. Следовательно, подработка на переводе аудио даст больше денег.

Инструменты для транскрибации

Для транскрибации нужно подходящее ПО. И выбор его зависит от того, как устроен процесс расшифровки. 

Если вы планируете доверить все автоматике и изредка вносить правки, то понадобится что-нибудь на базе ИИ с возможностью фиксировать человеческую речь через микрофон или считывать ее из аудиофайлов. 

Для самостоятельной транскрибации хватит и текстового редактора, но лучше установить вспомогательную утилиту, которая слегка снизит нагрузку на мозг и ускорит процедуру дешифровки контента.

Для автоматической транскрибации

Google Docs

Самый доступный метод, не отличающийся качеством распознавания речи, но наиболее простой в использовании. Достаточно нажать клавиши Ctrl + Shift + S в открытом редакторе и начать диктовать то, что хочется преобразовать в текст. В системах iOS и macOS для этого есть отдельные клавиши (иконка в виде микрофона на iOS и клавиша Fn на macOS).

Speechpad

Бесплатный дешифровщик, умеющий считывать человеческую речь с микрофона напрямую. Это не полноценное приложение для ПК, а расширение для Google Chrome, но есть и мобильная версия в App Store и Google Play. 

RealSpeaker

Инструмент, преобразующий в текст уже записанную речь. Он работает на базе ИИ и не может в реальном времени фиксировать слова, сказанные в микрофон. А еще он платный и просит 8 рублей за одну минуту расшифрованного аудиоконтента. 

Voco

Универсальный расшифровщик. Тоже платный, но зато умеющий работать как с речью, в реальном времени зачитываемой в микрофон, так и с файлами с предзаписанными монологами и диалогами. Voco не нуждается в интернете, его «мозги» сохраняются непосредственно в системе и там же занимаются обработкой аудио. Отличительной чертой является обучаемый алгоритм, способный адаптироваться под особенности конкретного аудио- или видеоконтента. 

YouTube

Если нет денег на вышеперечисленное ПО или нет возможности его установить, то на помощь придет YouTube с его нейросетью. Надо: 

  • загрузить видеофайл с речью на хостинг, 

  • дождаться его обработки, 

  • потом открыть программу «Творческая студия», 

  • в ней найти пункт «Субтитры»,

  • выбрать язык для транскрибации и нажать на кнопку «Скачать» (скачается файл с субтитрами).

Для ручной транскрибации

Express Scribe Transcription Software

Дополнение к Microsoft Word, объединяющее текстовый редактор с видеопроигрывателем. Лишает пользователя необходимости «прыгать» между окнами и постоянно терять фокус. Приложение платное. 

LossPlay

Проигрыватель, визуально напоминающий Winamp, с функцией вставки временных меток и глобальными горячими клавишами для управления воспроизведением контента. Например, можно, не покидая Word, остановить воспроизведение аудио или перемотать его на несколько секунд назад. 

oTranscribe

Аналог LossPlay от зарубежных разработчиков и распространяющийся по open-source лицензии. То есть бесплатно и с открытым исходным кодом. Тоже вставляет временные метки автоматически, поддерживает горячие клавиши для перемотки и экспорт в популярные форматы в духе markdown (.md) или rich-text (.docx).

Плюсы и минусы профессии транскрибатор

В любой деятельности есть свои нюансы и детали. Эта профессия – не исключение. Здесь даже больше минусов, чем плюсов. Снимаем розовые очки и поехали!

Минусы:

  1. Большая конкуренция.
  2. Невозможно стать лучшим в профессии, а значит нет шансов выделиться среди других фрилансеров.
  3. Низкооплачиваемая работа.
  4. Нет возможности для карьерного роста.
  5. Придется тратить время на проверку бирж в надежде получить заказ. Если быстро не отреагировать на заявку, то заказ уйдет другому специалисту.
  6. Монотонная и нудная работа.
  7. Вряд ли станет основным источником дохода.
  8. Один час транскрибации занимает до семи часов работы!
  9. Вы не будете хозяином своего времени.

Плюсы:

  1. Возможность работать удаленно.
  2. Если повезет, то познакомитесь с предпринимателями и получите в дальнейшем от них постоянные заказы.

Что приходится расшифровывать

Сколько заказчиков, столько и требований к транскрибатору. Цели у ваших клиентов могут быть разными – от полного дословного перевода с оставленными словами-паразитами и прочим мусором до краткой выжимки самой сути выступления.

Что же приходится транскрибировать? Обозначим наиболее часто встречающиеся виды работ.

Вид транскрибации
Уровень сложности
Характеристика
Надиктовка
* тайм-код не нужен
Автор читает в расчете на последующую транскрибацию – медленно, четко, с выражением.
Лекция
**
тайм-код не нужен
Автор читает в Темп речи выше, чем в надиктовке. Часто встречаются незнакомые термины, названия, имена.
Интервью
**
тайм-код иногда
В основном хорошее качество записи, что упрощает работу, темп речи невысокий, обычно жесткая дословность не нужна.
Синхрон («говорящая голова»)
**
тайм-код нужен
Схож с интервью, часто приходится набирать слова-паразиты и прочий речевой мусор, т.к. большинство людей не способны четко выражать свои мысли.
Подкасты
**
тайм-код иногда
Подкасты напоминают радиопередачи – выходят регулярно, освещают какую-либо тему. Их расшифровка не сопряжена с какими-то большими сложностями, т.к. речь там обычно грамотная, без большого количества мусора, качество звучания на высоте.
Телевизионные передачи
** и выше
тайм-код иногда
Сложность транскрибации телепередач зависит от их направленности. Если это балаган типа «Пусть говорят» или «Время покажет», то нервные клетки транскрибатора будут массово гибнуть на поле боя, а неспешные интервью с телеканала «Культура» — бальзам на транскрибаторскую душу.
Простой вебинар
**
тайм-код иногда
Та же лекция. Один спикер, обучающий интернет аудиторию. Требуется расшифровка только его речи, иногда приходится вставлять реплики из чата.
Сложный вебинар
*** и выше
тайм-код иногда
Несколько участников, сложность вырастает пропорционально количеству говорящих.
Фокус-группа
*** и выше
тайм-код иногда
По форме похожа на сложный вебинар. Несколько говорящих ведут обсуждение по теме. В созыве фокус-группы обычно нуждается социологический опрос или маркетинговое исследование. Если сначала все высказываются по очереди, то ближе к концу обычно неразбериха, все говорят одновременно, перебивают друг друга.
Конференции, заседания любых видов комиссий, администраций, правительств, круглые столы и т.п.
*** и выше
тайм-код иногда
Когда на заседании есть председатель, ведущий дискуссию, работа транскрибатора упрощается. Без председателя все гораздо хуже – спикеры стремятся перебить друг друга, что усложняет расшифровку

Обычно не требуется полная дословность, важно близко к оригиналу передать основную мысль говорящего, убрав словесный мусор.
Прослушка, телефонные разговоры
*****
тайм-код иногда, в местах не подлежащих расшифровке
Высокий уровень сложности обусловлен крайне низким качеством записи, расшифровка прослушек занимает много времени.
Суд
*****
тайм-код иногда
Крайне тяжелая работа. Требует полного воспроизведения любого звука с идентификацией говорящего

При этом качество звучания, как правило, оставляет желать лучшего.

Вид транскрибации

Уровень сложности

Характеристика

Субтитры

** тайм-код обязательно

Не слишком сложная работа, но ее специфика в том, что субтитры необходимо четко маркировать тайм-кодом в начале и в конце реплики.

Простой монтажный лист

***
тайм-код обязательно

Перевод в текст реплик героев с их идентификацией, технические комментарии, обязательные тайм-коды.

Полный монтажный лист

*****
тайм-код обязательно

Усложненная и развернутая версия простого монтажного листа. Обычно это таблица, где описывается практически каждый кадр, здесь нужен не только перевод речи в текст, но и описание того, что происходит в кадре.

Где искать заказчиков

Конечно, любого новичка интересует, где искать заказчиков, так как это один из основополагающих вопросов в фрилансе. Конечно, самое надежное место, где можно найти заказчиков, это биржи фриланса.

Именно здесь чаще всего попадаются подобные заказы. Практически каждый день, можно встретить заказы на транскрибацию.

Вы еще можете размещать в интернете типовые услуги и объявления на досках в интернете. Сразу результата это не даст, но вот в будущем к вам могут обратиться несколько заказчиков.

Самое главное, старайтесь избегать стандартных выражений типа договорная цена, лучше опишите конкретно, что вы делаете и за какую стоимость.

Зачем и кому нужен перевод аудио в текст?

Сделать аудио в текстовом формате в основном заказывают различные компании, занимающиеся обзвонами клиентов, оптимизаторы, инфобизнесмены, студенты, журналисты.

Приведу несколько популярных примеров:

  • телефонные разговоры;
  • семинары/вебинары;
  • интервью;
  • аудиоподкасты;
  • телепередачи.

Кому-то проще записать свои мысли на диктофон, а потом обратиться к фрилансерам, чтобы они сделали из этого статью или книгу, а кому-то нужны хорошие субтитры к видео и текстовая версия, потому что не всегда есть возможность смотреть.

Существует много различных вариантов, от которых также зависит стоимость работы.

Транскрибация: вакансии удаленно, требования

Если стенография является вашим основным видом деятельности, или же вы хотите расширить список предлагаемых услуг, используйте этот раздел биржи. Отслеживайте появляющиеся вакансии и заказы, оставляйте отклики, и вы обязательно найдете работу на выгодных и удобных для себя условиях.

Чтобы претендовать на вакансии фриланс транскрибации, стоит обладать всеми необходимыми навыками, а также иметь свободное время для работы

Очень важно соблюдать сроки, установленные заказчиком, ведь это важная характеристика вас, как надежного исполнителя

Также очень важна грамотность в набранном тексте. Если в чем-то не уверены, лучше перепроверить документ при помощи специальных интернет-сервисов. Обязательно закладывайте в сроки время проверки и редактирования (если требуется) публикации.

Сделку с работодателем вы можете оформить прямо на сервисе, что поможет избежать трудностей с оплатой. Полученные на счет средства в личном аккаунте вы легко выведете на банковскую карту или электронный кошелек. К тому же Безопасная сделка — это отличный вариант максимально прозрачных отношений между удаленным сотрудником и заказчиком.

Системы распознавания речи и транскрибация

Проблема создания системы распознавания речи получила развитие в 1952 году, когда была продемонстрирована первая попытка в истории человечества распознать голосовую команду.

Система Audrey американской компании «Bell Laboratories» могла распознать только цифры, произнесенные мужским голосом с определенным интервалом, но это стало настоящим прорывом.

С тех пор утекло много воды, лучшие умы бились над задачей научить компьютер понимать речь. Впереди планеты всей в этом вопросе оказались Google с функцией распознавания речи в браузере Chrome и Apple со своей программой Siri – оба события пришлись на 2011 год.

Сегодня выбор программ, автоматически преобразующих устную речь в письменный текст, довольно внушительный и для компьютеров, и для смартфонов, они постоянно совершенствуются, но все же для полноценной транскрибации не подходят.

Проблема таких программ в их требованиях к качеству звука. К сожалению, четкая речь без мусора и отсутствие посторонних шумов – редкое явление в работе транскрибатора. А несколько спикеров превращают итоговый текст в малопонятную кашу, на редактуру может уйти слишком много времени.

Программы для транскрибации текста

Существует ряд общих программ для транскрибации, которые использует расшифровщик в своей работе.

Редактор текстов

При наборе текста можно использовать обычный блокнот (Notepad), только у него не будет функций, необходимых для редактирования текстового содержимого.

Это может быть всем известный  Microsoft Word , а также его аналоги  LibreOffice Writer  или же  OpenOffice Writer .

Вам также может быть интересно: Набор текста с нуля — где научиться

Мультимедийные программы

Для того, чтобы владеть навыком успешной транскрибации, необходимо уметь пользоваться программами, на которых можно воспроизводить и редактировать аудио-контент. Отдать свое предпочтение можно одному из следующих плееров:

  •  LossPlay  – плеер с огромными функциональными возможностями. Незаменим в транскрибации. Имеет встроенную функцию тайм-кода. Бесплатное скачивание, разные языки, есть инструкция использования.
  •  KMPlayer  – плеер на бесплатной основе. Применим для воспроизведения видео.
  •  GOM Player  – еще один бесплатный вариант для видео файлов.
  •  Winamp  – относится больше к проигрывателю, воспроизводящему аудио-файлы.
  •  Express Scribe  – здесь нет русского интерфейса, зато имеется встроенный текстовый редактор. Сервис платный, но есть и бесплатная версия (в которой нет воспроизведения видео и поддержки некоторых аудио-форматов).

Также в список программ, необходимых для расшифровщика, стоит внести аудио- и видео-редакторы:

  •  Adobe Audition  является аудио-редактором с профессиональной версией. Просто незаменимая вещь в арсенале транскрибатора.
  •  Freemake Video Converter  – видео-редактор с функцией видео-конвертирования. Может поддерживать широкий спектр аудио и видео форматов. Его применяют для извлечения звуковых дорожек из видео.

Яндекс Переводчик

Сервис Яндекс Переводчик для перевода речи в текст работает в любых браузерах, в отличие от переводчика Гугла.

Выполните следующие шаги:

  1. Откройте страницу Яндекс Переводчик в браузере.
  2. Нажмите на значок микрофона (Голосовой ввод), расположенный в поле ввода исходного текста.
  3. Разрешите Яндекс Переводчику использовать микрофон на вашем компьютере.

  1. Говорите в микрофон, текст будет отображаться в окне переводчика. Одновременно текст будет синхронно переведен на другой язык, если вам необходима такая возможность.

В Яндекс Переводчик имеется возможность для перевода видео или аудио файлов из интернета:

  1. Включите микрофон на панели для ввода исходного текста.
  2. Откройте другую вкладку в браузере, запустите воспроизведение аудио или видео из интернета.
  3. В окне Яндекс Переводчика начнет отображаться текст. Параллельно будет вводится перевод на другой язык (если это вам нужно).

На Сервисе Яндекс Переводчик имеется ограничение в 10 000 знаков для одного перевода. Обход ограничения количества переведенных знаков:

  1. При подходе к лимиту, поставьте плеер на паузу, или прекратите диктовать в микрофон.
  2. Скопируйте в любой текстовый редактор переведенный текст.
  3. Включите голосовой ввод, а затем снова запустите воспроизведение исходного видео или аудио файла, чтобы продолжить перевод аудио в текст онлайн.

Преобразование речи в текст из видео или аудио файла, хранящегося на ПК, при помощи Яндекс Переводчика:

  1. Откройте окно Яндекс Переводчик, нажмите на кнопку «Голосовой ввод» (микрофон).
  2. При помощи мультимедиа плеера запустите видео или аудио файл на компьютере.
  3. В окне переводчика для ввода исходного текста появится перевод голоса в текст.

ЗАКЛЮЧЕНИЕ

Большинство компаний все чаще приспосабливаются к модели работы на дому из-за ее многочисленных преимуществ. Это включает в себя:

  • Гибкий график
  • Лучшее удержание сотрудников, поскольку сотрудник может сбалансировать работу и домашнюю жизнь
  • Повышенная мотивация персонала
  • Улучшение здоровья и благополучия персонала
  • Компания может экономить на офисных площадях
  • Компания экономит также на расходных материалах и счетах за коммунальные услуги
  • Повышенная производительность за счет минимальных простоев
  • Меньше прогулов по болезни

Перед тем, как заняться транскрипцией, вам следует учесть ряд факторов:

  • Необходимые навыки
  • Преимущества работы из дома
  • Сколько в среднем зарабатывает транскрибатор
  • Возможности карьерного роста
  • Необходимое оборудование
  • Это полный или неполный рабочий день?

Работа на дому — мечта многих людей. Поскольку многие работы по транскрипции не требуют опыта (кроме юридической и медицинской), любой может пройти обучение и начать зарабатывать.

Хорошая стратегия — построить свою карьеру от компаний по транскрипции, ориентированных на новичков, до тех пор, пока вы не станете профессионалом. После этого можно ориентироваться на компании с более высокими ставками заработной платы.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector