Android: функция голосового набора текста, настройка и возможности
Содержание:
Совместная работа с компьютером
Для использования голосового набора на ноутбуке или стационарном ПК потребуется подключение микрофона и установка десктопных версий мессенджеров. В таком случае можно будет диктовать информацию в микрофон, но текст будет отображаться в виде звуковых файлов.
Чтобы создать текст при помощи голоса, можно использовать приложение «Голосовой блокнот MSpeech» ( требует инсталляции на ПК) или онлайн-сервис Speechpad. После надиктовки информации в микрофон, расшифрованный текст отображается в окне, откуда его можно скопировать и вставить в текст сообщения мессенджера.
При работе с документами в Google.doc (в облаке), открываете документ на двух устройствах ПК и смартфон. При вводе текста голосом на мобильном устройстве изменения синхронно будут происходить на ПК.
IOS
Обязательные условия
- На устройстве установлена последняя версия Google Home.
- Вы вошли в аккаунт Google на устройстве.
- Вы находитесь в Великобритании, Канаде или США.
- Для Google Ассистента установлен английский (Великобритания, Канада или США) или французский (Канада) язык.
На какие номера можно звонить
- С номеров США или Канады на номера США или Канады.
- С номеров Великобритании на номера Великобритании.
-
На международные и платные (1-900) номера, если вы связали устройство с:
- номером в Google Fi;
- номером в Google Voice, у которого достаточно средств на счету.
Примечание. Операторы Google Fi и Google Voice доступны только в США.
Вызвать экстренные службы с помощью Ассистента невозможно.
Сколько стоит звонок
Для большинства номеров США, Великобритании и Канады звонки бесплатные.
Если вы установили связь с номером в Google Fi или Google Voice, с вас будет взиматься плата по указанным тарифам.
Настройки голосового доступа


Вы можете получить доступ к дополнительным функциям голосового доступа в его меню настроек. Доступ к меню настроек немного сложен, так как вы не открываете его из ящика приложений, как большинство приложений. Вместо этого необходимо нажать на запись «Голосовой доступ» в области уведомлений, а затем нажать «Настройки». Или перейдите в Настройки> Специальные возможности> Голосовой доступ> Настройки.
В меню настроек есть дополнительные опции. Из них наиболее важными являются:
- Кнопка активации: перекрывает постоянный пузырь на экране. Нажав на нее, вы активируете распознавание голоса из любого меню.
- Настройка ключа активации: позволяет назначить физическую кнопку, например клавиатуру или переключатель Bluetooth, в качестве триггера для распознавания голоса.
- Тайм-аут после отсутствия речи: отключение этого позволяет непрерывно запускать голосовой доступ, пока включен экран телефона. По умолчанию при включении этот тайм-аут составляет 30 секунд.
- Активен во время звонков: позволяет использовать голосовой доступ во время телефонных звонков.
- Отмена при касании: обычно касание экрана отключает голосовой доступ. Включение этого делает его таким, что касание экрана не отключает распознавание голоса.
- Показать все команды: посмотрите все, что позволяет голосовой доступ.
- Открыть учебное пособие: снова запускает учебное пособие на случай, если вам понадобится переподготовка по использованию голосового доступа.
Tasker
Если после всего прочитанного тебе все равно не хватает команд для воплощения своих фантазий, то, имея немного времени, можно настроить Google Now на выполнение практически любых команд. Для этого нам понадобятся прежде всего Tasker и плагин AutoVoice.
Вариант 1. Присоединись к сообществу «Xakep.ru», чтобы читать все материалы на сайте
Членство в сообществе в течение указанного срока откроет тебе доступ ко ВСЕМ материалам «Хакера», увеличит личную накопительную скидку и позволит накапливать профессиональный рейтинг Xakep Score! Подробнее
Вариант 2. Открой один материал
Заинтересовала статья, но нет возможности стать членом клуба «Xakep.ru»? Тогда этот вариант для тебя! Обрати внимание: этот способ подходит только для статей, опубликованных более двух месяцев назад. Я уже участник «Xakep.ru»
Я уже участник «Xakep.ru»
Управление техникой голосом до недавнего времени можно было наблюдать только в фантастических фильмах, описывающих мир будущего. Но уже сейчас дать команду мобильному устройству без использования рук достаточно просто. Выход обновлений программного обеспечения постоянно расширяет функционал этой опции и улучшает распознавание речи. В текущей статье рассмотрим, как работает голосовое управление Андроид, опишем необходимые настройки и основные команды.
Онлайн сервисы для набора текста голосом
На данный момент есть очень большой выбор сервисов и программных приложений для голосового набора команд и управления.
Голосовой блокнот speechpad.ru
Преимущества:
Для использования онлайн версии следует перейти на сайт https://speechpad.ru/, пролистать страницу вниз, включить запись и получить готовый текст. Для браузера потребуется скачать и установить расширение.
Инструкция по использованию:
- Кликните по кнопке «Включить запись». (если Вы первый раз это делаете, то в правом верхнем углу возникнет всплывающее уведомление о том, что нужно разрешить доступ сервису к микрофону).
- Постарайтесь как можно четче и ближе к микрофону произносить слова. Стоит учитывать, что проговариваемый текст будет появляться там, где находится курсор. А если случайно перед этим был выделен текст, то он затрется.
- Можно активировать опцию «Отключить управление заглавными буквами» и тогда Google не будет обновлять регистр в зависимости от пунктуации. А для изменения необходимо будет воспользоваться кнопкой с текстом А/а, она увеличит или уменьшит размер той буквы рядом с курсором.
- Для удаления действия нужно нажать кнопку «Отменить».
- Для расстановки знаков препинания есть специальные кнопки на панели, активировать кликом левой кнопки мыши. Также Вы можете отметить для использования функцию «Заменять слова пунктуации» и тогда сможете голосом расставлять знаки препинания.
- Для того, чтобы поменять язык, необходимо нажать на данное поле и появится выпадающий список, в котором следует найти и выбрать требуемый. При условии, что нет нужного, необходимо зарегистрироваться и добавить в личном кабинете.
- Чтобы давать команды сервису при помощи голоса, активируйте пункт «Выполнять команды».
- Также вывод текста можно делать не только в поле на сайте сервиса, но и в буфер обмена после выбора использования такой функции на странице и установке расширения для блокнота.

Голосовой ввод текста в Гугл документах
Преимущества и возможности:
- Запись, редактирование и форматирование информации голосом.
- Удобство: нет необходимости устанавливать программу на устройство.
- Мультиязычность.
Пошаговая инструкция применения:
- Перейти в браузере в раздел «Инструменты».
- Откройте из предложенных пунктов «Голосовой ввод».
- Активируйте кликом иконку микрофона (разрешите использование).
- Начинайте громко и четко произносить то, что следует записать.
Расширение для браузера Войснот II

Достоинства:
- Удобство.
- Интуитивно понятный интерфейс: достаточно простое управление.
- Есть возможность создать ярлык для быстрого доступа к сервису.
- Мультиязычность.
- Исправление написания слов при нечетком или неправильном произношении.
- Сохранение информации в браузере, кэше, буфере обмена.
Инструкция использования:
- Установка:
- Перейти в магазин расширений Google: http://goo.gl/oMx8Xx;
- Установить и разрешить использование микрофона.
- Создание ярлыка на рабочем столе:
- Перейти на страницу расширений, которые установлены.
- Нажать на иконку Войснот.
- Выбрать в появившемся меню «Создать ярлык».
- Запуск/остановка:
- Нажать на кнопку с изображением микрофона.
- Или активировать сочетание клавиш Ctrl+Пробел.
- Запись текста предполагает расставление знаков препинания с учетом правил русского языка и пауз в процессе диктовки.
- Чтобы отредактировать, следует воспользоваться панелью инструментов: стереть, сохранить, скопировать, исправить регистр букв, добавить недостающие знаки пунктуации, перейти на новую строку.
Распознавание речи в браузере TalkTyper

Преимущества:
- Бесплатный сервис;
- Мультиязычность.
- Исправление написания слов при нечетком или неправильном произношении.
Инструкция:
Голосовой блокнот August4u

Достоинства:
- Простота использования.
- Является уникальной разработкой.
- Высокий уровень качества и скорости распознавания.
- Использовать можно бесплатно.
Инструкция:
- Перейти на страницу сервиса: https://august4u.net/?speech2text.
- Можно выбрать один из 6 языков.
- Нажать на иконку микрофона и разрешить доступ к устройству.
- Автоматически включена расстановка знаков препинания, но нажав на кнопку с текстом «.,!» можно отключить данную функцию.
- По окончании диктовки можно сохранить, копировать, отправить на электронную почту полученный текст и очистить поле, нажав на иконку с крестиком.
Совместная работа с компьютером
Для использования голосового набора на ноутбуке или стационарном ПК потребуется подключение микрофона и установка десктопных версий мессенджеров. В таком случае можно будет диктовать информацию в микрофон, но текст будет отображаться в виде звуковых файлов.
Чтобы создать текст при помощи голоса, можно использовать приложение «Голосовой блокнот MSpeech» ( требует инсталляции на ПК) или онлайн-сервис Speechpad. После надиктовки информации в микрофон, расшифрованный текст отображается в окне, откуда его можно скопировать и вставить в текст сообщения мессенджера.
При работе с документами в Google.doc (в облаке), открываете документ на двух устройствах ПК и смартфон. При вводе текста голосом на мобильном устройстве изменения синхронно будут происходить на ПК.
Как вывести Алису на главный экран телефона Андроид и активировать из приложения Яндекс?
В принципе, уже сейчас можно зайти в приложении Яндекс и увидеть иконку вызова голосового ассистента в углу экрана. Достаточно на нее нажать, чтобы вызвать Алису и начать с ней общаться и давать команды.

Однако, это не совсем удобно. Гораздо проще вывести значок Алисы на рабочий стол Андроид. И иметь возможность запускать помощника непосредственно с главного экрана смартфона. Для этого вызываем настройку виджетов на дисплее

И ищем «Яндекс» в списке доступных для установки

Заходим в данный раздел. Здесь разработчики предоставили нам возможность поместить на главный экран огромное количество разнообразных виджетов, в том числе и быстрый доступ к боту Алисе. Поэтому нам надо найти иконку в виде микрофона (Яндекс Поиск)

И перетащить его на рабочий стол Android

Теперь при нажатии данной иконки будет включаться Алиса
Дополнительные утилиты
Для голосового ввода номера можно воспользоваться сторонними программами. Для установки приложения «Голосовой набор», следует открыть Play Market и ввести название программы. Далее выбрать её и нажать на кнопку «Установить». После скачивания кликнуть на иконку «Открыть».

Вначале работы с приложением потребуется дать разрешение на доступ к контактам и осуществление телефонных звонков.

На главной странице утилиты отображены две вкладки:
- Последние контакты — конечные номера, набранные в ближайший период времени.
- Часто используемые контакты — все номера, хранящиеся в телефоне.

Сверху вкладок с номерами расположена кнопка микрофона. Кликнув по ней, следует произнести имя контакта, после чего будет произведен вызов.

В правом верхнем углу находится иконка настроек в виде шестерёнки. Нажав на неё можно установить следующие параметры:
- Распознавания речи — язык;
- Язык приложения;
- Автозапуск. Включение распознавания речи при запуске программы;
- Автоматический вызов номера по умолчанию. Если у контакта несколько номеров, то будет набираться номер, установленный основным;
- Время, через которое будет произведен вызов после распознавания речи;
- Показ списка контактов.
Голосовые команды Окей Гугл
Голосовое управление Google
работает следующим образом — сначала вы должны произнести фразу «Окей Гугл»
и затем, когда откроется экран распознавания речи, вы должны произнести
голосовую команду.
Вот небольшой список возможных голосовых команд:
«Позвони» и произносите имя контакта из вашей
телефонной книги. Например так: «Позвони Катя«. По этой команде будет
запущено приложение «Телефон» с вызовом абонента «Катя».
«Напиши сообщение» и произносите имя контакта из
вашей телефонной книги. Например так: «Напиши Катя«. По этой команде
будет запущено приложение «Сообщения» и будет составлено и отправлено СМС
сообщение для абонента «Катя»:

и затем вы диктуете текст сообщения:

Можно диктовать команды арифметических вычислений.
Например по команде «квадратный корень из 99″ будет открыто
приложение «Калькулятор»:

Можно диктовать команды перевода слов. Например по
команде «как будет хлеб по английски» будет открыт
онлайн-переводчик:

И еще много есть команд, которые можно дать вашему устройству. Вот более
полные списки голосовых команд Google:
-
Список голосовых команд на сайте Google
-
Еще
один список голосовых команд
Transcribe — Speech to Text (iOS)
Transcribe – iOS / iPad-ассистент для перевода голоса в текст в реальном времени. Приложение также умеет расшифровывать аудио из видео источника. Это полезно, в частности, если нужно извлечь субтитры из youtube ролика.
Ключевые особенности и функции Transcribe:
- Автоматический перевод голосовых заметок (voice memo) в простой текст;
- Полноценная поддержка около 100 языков;
- Импорт / экспорт расшифровки в текстовый редактор или облако Dropbox;
- Экспорт субтитров в формате SRT.
3 часа расшифровки доступны бесплатно каждый месяц, после чего вступают в силу тарифы: $4.99 за 1 час перевода в текст, $29.99 за 10 часов и так далее, по нарастающей. Приложение доступно только для iOS, Android-версии у “голосового блокнота” нет.
Как эффективно использовать голосовое управление в iOS 13

Изначально опция находится в разделе Универсальный доступ. Как и в случае с подключением мышки, она ориентирована на пользователей с ограниченными возможностями. Однако, это не мешает применять крутую фишку в быту остальным владельцам техники Apple.
Смартфон и планшет часто применяется на кухне. На гаджете удобно просматривать рецепты, общаться с друзьями во время приготовления пищи или смотреть любимый сериал. Чтобы не касаться устройства грязными руками, пригодится голосовое управление.
Некоторые пользователи ремонтируют и чинят что-то по инструкции с гаджета. В таком случае во время грязной работы управление без касаний тоже может пригодиться.
Можно взаимодействовать с умным домом через голосовое управление, что на практике оказывается более удобно, чем через ассистент Siri.
Еще одним применением голосового управления может стать использование смартфона за рулем. Не нужно использовать CarPlay со скудным набором возможностей или ограниченную Siri. Просто просим нажать на нужное место экрана или запустить фишку с нужным номером.
«Яндекс. Навигатор»
Платформа: iOS/Android/Windows PhoneЦена: бесплатноВозрастные ограничения: 0+Оценка 5
Основное преимущество «Яндекс.Навигатора» в том, что он понимает сложные команды на русском языке. Кроме прокладки маршрута (с учетом пробок, кстати) или локального поиска («едем через продуктовый магазин») приложение может фиксировать ситуацию на дороге по команде. Просто скажите, что видите аварию на светофоре, и приложение сразу же отметит её на карте и сообщит другим пользователям о ней. А ещё «Яндекс.Навигатор» может запоминать ключевые точки и по команде «поехали домой» сразу проложит нужный маршрут.
э-Диктант (Android)
Помните, как писали в школе текст под диктовку? Теперь “диктант” за вас напишет приложение «э-Диктант». Нужно только скачать программу на свой смартфон через Play Market (https://play.google.com/store/apps/details?id=rs.edukom.diktat).
«э-Диктант» упростит жизнь блогерам, писателям, бегунам, бизнесменам, студентам. В общем, тем, кому нужно быстро перевести речь в текст, и желательно на ходу.
Особенности приложения “э-Диктант”:
- Речевой блокнот позволяет быстро писать тексты любого объема.
- Редактирование проводится прямо во время записи.
- Э-Диктант продолжает мониторинг звуков и речи при длительных перерывах.
- Доля успешно преобразованного текста превышает 90 процентов.
Использование функции «Управление голосом» на iPhone, iPad или iPod touch
Функцию «Управление голосом» можно использовать для навигации по устройству и взаимодействия с ним. С помощью голосовых команд можно выполнять жесты касания и смахивания, вводить текст и т. д.
Чтобы использовать управление голосом, вам нужна iOS 13 или более поздней версии либо iPadOS. Прежде чем воспользоваться функцией «Управление голосом», необходимо загрузить файл. По окончании загрузки вам не требуется подключение к сети Wi-Fi, чтобы использовать функцию «Управление голосом». Подключение к сети Wi-Fi рекомендуется перед первым включением функции «Управление голосом».
Функция «Управление голосом» доступна не во всех странах или регионах. Функция «Управление голосом» использует механизм распознавания речи Siri только для английского языка (США).
Контроль функции и запуск приложений
В завершении изучения возможностей голосового помощника рассмотрим изменение настроек системы и открытие приложений. Количество поддерживаемых функций и команд не слишком обширно, но при практическом применении этого оказывается вполне достаточно. В качестве примера приведем следующие команды:
- открыть Facebook, Instagram или любое другое приложение;
- увеличить или уменьшить яркость экрана;
- повысить или понизить громкость;
- следующая песня плейлиста;
- включитьWi-Fi, Bluetooth;
- активировать фонарик;
- сделать фото;
- записать видео;
- открыть будильники.
Рассмотренные выше команды являются основными и помогут использовать функционал голосового помощника в полную силу.
Важно знать
При произнесении задачи следует говорить четко и без запинок, иначе система запутается и не сможет выполнить действие.
В начале речи необходимо полностью представлять команду в голове. После нескольких тренировок дальнейшее использование функции не вызовет затруднений.
Далее кратко опишем принцип работы программы, позволяющей осуществлять голосовое управление всей системой Андроид.
Как настроить разблокировку Android голосом
Функция Voice Match позволяет разблокировать телефон голосом командой «Окей, Гугл» вместо пин-кода или отпечатка пальца. Причём если другой человек попробует разблокировать ваше устройство этой ключевой фразой – ваш телефон останется заблокированным. Конечно, если его голос не окажется слишком похожим на ваш собственный (например, как у близких родственников одного пола).
Эта функция разблокировки, к сожалению, работает не на всех устройствах. Например, разблокировка с помощью Voice Match не работает на телефонах Xiaomi из-за особенностей безопасности оболочки MIUI. Покажем, как активировать эту функцию на совместимых телефонах:
- Если у вас не включена защита для разблокировки телефона, то переключатель «Разблокировка с помощью Voice Match» будет не активен. Необходимо включить защиту при блокировке.
- Нажимаем «Настройки». Листаем вниз, находим категорию «Блокировка экрана и безопасность» и нажимаем на неё.
- Нажимаем «Блокировка экрана».
- Выбираем тип защиты, например «PIN код».
- Вводим пароль и нажимаем «Продолжить».
- Повторно вводим пароль и нажимаем «OK».
- Выберете, нужно ли показывать текст уведомлений на заблокированном экране. Мы выбрали не показывать. Нажимаем «Готово».
- Блокировка экрана включена.
- Возвращаемся в настройки Voice Match (Приложение Google → Настройки → Голосовой поиск → Voice Match). Нажимаем переключатель «Разблокировка с помощью Voice Match».
- Нас предупреждают о невысокой надёжности данной функции (многие люди имеют похожие голоса, например родственники). Нажимаем «OK».
- Поздравляем! Вы настроили разблокировку Android-устройства с помощью голоса. Протестируйте данную функцию. Заблокируйте телефон и скажите «Окей Гугл» – телефон должен разблокироваться без требования ввести пароль или отпечаток пальца для разблокировки.
- Если через какое-то время, при попытке разблокировать телефон голосом, вы видите сообщение “Разблокировка голосом временно отключена. Устройство можно разблокировать только вручную“, то попробуйте перезаписать образец голоса и перенастроить функцию Voice Match. Это происходит из-за того, что после нескольких неудачных попыток разблокировки, смартфон блокирует данную функцию до полной перенастройки.
Google регулярно добавляет новые команды для своего голосового помощника. Мы сделали приложение со справкой по командам, которое регулярно обновляем. Установив это приложение, у вас всегда будет под рукой самый актуальный список команд:
Источник
Как пользоваться голосовым вводом
После активации функция будет доступна во всех приложениях, использующих текстовой ввод – мессенджеры, программы и пр. Чтобы пользоваться опцией и начать диктовать текст, нужно нажать поле ввода сообщения, и на клавиатуре (не в приложении) нажать 1 раз на микрофон. Появится надпись: «Говорите», после чего можно начинать надиктовку, которая тут же будет преобразована в слова на экране.

Когда набор закончится, останется только нажать клавишу «Отправка». Интересно, что знаки пунктуации также можно расставлять, для этого достаточно озвучить «Запятая», «Воскл. знак», «Двоеточие» и т.д.
Набранный голосом текст может отражаться подчеркнутым, при необходимости его можно отредактировать, а потом уже отправить.
Немного хитростей
Таскер — это хардкор. Можно творить потрясающие вещи, но для этого нужно освоить много информации, разбираться в переменных, регулярных выражениях и прочем. Для тех, кто не хочет возиться с Таскером, есть большое количество программ, которые используют возможности голосового управления, но имеют более понятный и доступный интерфейс и просты в обращении. Остановлюсь на трех.
Программа позволяет изменить ключевую фразу с «Ok, Google» на любую другую. К сожалению, после одного из обновлений сервисов и запроса от Google перестала работать с Google Engine, оставив только PocketSphinx. В связи с этим для ключевой фразы подходят только английские словосочетания, но раньше можно было удивлять присутствующих обращением к телефону «эй, ты» или «слушай команду».
Тем не менее разработчик обещает все поправить в следующих обновлениях. Из других функций можно отметить запуск распознавания по датчику приближения (два взмаха руки) и по встряске телефона. Как и MOTO X, поддерживает распознавание при выключенном экране, но, к сожалению, это очень сильно отражается на батарее, поэтому актуально для телефона на зарядке или автомобильных медиацентров на Android с постоянным питанием. Работает с Bluetooth-гарнитурой, имеет интеграцию с Таскером, может зачитывать текстовые сообщения.

Еще одна программа от разработчика Open Mic+. Интегрируется с Google Now и позволяет использовать расширенный набор команд. В списке поддерживаемых есть следующие: включить/выключить беспроводную точку доступа, приостановить/возобновить музыку, следующая/предыдущая песня, непрочитанные СМС/gmail (озвучит их голосом), громкость, блокировка телефона, сделать снимок, сделать селфи. Также можно включить диктофон, управлять подсветкой, автоповоротом экрана. С рутом можно выключить/перезагрузить телефон, очистить уведомления, включить режим «В самолете». Для поддерживаемых функций можно менять команды на свои. Также имеет интеграцию с Таскером, позволяя включить для каждой задачи срабатывание по названию Task. Есть модуль для Xposed, позволяющий использовать Commandr с Android Wear.

Ассистент Дуся
Ну и наконец, детище российских разработчиков — русскоязычный голосовой ассистент Дуся, который объединяет в себе все преимущества описанных приложений и утилит. Как и Tasker, Дуся позволяет создавать свои голосовые функции (они называются «скрипты»), причем в намного более понятной и простой форме (есть справка на русском, видеоуроки) и с более мощными функциями работы именно с речевыми командами. Вдобавок здесь есть и свой онлайн-каталог готовых скриптов, созданных другими пользователями. На момент написания статьи их было около ста.
Так же как и Commandr, Дуся умеет интегрироваться с Google Now, а также имеет множество видов других бесконтактных активаций — встряхиванием, взмахом, гарнитурой, поднесением к уху и в том числе и своей фразой активации на русском. А если хочется использовать интерфейс, то и он есть, очень простой, быстрый и функциональный. Среди функций есть 25 наиболее часто востребованных, есть даже управление умными домами и домашними кинотеатрами.
