Фирма «1С» объявляет о запуске сервиса распознавания речи – поддержке нового механизма (дополнительной функциональности) платформы «1С:Предприятие 8», начиная с версии 8.3.23.
Автоматическое преобразование речи в текст помогает усовершенствовать бизнес-процессы в различных сценариях использования:
- Распознавание речи позволит быстрее и проще надиктовать длинные тексты вместо их набора с клавиатуры. Электронные письма, текстовые блоки в документах, содержание задач и комментариев удобнее вводить голосом, особенно, если у пользователя заняты руки, а также при работе на мобильных устройствах.
- Можно распознавать записи телефонных звонков или совещаний при хорошем качестве аудиозаписи. Для получения лучшего результата рекомендуется записывать отдельные звуковые каналы для каждого собеседника.
- Можно разработать на 1С голосовое управление интерфейсом приложений: по команде голосом открывать нужные формы, строить отчеты, выполнять поиск, заполнять реквизиты.
- Можно применять в голосовых системах самообслуживания, для речевой аналитики работы с клиентами, а также при создании интерфейсов для людей с ограниченными возможностями.
- Использовать работу с дополнительной грамматикой при потоковом распознавании речи: при начале распознавания вы можете передать какие-то специфичные термины (фамилии сотрудников, названия номенклатуры или компаний-контрагентов), и сервис будет их уверенно распознавать.
В рамках сервиса доступны следующие услуги:
- Потоковое распознавание — пользователь отправляет аудиоданные в режиме реального времени, в ответ периодически получает распознанный текст. Это удобно для того, чтобы надиктовать письма, или реализовать управление интерфейсом программы.
Длительность одного сеанса при потоковом распознавании речи с помощью сервиса имеет ограничение в 2 часа. Потоковое распознавание при локальном распознавании речи по длительности сеанса не ограничено.
- Файловое распознавание — пользователь отправляет в сервис файл с аудио, в ответ получает идентификатор задачи, по которому в дальнейшем сможет получить результат распознавания. В данном случае, пользователь может отправить готовый аудио-файл, например, запись совещания. Распознанный текст будет предоставлен пользователю с задержкой, которая зависит от длительности аудиофайла и загрузки сервиса.
Файловое распознавание может обрабатывать многоканальные аудиозаписи, в этом случае каждый канал будет распознаваться независимо. Для распознавания принимаются форматы аудио: WAV signed 16 bit little-endian и Opus в контейнере ogg. Частота дискретизации аудио: от 8 кГц до 48кГц. Максимальный размер аудиофайла – 1 Гб длительностью до 4 часов. Результаты распознавания доступны для скачивания из сервиса в течение 7 суток после выполнения задания.
Сервис «1С:Распознавание речи» доступен из платформы «1С:Предприятие 8» версии 8.3.23 и старше средствами встроенного языка. Распознавание речи в Платформе будет доступно как с помощью облачного сервиса 1С, так и локально. Для использования облачного сервиса распознавания речи требуется подписка на соответствующий сервис на Портале ИТС.
Для использования распознавания речи локально с помощью «1С:Предприятия 8» требуется скачать модели распознавания из облака 1С. Для скачивания моделей необходимо, чтобы программа пользователя находилась на официальной поддержке https://portal.1c.ru/support. Для дальнейшего использовании распознавания речи в Платформе локально, подписка ИТС для распознавания не потребуется.
Также предоставлено демо-приложение (библиотека), которое позволит выполнить регистрацию в сервисе для использования облачного распознавания речи, или скачать модели для работы локального распознавания. Демо-приложение можно скачать по адресу: https://speech.1c.ai/speech-demo.zip.
Распознавание речи можно использовать в приложении «1С:Документооборот», начиная с версии 3.0.9.18, например, для заполнения писем голосом.
Подробнее о возможностях сервиса можно узнать на Портале 1С:ИТС: https://portal.1c.ru/applications/1C-Speech-Recognition и в публикации на сайте сервиса https://speech.1c.ai.