Роботизированная вопросно-ответная система с голосовым модулем "виртуальный ассистент"

Авторы патента:

G10L15/22 - методы, используемые в процессе распознавания речи, например диалог человека с машиной

Владельцы патента RU 2781493:

Общество с ограниченной ответственностью фирма "Интерсвязь" (RU)

Изобретение относится к интерфейсам управления телекоммуникационными информационными системами. Технический результат заключается в обеспечении распознавания устной речи, а также в обеспечении взаимодействия с текстовым каналом коммуникации. Технический результат достигается за счет того, что система содержит модуль телефонной станции, выполненный с возможностью при поступлении звонка перенаправлять его на модуль с протоколом двунаправленной передачи звука AudioSocket, выполненный с возможностью перехвата управления голосовым потоком и перенаправления его через модуль детекции тишины в модуль распознавания речи, выполненный с возможностью преобразования устной речи в текст и соединенный с диалоговым модулем, который через базу данных виртуального ассистента, в которой хранится информация о сценарии диалога и информации по прохождению сценария для каждого обращения, соединен с модулем составления отчета, также диалоговый модуль соединен с модулем синтеза речи, который в свою очередь соединен с модулем протокола двунаправленной передачи звука AudioSocket. 1 ил.

Техническое решение относится к области информационных технологий и систем связи, использующих, в частности, к интерфейс управления телекоммуникационными информационными системами, использующими IVR (Interactive Voice Response - голосовые меню), и может быть использована для автоматизированного предоставления разнообразных услуг в телекоммуникационной сети с использованием сервиса IVR.

Из уровня техники известна система (патент RU 95206, МПК H04L 12/00, опубл. 10.06.2010), содержащая функционал воспроизведения аудиозаписей в голосовом канале связи с возможностью частично или полностью закрывать входящие обращения поступающие в контакт-центр в голосовом канале. Также содержащая систему многоуровневого голосового меню, включающую модуль IVR (Interactive Voice Response - интерактивный голосовой ответ), которая связана с сервером сообщений, включающим в себя средства приема, обработки и хранения голосовых сообщений, средства формирования меню и очередности сообщений, модуль коммутации, связанный с модулем IVR.

Недостатки данной системы: взаимодействие с системой осуществляется путем нажатия клавиш на телефоне в зависимости от озвученной информации, а также отсутствие возможности интегрироваться с текстовым каналом связи таким как чат-система или мессенджер.

Из уровня техники известна роботизированная вопросно-ответная система с голосовым модулем (патент RU 2724600, МПК G10L15/22, G06F40/20, опубл. 25.06.2020), которая содержит модуль автоматического запуска соединения с электронным устройством пользователя, выполненный с возможностью взаимодействия с IVR-системой для обеспечения соединения с электронным устройством пользователя, причем система содержит модуль составления отчетов о взаимодействии роботизированной вопросно-ответной системы с IVR-системой, выполненный с возможностью заполнения отчета данными, полученными при взаимодействии роботизированной вопросно-ответной системы с IVR-системой в случае отсутствия установленного соединения системы с электронным устройством пользователя.

Недостатки данной системы: отсутствие визуального интерфейса диалоговой для редактирования сценария диалога.

Техническая задача изобретения направлена на расширение функционала голосовой роботизированной вопросно-ответной системы.

Технический результат, на достижение которого направлено изобретение, заключается в обеспечении распознавания устной речи, и за счет ключевых слов или классификатора тематик воспроизводить определенный блок речевых фраз из диалогового сценария, а также в обеспечении взаимодействия с текстовым каналом коммуникации по принципу работы голосового канала за исключением модуля распознавания речи.

Технический результат достигается тем, что роботизированная вопросно-ответная система с голосовым модулем содержит модуль телефонной станции АТС Asterisk, выполненный с возможностью при поступлении звонка перенаправлять его на модуль с протоколом двунаправленной передачи звука AudioSocket, выполненный с возможностью перехвата управления голосовым потоком и перенаправления его через модуль детекции тишины в модуль распознавания речи, выполненный с возможностью преобразования устной речи в текст и соединенный с диалоговым модулем, который через базу данных виртуального ассистента, в которой хранится информация о сценарии диалога и информации по прохождению сценария для каждого обращения, соединен с модулем составления отчета, также диалоговый модуль соединен с модулем синтеза речи, который в свою очередь соединен с модулем протокола двунаправленной передачи звука AudioSocket.

За счет наличия в системе модуля распознавания устной речи система может взаимодействовать с клиентом в голосовом канале.

За счет наличия в системе модуля синтеза речи в системе осуществляется воспроизведение определенного блока речевых фраз без использования предварительно записанных аудио файлов.

При помощи диалогового модуля обеспечиваются взаимодействия с текстовым каналом коммуникации по принципу работы голосового канала за исключением модуля распознавания речи за счет работы с текстовым представлением данных с использованием методов прохождения скрипта по ключевым словам или классификатора тематик.

Голосовая роботизированная вопросно-ответная система может быть представлена программно-аппаратным комплексом, выполненным с возможностью взаимодействия с электронным устройством пользователя по каналу цифровой связи, например, сервером, содержащим специализированное программное обеспечение и выполненным с возможностью вопросно-ответного взаимодействия с электронным устройством пользователя, а также загрузки, редактирования и удаления специализированного программного обеспечения администратором системы. Система может содержать базу сценариев взаимодействия с пользователем, которая может быть интегрирована в модуль автоматического запуска соединения с электронным устройством пользователя, либо она может быть размещена удаленно и может быть соединена с модулем автоматического запуска сценария любыми известными средствами обеспечения связи.

Сущность заявляемой системы поясняется графическим материалом, где на фиг. представлена блок-схема системы, где основным блокам/модулям присвоены следующие позиции:

1. Телефон, устройство с которого поступает сигнал;

2. Модуль телефонной станции ATC Asterisk;

3. Модуль с протоколом двунаправленной передачи звука AudioSocket;

4. Модуль детекции тишины;

5. Модуль распознавания речи;

6. Диалоговый модуль;

7. База данных виртуального ассистента;

8. Модуль составления отчетов;

9. Модуль синтеза речи.

Система работает следующим образом.

При реализации работы системы осуществляются следующие основные этапы (показаны на фиг.):

10 - Осуществление вызова (звонка) с телефона пользователя 1 на модуль телефонной станции АТС Asterisk 2;

11 - Передача управления голосовым потоком АТС Asterisk 2 модуль с AudioSocket 3;

12 - Извлечение частей голосового потока, где пользователь произносил какие-либо фразы, в модуль с AudioSocket 3, с помощью модуля детекции тишины VAD 4;

13 - Преобразование голоса в текст из фразы, извлеченной благодаря модулю детекции тишины VAD 4, при помощи модуля распознавания речи 5;

14 - Передача текстовой фразы из модуля распознавания речи 5 в диалоговый модуль 6;

15 - Сохранение необходимой информации в базу данных 7 из диалогового модуля 6, для формирования ответа пользователю;

16 - Формирование диалога, используя необходимую информацию из базы данных 7, обработанной модулем составления отчетов 8;

17 - Сохранение текущего состояния диалога с пользователем в базу данных 7 из модуля составления отчетов 8;

18 - Извлечение текстового ответа пользователю в диалоговый модуль 6 из базы данных 7;

19 - Преобразование текстовой фразы из диалогового модуля 6 в аудио сегмент при помощи модуля синтеза речи 9;

20 - Добавление аудио фразы из модуля синтеза речи 9 в голосовой поток модуля с AudioSocket 3;

21 - Передача голосового потока из модуля с AudioSocket 3 в модуль телефонной станции АТС Asterisk 2;

22 - Воспроизведение голосового потока в телефоне пользователя 1 из модуля телефонной станции АТС Asterisk 2.

Пример работы системы с входящими обращениями в голосовом канале по вопросам не работающего телевидения.

В систему поступает вызов с устройства пользователя на модуль 2 телефонной станции АТС Asterisk. Затем осуществляется передача голосового потока из модуля 2 АТС Asterisk в модуль 3 с AudioSocket. Далее ожидается фраза от пользователя с причиной обращения. Пользователь голосом озвучивает причину «не показывает кабельное телевидение». С помощью модуля детекции тишины 4 определяется момент окончания фразы, после чего модуль детекции тишины 4 отправляет в модуль распознавания речи 5 запись фразы пользователя. Модель распознавания речи 5 переводит ее в текст и отправляет в диалоговый модуль 6. Диалоговый модуль 6 сохраняет в базу данных 7 виртуального ассистента распознанный текст фразы пользователя и определяет с помощью классификатора тематик тему обращения и берет из базы 7 данные, которые нужно озвучить в рамках сценария для определенной темы.

В случае темы «проблемы с кабельным телевидением» пользователю будет озвучена фраза с просьбой проверить плотность подключения кабеля к телевизору. Ответ отправляется в голосовой канал от диалогового модуля 6 в модуль 3 с AudioSocket через модуль синтеза речи 9, в котором происходит преобразование текста ответа в аудио. Далее от модуля 3 с AudioSocket передается голосовой поток в модуль 2 АТС Asterisk и воспроизводится в устройство пользователя. Далее ожидается ответ от пользователя.

Последующая обработка всех ответов от пользователя происходит по аналогичному сценарию обработки первой фразы. В текущем примере если, пользователь ответит, что у него плотно вставлен кабель в телевизор, то система предложит ему проверить целостность кабеля в квартире. В том случае, если пользователь подтверждает целостность кабеля в квартире, то озвучивается информация о том, что по адресу пользователя оформится выезд инженера для проверки целостности кабеля на прилегающей территории и разговор закончится. Модуль 2 АТС Asterisk завершит звонок.

Представленная система обеспечивает автоматическое информирование клиентов без участия оператора на входящих и исходящих звонках, чатах, а также выполнение сценариев автоматизации.

Данная система может быть использована в чат-ботах, или голосовых роботах, помогает обрабатывать входящие обращения клиентов, не прибегая к помощи операторов, и позволяет осуществлять автоматическое информирование клиентов, автоматическое закрытие обращения, а также автоматическое определение темы обращения и перевод обращения на нужного сотрудника компании.

Роботизированная вопросно-ответная система с голосовым модулем, характеризующаяся тем, что содержит модуль телефонной станции АТС Asterisk, выполненный с возможностью при поступлении звонка перенаправлять его на модуль с протоколом двунаправленной передачи звука AudioSocket, выполненный с возможностью перехвата управления голосовым потоком и перенаправления его через модуль детекции тишины в модуль распознавания речи, выполненный с возможностью преобразования устной речи в текст и соединенный с диалоговым модулем, который через базу данных виртуального ассистента, в которой хранится информация о сценарии диалога и информации по прохождению сценария для каждого обращения, соединен с модулем составления отчета, также диалоговый модуль соединен с модулем синтеза речи, который в свою очередь соединен с модулем протокола двунаправленной передачи звука AudioSocket.

Изобретение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в повышении точности идентификации намерения пользователя на основании текстового представления его высказывания.

Способ и система для мониторинга работы системы помощи с распознаванием голоса в чувствительной к данным среде // 2774095

Изобретение относится к области вычислительной техники для мониторинга работы системы помощи с распознаванием голоса в чувствительной к данным среде. Технический результат заключается в сохранении конфиденциальности данных пользователя при оценке работы системы помощи посредством использования только агрегированных данных.

Голосовое диалоговое устройство, голосовая диалоговая система и способ управления для голосовой диалоговой системы // 2772382

Изобретение относится к области вычислительной техники. Технический результат заключается в обеспечении управления голосовым диалоговым устройством для диалога с пользователем независимо от состояния нагрузки на пользователя.

Способ голосового управления и электронное устройство // 2766255

Изобретение относится к области вычислительной техники. Технический результат заключается в повышении эффективности речевого управления речевого приложения в электронном устройстве.

Способ и устройство интеллектуального управления объектом // 2761762

Изобретение относится к области систем управления, а именно к способам и устройствам голосового и жестового управления объектами. Техническим результатом изобретения является повышение стабильности и надежности управления объектом.

Способ и приспособление для голосовой активации // 2760368

Изобретение относится к области вычислительной техники. Технический результат заключается в обеспечении возможности пользователю прямо продолжать сценарий взаимодействия, который имел место перед ожиданием, без необходимости в повторении процесса взаимодействия.

Способ управления диалогом и система понимания естественного языка в платформе виртуальных ассистентов // 2759090

Изобретение относится к области вычислительной техники. Технический результат заключается в повышении точности формирования ответов пользователю виртуальным ассистентом.

Способ и система для обработки пользовательского разговорного речевого фрагмента // 2757264

Изобретение относится к области вычислительной техники для обработки естественного языка. Технический результат заключается в повышении точности определения действия, которое необходимо выполнить электронному устройству в соответствии с пользовательским разговорным речевым фрагментом.

Беспроводной терминал, сервер администрирования, сервер интерпретации намерений, способ управления ими и программа // 2750623

Изобретение относится к области компьютерной техники. Техническим результатом является обеспечение возможности в интерактивном режиме получать намерение пользователя, не требуя от пользователя выполнения сложных операций.

Компьютерное устройство коммуникации с пользователем // 2746468

Изобретение относится к компьютерным устройствам коммуникации с пользователем. Технический результат заключается в обеспечении возможности в ответ на голосовые запросы пользователя передавать ему объемную визуальную информацию из внешних источников, при этом адаптировать ее для вывода на объёмный дисплей.