Устройство автоматической верификации личности по голосу

Авторы патента:

Катанович Андрей Андреевич (RU)

Муравченко Виктор Леонидович (RU)

G10L17/22 - Установление или подтверждение личности говорящего

G10L15/06 - создание эталонных шаблонов; обучение систем распознавания речи, например по характеристикам голоса говорящего (G10L 15/14 имеет преимущество)

G06F21/32 - Обработка цифровых данных с помощью электрических устройств (вычислительные машины, в которых часть вычислений осуществляется гидравлическими или пневматическими устройствами G06D; оптическими средствами G06E; автономные внешние вводные и выводные устройства G06K; компьютерные системы, основанные на специфических вычислительных моделях G06N; цепи полного /активного и реактивного/ сопротивления H03H)

Владельцы патента RU 2704723:

Федеральное государственное казенное военное образовательное учреждение высшего образования "Военный учебно-научный центр Военно-морского Флота "Военно-морская академия имени адмирала флота Советского Союза Н.Г. Кузнецова" (RU)

Изобретение относится к области вычислительной техники для распознавания голоса. Технический результат заключается в повышении точности распознавания голоса для идентификации личности. Технический результат достигается за счет устройства автоматической верификации личности по голосу, содержащего микрофон, АЦП, два коммутатора, блок расчета параметров речевого сигнала, блок сравнения параметров речевых сигналов, блок принятия решения верификации, блок вычисления эталона микрофона, блок запоминания эталона диктора, блок запоминания эталона микрофона, N блоков запоминания эталонов эквивалентов микрофонов, включенных параллельно блоку запоминания эталона микрофона, коммутатор входных цепей блоков запоминания эталонов микрофонов и коммутатор их выходных цепей, при этом вход коммутатора входных цепей соединен с выходом блока запоминания эталона микрофона, а выход коммутатора выходных цепей соединен с входом блока расчета параметров речевого сигнала. 3 ил.

Изобретение относится к системам установления или подтверждения личности говорящего. Техническим результатом является расширение функциональных возможностей устройства.

Известны различные устройства верификации (подтверждения) личности по голосу. Например, Метод распознавания диктора и устройство для его осуществления, Патент РФ №2230375 от 20.05.2012, Способ и устройство автоматической верификации личности по голосу, Патент РФ №2399102 от 10.09.2010.

Наиболее близким по технической сущности является последнее из названных выше изобретений - Патент РФ №2399102.

Недостатком известного устройства является ограничение анализа акустического сигнала диктора, находящегося перед микрофоном. В то же время для практики представляет интерес верификация личности по голосу диктора, который поступает по каналу проводной связи либо по радиоканалу и на микрофон устройства верификации поступает акустический сигнал от динамика приемного устройства канала связи.

Ожидаемым техническим результатом является расширение возможности устройства автоматического подтверждение личности по голосу при поступлении акустического сигнала на микрофон устройства по каналу связи. Под каналом связи здесь понимается микрофон передатчика высокочастотного сигнала, эфир либо фидерная линия, приемник высокочастотного сигнала, динамик приемника. Поставленная задача решается тем, что в устройство автоматической верификации личности по голосу, содержащее источник речевого сигнала (микрофон и аналого-цифровой преобразователь), соединенный с входом первого коммутатора, один из выходов которого подключен к первому входу блока расчета параметров речевого сигнала, а другой выход первого коммутатора подключен к входу блока вычисления эталона микрофона, выход которого соединен с входом второго коммутатора, первый выход которого подключен к первому входу блока сравнения параметров эталона и входного речевого сигнала, выход которого соединен с входом блока принятия решения о распознаваемом дикторе, выход которого является выходом устройства в целом, а второй выход второго коммутатора соединен с входом блока запоминания эталонов дикторов, выход которого соединен со вторым входом блока выбора эталона диктора, первый вход которого соединен с блоком ввода верификационного признака диктора, а выход блока выбора эталона диктора подключен ко второму входу блока сравнения параметров эталона и входного речевого сигнала, при этом блок расчета параметров речевого сигнала содержит выделитель начало/окончания речевого сигнала и блок формирования параметров входного речевого сигнала, а блок вычисления эталона микрофона содержит блок оценки начала/окончания речевого сигнала, блок вычисления среднего значения спектральной плотности мощности речевого сигнала, блок деления на этот эталон среднего значения спектральной плотности мощности речевого сигнала, при этом блок расчета параметров входного речевого сигнала содержит блок вычисления коэффициентов корреляции речевого сигнала, соединенный с блоком расчета оценки частоты основного тона, первый выход которого соединен с первым входом блока формирования параметров входного речевого сигнала, а второй выход подключен ко входу блока расчета оценок амплитуд несущих гармоник, выход которого соединен с первым входом блока деления амплитуд несущих частот на эталон амплитудно-частотной характеристики используемого микрофона, выход которого подключен ко второму входу блока формирования параметров входного речевого сигнала, при этом блок запоминания эталона микрофона подключен ко второму входу блока деления амплитуд несущих гармоник на эталон амплитудно-частотной характеристики используемого микрофона, а блок вычисления эталона микрофона содержит блок вычисления коэффициентов корреляции речевого сигнала, причем блок оценки начало/окончания речевого сигнала, блок вычисления коэффициентов корреляции речевого сигнала и блок вычисления среднего значения спектральной плотности мощности речевого сигнала соединены последовательно, выход блока вычисления среднего значения спектральной плотности мощности соединен с первым ходом блока деления на эталон среднего значения спектральной плотности мощности речевого сигнала, а второй вход блока деления соединен с выходом блока запоминания эталона среднего значения спектральной плотности мощности речевого сигнала, выход блока деления сигнала соединен со входом блока запоминания эталона микрофона, а блок сравнения параметров эталона и входного речевого сигнала выполнен с возможностью вычисления взвешенной Евклидовой невязки параметров входного речевого сигнала и эталона, отличающееся тем, что дополнительно параллельно блоку запоминания эталона микрофона включены N блоков запоминания эталонов эквивалентов микрофонов, коммутатор входных цепей блоков запоминания эталонов микрофонов и коммутатор их выходных цепей, при этом вход коммутатора входных цепей соединен с выходом блока запоминания эталона микрофона, а выход коммутатора выходных, цепей соединен с входом блока расчета параметров речевого сигнала.

Блок-схема устройства автоматической верификации личности по голосу представлена на Фиг. 1.

На Фиг. 2 приведена блок-схема расчета параметров речевого сигнала.

На Фиг. 3 приведена блок-схема определения эталона амплитудно-частотных характеристик (АЧХ) используемого микрофона.

Перечень позиций.

1 - микрофон (М);

2 - аналого-цифровой преобразователь (АЦП);

3 - коммутатор (низ - верификация или обучение, верх - настройка технических параметров);

4 - блок расчета параметров речевого сигнала (БПРС);

5 - блок сравнения параметров речевых сигналов (БСПРС);

6 - блок принятия решения верификации (БПРВ);

7 - блок запоминания эталона микрофона (БЗЭМ);

8 - блок вычисления эталона микрофона (БВЭМ);

9 - коммутатор (верх - верификация, низ - обучение);

10 - блок запоминания эталонов дикторов (БЗЭД);

11 - блок ввода верификационного признака диктора (БВВПД);

12 - блок выбора эталона диктора (БВЭД);

13 - блок оценки начала/окончания речевого сигнала (БОНОРС);

14 - блок вычисления коэффициентов корреляции речевого сигнала (БВККРС);

15 - блок расчета оценки частоты основного тона (БРОЧОТ);

16 - блок расчета оценок амплитуд несущих гармоник (БРОАНГ);

17 - блок деления амплитуд несущих гармоник на эталон амплитудно-частотной характеристики используемого микрофона (БДАНГМ);

18 - блок формирования параметров речевого сигнала (БФПРС);

19 - блок оценки начала/окончания речевого сигнала (БОНОРС);

20 - блок вычисления коэффициентов корреляции речевого сигнала (БВККРС);

21 - блок вычисления среднего значения спектральной плотности мощности (БВСЗСПМ);

22 - блок деления (БД);

23 - эталон амплитудно-частотной характеристики микрофона;

24 - эталон среднего значения спектральной плотности мощности речевого сигнала (ЭСЗСПМРС).

Работа устройства осуществляется в 2-х режимах: в режиме обучения и режиме верификации.

В режиме обучения речевой сигнал голосовых паролей, произносимых заранее известными дикторами, подают на вход микрофона 1 или выхода канала связи канала связи через АЦП 2 и коммутатор 3 на вход БРПРС 4. Коммутатор 3 переключает устройство в режим верификации или обучения (нижняя позиция на блоке 3 фиг. 1) или в режим настройки технических параметров (верхняя позиция на блоке 3 фиг. 1). В качестве голосовых паролей используют отдельные слова. Из речевого сигнала произнесенных паролей в БРПРС 4 формируют параметры речевых эталонов. При этом коммутатор 9 замыкает вход на второй (нижний на блоке 9 на фиг. 1) На каждое произнесение каждого голосового пароля каждого известного диктора запоминают свой эталон. Число заранее известных дикторов может быть любым: от одного и более. Число использованных голосов паролей также может быть любым, большим единицы.

Сохраненные эталоны используют для сравнения с входным речевым сигналом верифицируемого диктора. Выбор эталонов для верификации заявляемого диктора производят блоком БВЭД 12. В режиме верификации неизвестный диктор через блок БВВПД 11 вводит верификационный признак того диктора, тождество с которым он хочет подтвердить своим голосовым паролем. Далее блок БВЭД 12 выбирает для сравнения эталон того диктора, тождество с которым заявил верифицируемый диктор.

В этой части (осуществления верификации личности по голосу) заявляемое устройство полностью совпадает по составу блоков и их функционирования с устройством прототипа.

В отличие от прототипа, в котором вычисляется нормированное значение АЧХ используемого микрофона, при использовании канала связи акустический сигнал на микрофон заявляемого устройства поступает от динамика приемника канала связи. В этом случае нормирование АЧХ микрофона заявляемого устройства производится по тестовому сигналу (сигналу с равными амплитудами гармоник акустического сигнала от модуля тестирования микрофонов, например Euraudio PRO 600S), прошедшему по каналу связи изменившего тестовый сигнал в соответствии с реальной АЧХ канала связи, и далее прошедшему через микрофон заявляемого устройства, еще раз изменившего тестовый сигнал в соответствии с АЧХ микрофона заявляемого устройства. Следовательно, этот сигнал будет содержать информацию о совокупной АЧХ конкретного канала связи и микрофона устройства верификации. Совокупное значение АЧХ конкретного канала связи будет учтено заявляемым устройством как характеристика некоторого эквивалента микрофона устройства верификации, обладающего совокупной АЧХ, и будет внесена в память БЗЭМ 7. Поскольку принципиально возможно использование нескольких каналов связи, то целесообразно иметь несколько блоков БЗЭМ для реализации верификации голосов дикторов в различных каналах связи. При наличии нескольких N блоков БЗЭМ необходимо введение в устройство верификации входного и выходного коммутаторов для переключения блоков БЗЭМ при смене каналов связи. При использовании нескольких БЗЭМ функционирование всех блоков заявляемого устройства, включая и блоки БЗЭМ, принципиально не изменяется и полностью соответствует функционированию блоков устройства прототипа. Различие заявляемого устройства от устройства прототипа заключается только в увеличении числа блоков БЗЭМ и коммутаторов на их входах и выходах.

Таким образом, за счет введения дополнительных БЗЭМ, учитывающих АЧХ канала связи при тестировании микрофона устройства верификации, и коммутаторов переключения этих блоков, решается поставленная цель - расширение возможности известного устройства автоматической верификации личности по голосу диктора в части увеличения числа каналов верификация личности по голосу.

Устройство автоматической верификации личности по голосу, содержащее источник речевого сигнала (микрофон и аналого-цифровой преобразователь), соединенный с входом первого коммутатора, один из выходов которого подключен к первому входу блока расчета параметров речевого сигнала, а другой выход первого коммутатора подключен к входу блока вычисления эталона микрофона, выход которого соединен с входом второго коммутатора, первый выход которого подключен к первому входу блока сравнения параметров эталона и входного речевого сигнала, выход которого соединен с входом блока принятия решения о распознаваемом дикторе, выход которого является выходом устройства в целом, а второй выход второго коммутатора соединен с входом блока запоминания эталонов дикторов, выход которого соединен со вторым входом блока выбора эталона диктора, первый вход которого соединен с блоком ввода верификационного признака диктора, а выход блока выбора эталона диктора подключен ко второму входу блока сравнения параметров эталона и входного речевого сигнала, при этом блок расчета параметров речевого сигнала содержит выделитель начало/окончания речевого сигнала и блок формирования параметров входного речевого сигнала, а блок вычисления эталона микрофона содержит блок оценки начала/окончания речевого сигнала, блок вычисления среднего значения спектральной плотности мощности речевого сигнала, блок деления на этот эталон среднего значения спектральной плотности мощности речевого сигнала, при этом блок расчета параметров входного речевого сигнала содержит блок вычисления коэффициентов корреляции речевого сигнала, соединенный с блоком расчета оценки частоты основного тона, первый выход которого соединен с первым входом блока формирования параметров входного речевого сигнала, а второй выход подключен ко входу блока расчета оценок амплитуд несущих гармоник, выход которого соединен с первым входом блока деления амплитуд несущих частот на эталон амплитудно-частотной характеристики используемого микрофона, выход которого подключен ко второму входу блока формирования параметров входного речевого сигнала, при этом блок запоминания эталона микрофона подключен ко второму входу блока деления амплитуд несущих гармоник на эталон амплитудно-частотной характеристики используемого микрофона, а блок вычисления эталона микрофона содержит блок вычисления коэффициентов корреляции речевого сигнала, причем блок оценки начало/окончания речевого сигнала, блок вычисления коэффициентов корреляции речевого сигнала и блок вычисления среднего значения спектральной плотности мощности речевого сигнала соединены последовательно, выход блока вычисления среднего значения спектральной плотности мощности соединен с первым ходом блока деления на эталон среднего значения спектральной плотности мощности речевого сигнала, а второй вход блока деления соединен с выходом блока запоминания эталона среднего значения спектральной плотности мощности речевого сигнала, выход блока деления сигнала соединен со входом блока запоминания эталона микрофона, а блок сравнения параметров эталона и входного речевого сигнала выполнен с возможностью вычисления взвешенной Евклидовой невязки параметров входного речевого сигнала и эталона, отличающееся тем, что дополнительно параллельно блоку запоминания эталона микрофона включены N блоков запоминания эталонов эквивалентов микрофонов, коммутатор входных цепей блоков запоминания эталонов микрофонов и коммутатор их выходных цепей, при этом вход коммутатора входных цепей соединен с выходом блока запоминания эталона микрофона, а выход коммутатора выходных цепей соединен с входом блока расчета параметров речевого сигнала.

Похожие патенты:

Верификация говорящего // 2697736

Изобретение относится к верификации говорящего. Технический результат – обеспечение точной верификации подлинности говорящих, которые говорят на разных языках или диалектах.

Телекоммуникационный комплекс // 2691864

Изобретение относится к области вычислительной техники для обработки и передачи данных с корректировкой орфографических ошибок. Технический результат заключается в расширении коммуникативной функции языка общения людей с дефектами слуха и речи с говорящим и слышащим человеком за счет увеличения объема передаваемой информации.

Управление поставщиками данных для диалога // 2690199

Изобретение относится к способу, системе и машиночитаемому носителю информации для ведения диалога для пользовательского устройства. Технический результат заключается в повышении достоверности предоставляемых ответов от поставщиков данных при ведении диалога.

Распознавание смешанной речи // 2686589

Изобретение относится к средствам для распознавания смешанной речи. Технический результат заключается в повышении точности распознавания смешанной речи.

Способ определения истинности речевой информации // 2679217

Изобретение относится к области электросвязи, когнитивной психологии и психофизиологии и может быть использовано для определения истинности речевой информации, циркулирующей в инфокоммуникационных системах.

Устройство и способ повышения безопасности терминала // 2676947

Изобретение относится к области безопасности для терминалов. Техническим результатом является повышение безопасности терминала.

Диалоговые политики на основе параметров окружающей среды и генерация ответа // 2667717

Изобретение относится к переговорной диалоговой системе. Техническим результатом является расширение арсенала технических средств.

Способ диалога между машиной, такой как гуманоидный робот, и собеседником-человеком, компьютерный программный продукт и гуманоидный робот для осуществления такого способа // 2653283

Изобретение относится к способу диалога между машиной и человеческим существом. Технический результат заключается в обеспечении более естественного диалога с машиной, адаптированного к собеседнику (не стереотипного).

Алгоритм поиска в компьютерных системах и базах данных // 2648572

Изобретение относится к средствам для поиска в компьютерных системах и базах данных. Технический результат заключается в обеспечении возможности подбора музыкальной и текстовой информации друг к другу на основании их ритмических свойств.

Система контроля и управления доступом на базе биометрических технологий аутентификации личности по голосу и по лицу // 2638775

Изобретение относится к области идентификации и аутентификации личности. Техническим результатом является регистрация и идентификация людей в самых различных ситуациях, когда необходимо производить обязательную регистрацию и предоставление данных о людях, а также их идентификацию, автоматическую регистрацию лиц по фото, через мобильные устройства (сотовый телефон, коммуникатор, планшетный компьютер), автоматическую регистрацию голосов людей с использованием телефонного канала или микрофона, распознавание лиц или голосов в режиме реального времени.

Моделирование контекста сеанса для систем понимания разговорной речи // 2693184

Изобретение относится к области вычислительной техники для распознавания речи пользователя. Технический результат заключается в повышении точности формирования персонализированной для пользователя модели языка.

Способ и система для синтеза речи из текста // 2692051

Изобретение относится к вычислительной технике. Технический результат – создание машинных высказываний без видимой для пользователя задержки.

Распознавание смешанной речи // 2686589

Способ автоматического перевода устной речи с одного языка на другой и устройство для его реализации // 2641222

Изобретение относится к области электроники, в частности к электронным устройствам для организации общения между людьми, говорящими на разных языках. Технический результат заключается в повышении точности и скорости перевода устной речи с одного языка на другой.

Способ и сервер для синтеза речи по тексту // 2632424

Изобретение относится к средствам синтеза речи по тексту. Технический результат заключается в повышении естественности человеческого голоса в синтезированной речи.

Детектирование автоответчика путем распознавания речи // 2439716

Изобретение относится к способам и устройствам детектирования автоответчика, используемым для определения того, является ли получатель вызова реальной персоной или автоответчиком.

Способ организации синхронного перевода устной речи с одного языка на другой посредством электронной приемопередающей системы // 2419142

Изобретение относится к области электроники, в частности к переводу фраз с первого языка на второй. .

Способ распознавания слов речи // 2296376

Изобретение относится к области анализа и распознавания речевых сигналов. .

Способ распознавания фонем речи и устройство для реализации способа // 2268504

Изобретение относится к области анализа и распознавания речевых сигналов и касается способа распознавания фонем речи. .

Система и способ обнаружения несанкционированно подключенных устройств в транспортном средстве // 2704720

Изобретение относится к системе и способу обнаружения несанкционированно подключенных устройств в транспортном средстве. Технический результат заключается в повышении точности обнаружения несанкционированно подключенных устройств.