Устройство автоматической верификации личности по голосу



Устройство автоматической верификации личности по голосу
Устройство автоматической верификации личности по голосу
Устройство автоматической верификации личности по голосу
Устройство автоматической верификации личности по голосу

Владельцы патента RU 2704723:

Федеральное государственное казенное военное образовательное учреждение высшего образования "Военный учебно-научный центр Военно-морского Флота "Военно-морская академия имени адмирала флота Советского Союза Н.Г. Кузнецова" (RU)

Изобретение относится к области вычислительной техники для распознавания голоса. Технический результат заключается в повышении точности распознавания голоса для идентификации личности. Технический результат достигается за счет устройства автоматической верификации личности по голосу, содержащего микрофон, АЦП, два коммутатора, блок расчета параметров речевого сигнала, блок сравнения параметров речевых сигналов, блок принятия решения верификации, блок вычисления эталона микрофона, блок запоминания эталона диктора, блок запоминания эталона микрофона, N блоков запоминания эталонов эквивалентов микрофонов, включенных параллельно блоку запоминания эталона микрофона, коммутатор входных цепей блоков запоминания эталонов микрофонов и коммутатор их выходных цепей, при этом вход коммутатора входных цепей соединен с выходом блока запоминания эталона микрофона, а выход коммутатора выходных цепей соединен с входом блока расчета параметров речевого сигнала. 3 ил.

 

Изобретение относится к системам установления или подтверждения личности говорящего. Техническим результатом является расширение функциональных возможностей устройства.

Известны различные устройства верификации (подтверждения) личности по голосу. Например, Метод распознавания диктора и устройство для его осуществления, Патент РФ №2230375 от 20.05.2012, Способ и устройство автоматической верификации личности по голосу, Патент РФ №2399102 от 10.09.2010.

Наиболее близким по технической сущности является последнее из названных выше изобретений - Патент РФ №2399102.

Недостатком известного устройства является ограничение анализа акустического сигнала диктора, находящегося перед микрофоном. В то же время для практики представляет интерес верификация личности по голосу диктора, который поступает по каналу проводной связи либо по радиоканалу и на микрофон устройства верификации поступает акустический сигнал от динамика приемного устройства канала связи.

Ожидаемым техническим результатом является расширение возможности устройства автоматического подтверждение личности по голосу при поступлении акустического сигнала на микрофон устройства по каналу связи. Под каналом связи здесь понимается микрофон передатчика высокочастотного сигнала, эфир либо фидерная линия, приемник высокочастотного сигнала, динамик приемника. Поставленная задача решается тем, что в устройство автоматической верификации личности по голосу, содержащее источник речевого сигнала (микрофон и аналого-цифровой преобразователь), соединенный с входом первого коммутатора, один из выходов которого подключен к первому входу блока расчета параметров речевого сигнала, а другой выход первого коммутатора подключен к входу блока вычисления эталона микрофона, выход которого соединен с входом второго коммутатора, первый выход которого подключен к первому входу блока сравнения параметров эталона и входного речевого сигнала, выход которого соединен с входом блока принятия решения о распознаваемом дикторе, выход которого является выходом устройства в целом, а второй выход второго коммутатора соединен с входом блока запоминания эталонов дикторов, выход которого соединен со вторым входом блока выбора эталона диктора, первый вход которого соединен с блоком ввода верификационного признака диктора, а выход блока выбора эталона диктора подключен ко второму входу блока сравнения параметров эталона и входного речевого сигнала, при этом блок расчета параметров речевого сигнала содержит выделитель начало/окончания речевого сигнала и блок формирования параметров входного речевого сигнала, а блок вычисления эталона микрофона содержит блок оценки начала/окончания речевого сигнала, блок вычисления среднего значения спектральной плотности мощности речевого сигнала, блок деления на этот эталон среднего значения спектральной плотности мощности речевого сигнала, при этом блок расчета параметров входного речевого сигнала содержит блок вычисления коэффициентов корреляции речевого сигнала, соединенный с блоком расчета оценки частоты основного тона, первый выход которого соединен с первым входом блока формирования параметров входного речевого сигнала, а второй выход подключен ко входу блока расчета оценок амплитуд несущих гармоник, выход которого соединен с первым входом блока деления амплитуд несущих частот на эталон амплитудно-частотной характеристики используемого микрофона, выход которого подключен ко второму входу блока формирования параметров входного речевого сигнала, при этом блок запоминания эталона микрофона подключен ко второму входу блока деления амплитуд несущих гармоник на эталон амплитудно-частотной характеристики используемого микрофона, а блок вычисления эталона микрофона содержит блок вычисления коэффициентов корреляции речевого сигнала, причем блок оценки начало/окончания речевого сигнала, блок вычисления коэффициентов корреляции речевого сигнала и блок вычисления среднего значения спектральной плотности мощности речевого сигнала соединены последовательно, выход блока вычисления среднего значения спектральной плотности мощности соединен с первым ходом блока деления на эталон среднего значения спектральной плотности мощности речевого сигнала, а второй вход блока деления соединен с выходом блока запоминания эталона среднего значения спектральной плотности мощности речевого сигнала, выход блока деления сигнала соединен со входом блока запоминания эталона микрофона, а блок сравнения параметров эталона и входного речевого сигнала выполнен с возможностью вычисления взвешенной Евклидовой невязки параметров входного речевого сигнала и эталона, отличающееся тем, что дополнительно параллельно блоку запоминания эталона микрофона включены N блоков запоминания эталонов эквивалентов микрофонов, коммутатор входных цепей блоков запоминания эталонов микрофонов и коммутатор их выходных цепей, при этом вход коммутатора входных цепей соединен с выходом блока запоминания эталона микрофона, а выход коммутатора выходных, цепей соединен с входом блока расчета параметров речевого сигнала.

Блок-схема устройства автоматической верификации личности по голосу представлена на Фиг. 1.

На Фиг. 2 приведена блок-схема расчета параметров речевого сигнала.

На Фиг. 3 приведена блок-схема определения эталона амплитудно-частотных характеристик (АЧХ) используемого микрофона.

Перечень позиций.

1 - микрофон (М);

2 - аналого-цифровой преобразователь (АЦП);

3 - коммутатор (низ - верификация или обучение, верх - настройка технических параметров);

4 - блок расчета параметров речевого сигнала (БПРС);

5 - блок сравнения параметров речевых сигналов (БСПРС);

6 - блок принятия решения верификации (БПРВ);

7 - блок запоминания эталона микрофона (БЗЭМ);

8 - блок вычисления эталона микрофона (БВЭМ);

9 - коммутатор (верх - верификация, низ - обучение);

10 - блок запоминания эталонов дикторов (БЗЭД);

11 - блок ввода верификационного признака диктора (БВВПД);

12 - блок выбора эталона диктора (БВЭД);

13 - блок оценки начала/окончания речевого сигнала (БОНОРС);

14 - блок вычисления коэффициентов корреляции речевого сигнала (БВККРС);

15 - блок расчета оценки частоты основного тона (БРОЧОТ);

16 - блок расчета оценок амплитуд несущих гармоник (БРОАНГ);

17 - блок деления амплитуд несущих гармоник на эталон амплитудно-частотной характеристики используемого микрофона (БДАНГМ);

18 - блок формирования параметров речевого сигнала (БФПРС);

19 - блок оценки начала/окончания речевого сигнала (БОНОРС);

20 - блок вычисления коэффициентов корреляции речевого сигнала (БВККРС);

21 - блок вычисления среднего значения спектральной плотности мощности (БВСЗСПМ);

22 - блок деления (БД);

23 - эталон амплитудно-частотной характеристики микрофона;

24 - эталон среднего значения спектральной плотности мощности речевого сигнала (ЭСЗСПМРС).

Работа устройства осуществляется в 2-х режимах: в режиме обучения и режиме верификации.

В режиме обучения речевой сигнал голосовых паролей, произносимых заранее известными дикторами, подают на вход микрофона 1 или выхода канала связи канала связи через АЦП 2 и коммутатор 3 на вход БРПРС 4. Коммутатор 3 переключает устройство в режим верификации или обучения (нижняя позиция на блоке 3 фиг. 1) или в режим настройки технических параметров (верхняя позиция на блоке 3 фиг. 1). В качестве голосовых паролей используют отдельные слова. Из речевого сигнала произнесенных паролей в БРПРС 4 формируют параметры речевых эталонов. При этом коммутатор 9 замыкает вход на второй (нижний на блоке 9 на фиг. 1) На каждое произнесение каждого голосового пароля каждого известного диктора запоминают свой эталон. Число заранее известных дикторов может быть любым: от одного и более. Число использованных голосов паролей также может быть любым, большим единицы.

Сохраненные эталоны используют для сравнения с входным речевым сигналом верифицируемого диктора. Выбор эталонов для верификации заявляемого диктора производят блоком БВЭД 12. В режиме верификации неизвестный диктор через блок БВВПД 11 вводит верификационный признак того диктора, тождество с которым он хочет подтвердить своим голосовым паролем. Далее блок БВЭД 12 выбирает для сравнения эталон того диктора, тождество с которым заявил верифицируемый диктор.

В этой части (осуществления верификации личности по голосу) заявляемое устройство полностью совпадает по составу блоков и их функционирования с устройством прототипа.

В отличие от прототипа, в котором вычисляется нормированное значение АЧХ используемого микрофона, при использовании канала связи акустический сигнал на микрофон заявляемого устройства поступает от динамика приемника канала связи. В этом случае нормирование АЧХ микрофона заявляемого устройства производится по тестовому сигналу (сигналу с равными амплитудами гармоник акустического сигнала от модуля тестирования микрофонов, например Euraudio PRO 600S), прошедшему по каналу связи изменившего тестовый сигнал в соответствии с реальной АЧХ канала связи, и далее прошедшему через микрофон заявляемого устройства, еще раз изменившего тестовый сигнал в соответствии с АЧХ микрофона заявляемого устройства. Следовательно, этот сигнал будет содержать информацию о совокупной АЧХ конкретного канала связи и микрофона устройства верификации. Совокупное значение АЧХ конкретного канала связи будет учтено заявляемым устройством как характеристика некоторого эквивалента микрофона устройства верификации, обладающего совокупной АЧХ, и будет внесена в память БЗЭМ 7. Поскольку принципиально возможно использование нескольких каналов связи, то целесообразно иметь несколько блоков БЗЭМ для реализации верификации голосов дикторов в различных каналах связи. При наличии нескольких N блоков БЗЭМ необходимо введение в устройство верификации входного и выходного коммутаторов для переключения блоков БЗЭМ при смене каналов связи. При использовании нескольких БЗЭМ функционирование всех блоков заявляемого устройства, включая и блоки БЗЭМ, принципиально не изменяется и полностью соответствует функционированию блоков устройства прототипа. Различие заявляемого устройства от устройства прототипа заключается только в увеличении числа блоков БЗЭМ и коммутаторов на их входах и выходах.

Таким образом, за счет введения дополнительных БЗЭМ, учитывающих АЧХ канала связи при тестировании микрофона устройства верификации, и коммутаторов переключения этих блоков, решается поставленная цель - расширение возможности известного устройства автоматической верификации личности по голосу диктора в части увеличения числа каналов верификация личности по голосу.

Устройство автоматической верификации личности по голосу, содержащее источник речевого сигнала (микрофон и аналого-цифровой преобразователь), соединенный с входом первого коммутатора, один из выходов которого подключен к первому входу блока расчета параметров речевого сигнала, а другой выход первого коммутатора подключен к входу блока вычисления эталона микрофона, выход которого соединен с входом второго коммутатора, первый выход которого подключен к первому входу блока сравнения параметров эталона и входного речевого сигнала, выход которого соединен с входом блока принятия решения о распознаваемом дикторе, выход которого является выходом устройства в целом, а второй выход второго коммутатора соединен с входом блока запоминания эталонов дикторов, выход которого соединен со вторым входом блока выбора эталона диктора, первый вход которого соединен с блоком ввода верификационного признака диктора, а выход блока выбора эталона диктора подключен ко второму входу блока сравнения параметров эталона и входного речевого сигнала, при этом блок расчета параметров речевого сигнала содержит выделитель начало/окончания речевого сигнала и блок формирования параметров входного речевого сигнала, а блок вычисления эталона микрофона содержит блок оценки начала/окончания речевого сигнала, блок вычисления среднего значения спектральной плотности мощности речевого сигнала, блок деления на этот эталон среднего значения спектральной плотности мощности речевого сигнала, при этом блок расчета параметров входного речевого сигнала содержит блок вычисления коэффициентов корреляции речевого сигнала, соединенный с блоком расчета оценки частоты основного тона, первый выход которого соединен с первым входом блока формирования параметров входного речевого сигнала, а второй выход подключен ко входу блока расчета оценок амплитуд несущих гармоник, выход которого соединен с первым входом блока деления амплитуд несущих частот на эталон амплитудно-частотной характеристики используемого микрофона, выход которого подключен ко второму входу блока формирования параметров входного речевого сигнала, при этом блок запоминания эталона микрофона подключен ко второму входу блока деления амплитуд несущих гармоник на эталон амплитудно-частотной характеристики используемого микрофона, а блок вычисления эталона микрофона содержит блок вычисления коэффициентов корреляции речевого сигнала, причем блок оценки начало/окончания речевого сигнала, блок вычисления коэффициентов корреляции речевого сигнала и блок вычисления среднего значения спектральной плотности мощности речевого сигнала соединены последовательно, выход блока вычисления среднего значения спектральной плотности мощности соединен с первым ходом блока деления на эталон среднего значения спектральной плотности мощности речевого сигнала, а второй вход блока деления соединен с выходом блока запоминания эталона среднего значения спектральной плотности мощности речевого сигнала, выход блока деления сигнала соединен со входом блока запоминания эталона микрофона, а блок сравнения параметров эталона и входного речевого сигнала выполнен с возможностью вычисления взвешенной Евклидовой невязки параметров входного речевого сигнала и эталона, отличающееся тем, что дополнительно параллельно блоку запоминания эталона микрофона включены N блоков запоминания эталонов эквивалентов микрофонов, коммутатор входных цепей блоков запоминания эталонов микрофонов и коммутатор их выходных цепей, при этом вход коммутатора входных цепей соединен с выходом блока запоминания эталона микрофона, а выход коммутатора выходных цепей соединен с входом блока расчета параметров речевого сигнала.



 

Похожие патенты:

Изобретение относится к верификации говорящего. Технический результат – обеспечение точной верификации подлинности говорящих, которые говорят на разных языках или диалектах.

Изобретение относится к области вычислительной техники для обработки и передачи данных с корректировкой орфографических ошибок. Технический результат заключается в расширении коммуникативной функции языка общения людей с дефектами слуха и речи с говорящим и слышащим человеком за счет увеличения объема передаваемой информации.

Изобретение относится к способу, системе и машиночитаемому носителю информации для ведения диалога для пользовательского устройства. Технический результат заключается в повышении достоверности предоставляемых ответов от поставщиков данных при ведении диалога.

Изобретение относится к средствам для распознавания смешанной речи. Технический результат заключается в повышении точности распознавания смешанной речи.

Изобретение относится к области электросвязи, когнитивной психологии и психофизиологии и может быть использовано для определения истинности речевой информации, циркулирующей в инфокоммуникационных системах.

Изобретение относится к области безопасности для терминалов. Техническим результатом является повышение безопасности терминала.

Изобретение относится к переговорной диалоговой системе. Техническим результатом является расширение арсенала технических средств.

Изобретение относится к способу диалога между машиной и человеческим существом. Технический результат заключается в обеспечении более естественного диалога с машиной, адаптированного к собеседнику (не стереотипного).

Изобретение относится к средствам для поиска в компьютерных системах и базах данных. Технический результат заключается в обеспечении возможности подбора музыкальной и текстовой информации друг к другу на основании их ритмических свойств.

Изобретение относится к области идентификации и аутентификации личности. Техническим результатом является регистрация и идентификация людей в самых различных ситуациях, когда необходимо производить обязательную регистрацию и предоставление данных о людях, а также их идентификацию, автоматическую регистрацию лиц по фото, через мобильные устройства (сотовый телефон, коммуникатор, планшетный компьютер), автоматическую регистрацию голосов людей с использованием телефонного канала или микрофона, распознавание лиц или голосов в режиме реального времени.

Изобретение относится к области вычислительной техники для распознавания речи пользователя. Технический результат заключается в повышении точности формирования персонализированной для пользователя модели языка.

Изобретение относится к вычислительной технике. Технический результат – создание машинных высказываний без видимой для пользователя задержки.

Изобретение относится к средствам для распознавания смешанной речи. Технический результат заключается в повышении точности распознавания смешанной речи.

Изобретение относится к средствам для распознавания смешанной речи. Технический результат заключается в повышении точности распознавания смешанной речи.

Изобретение относится к области электроники, в частности к электронным устройствам для организации общения между людьми, говорящими на разных языках. Технический результат заключается в повышении точности и скорости перевода устной речи с одного языка на другой.

Изобретение относится к средствам синтеза речи по тексту. Технический результат заключается в повышении естественности человеческого голоса в синтезированной речи.

Изобретение относится к способам и устройствам детектирования автоответчика, используемым для определения того, является ли получатель вызова реальной персоной или автоответчиком.

Изобретение относится к области электроники, в частности к переводу фраз с первого языка на второй. .

Изобретение относится к области анализа и распознавания речевых сигналов. .

Изобретение относится к области анализа и распознавания речевых сигналов и касается способа распознавания фонем речи. .

Изобретение относится к системе и способу обнаружения несанкционированно подключенных устройств в транспортном средстве. Технический результат заключается в повышении точности обнаружения несанкционированно подключенных устройств.
Наверх