Способ верификации диктора

Авторы патента:

G10L17 - Установление или подтверждение личности говорящего

Изобретение относится к области автоматического распознавания образов на основе анализа речевых сигналов и может быть использовано для автоматизации контрольно-пропускных пунктов и разработки голосовых ключей, обеспечивающих санкционированный доступ определенных лиц к банкам данных. Способ упрощает процесс верификации и повышает ее быстродействие при сохранении надежности. Способ заключается в произнесении диктором контрольной фразы, содержащей последовательность глухих и однофонемных звонких участков, выделении звонких участков и их фильтрации в полосах частот основного тона голоса и третьей и четвертой формант, определении последовательности значений плотностей нулевых пересечений сигналов в отфильтрованных частотных полосах и пороговом сравнении параметров выделенных признаков с эталонными самостоятельно в пределах каждого выделенного участка от его начала. 2 ил.

СОЮЗ СОВЕТСКИХ

СОЦИАЛИСТИЧЕСКИХ

РЕСПУБЛИК (st)s G 10 1 9/06

ГОСУДАРСТВЕННЫЙ КОМИТЕТ

ПО ИЗОБРЕТЕНИЯМ к1 ОТКРЫТИЯМ

ПРИ ГКНТ СССР

ОПИСАНИЕ ИЗОБРЕТЕНИЯ

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ (21) 4740098/10 (22) 25.06.89 (46) 07.09.91. Бюл, bh 33 (71) Институт систем управления АН ГССР (72) Г. С. Рамишвили (53) 681.32(088,8) (56) Авторское свидетельство СССР

М 898496, кл, G 10 9/06, 1984.

Розенберг А. Автоматическая верификация диктора. Обзор, Тематический выпуск

"Речевая связь с машиной". ТИИЭР, 1976, т.

64, %4. (54) СПОСОБ ВЕРИФИКАЦИИ ДИКТОРА (57) Изобретение относится к области автоматического распознавания образов на основе анализа речевых сигналов и может быть использовано для автоматизации контрольно-пропускных пунктов и разработки

Изобретение относится к автоматическому распознаванию образов на основе анализа речевых сигналов и может быть использовано для автоматизации контрольно-пропускных пунктов (КПП) учреждений и разработки "голосовых ключей", обеспечивающих санкционированный доступ определенных лиц к банкам данных или механизмам специального назначения на основе предъявления этими лицами свидетельства о личности своей речи.

Целью изобретения является упрощение процесса верификации и повышение ее быстродействия при сохранении высокого уровня надежности верификации.

На фиг. 1 на конкретном примере контрольной фазы (слова) дается временная диаграмма анализа акустического матери„„5U„„1675936 А1

"голосовых ключей", обеспечивающих санкционированный доступ определенных лиц к банкам данных. Способ упрощает процесс верификации и повышает ее быстродействие при сохранении надежности.

Способ заключается в произнесении диктором контрольной фразы, содержащей последовательность глухих и однофонемных звонких участков, выделении звонких участков и их фильтрации в полосах частот основного тона голоса и третьей и четвертой формант, определении последовательности значений плотностей нулевых пересечений сигналов в отфильтрованных частотных полосах и пороговом сравнении параметров выделенных признаков с эталонными самостоятельно в пределах каждого выделенного участка от его начала. 2 ил, ала; фиг, 2 вЂ” приведена блок-схема устройства, реализующего способ.

Способ поясняется на конкретном примере анализа контрольной фразы {слова)

"афиша" (фиг, 1).

На фиг. 1 а приведена осцилограмма речевого сигнала; на фиг,.1 б вЂ” вид речевого сигнала, который сегментирован Ао признаку звонкость-глухость.

В пределах выделенных звонких участков, начало и конец которых определяют управляющие импульсы (фиг. 1в), в моменты времени, соответствующие тактовым импульсам (фиг. 1г), дискретно определяют значения плотностей нулевых пересечений сигналов, соответствующих выделенным участкам речевого отрезка в отфильтрованных частотных полосах основного тона голосар> (фиг. 1д), третьей р1 и четвертой pz

1675936

55 формант (фиг. 1е и ж, соответственно). Эти признаки характеризуют индивидуальную манеру произнесения говорящего, а также тональные и тембральные особенности его голоса. По дискретным значениям признаков р0(+),р1(+), ир (+) формируют матрицу данных (фиг. 1з). Матрица данных содержит подматрицы, которые сравнивают с соответствующими эталонными подматрицами раздельно, . 4исло строк всех трех подматриц (в указанном примере) равно трем, число столбцов в первой подматрице равно четырем, во второй вЂ” шести и в третьей вЂ” четырем.

Полученная матрица подлежит сравнению с эталонной в соответствии с заранее выбранным значением порога сравнения 9, Устройство, реализующее способ, (фиг. 2) состоит из усилителя 1, разделителя

2 речевого сигнала на звонкие и глухие участки, низкочастотных фильтров 3 для выделения первой гармоники сигнала и двух полосовых фильтров 4 и 5, выделяющих участки спектра, соответствующее третьей и четвертой формантам. Блоки 6 вЂ” 8 осуществляют выделение признака плотностей нулевых пересечений р,, р1, ищ речевого сигнала, проходящего, соответственно, через фильтры 3-5. Данные об изменении плотностей р нулей во времени записываются в запоминающее устройство вЂ” формирователь 9 матрицы данных в виде дискретных значений в дискр тные моменты времени. Управление записью соответствующих данных в блок 9 осуществляется с помощью блока 10, фиксирующего начало и конец звонких участков сигнала, и блоком

11, генерирующим в этих промежутках времени тактовые импульсы, дискретизирук)щие значения.

Устройство работает в режиме обучения вЂ” правое положение переключателя 12, и верификации вЂ” левое положение переклк>чателя 12.

Данные из блока 9 в режиме обучения передаются в блок 13, который представляет собой запоминающее. устройство, В режиме верификации данные о неизвестном произнесении фиксируются в блоке

14, кОторый является сравнивающим устройством, сопоставляющим данные блоков 13 и 9. Блок 15 принятия решения анализирует результаты сравнения и констатирует факт принадлежности или непринадлежности контрольного произнесения эталонному.

Устройство работает следующим образом.

Речевой сигнал после усиления до величины. необходимой для поддержания работы следующих блоков, подается на разделитель 2, который содержит набор узкополосных фильтров, накрывающих диапазон частот 100-500 Гц, Ширина полосы пропускания каждого фильтра не больше возможной частоты основного тона голоса и составляет примерно 70 вЂ” 80 Гц. Во время произнесения звуков устройство позволяет определять линейчатую структуру сигнала и отделять его от сплошного спектра, имеющего место при глухих звуках.

Выделенные блоков 2 звонкие участки речи подаются на три фильтра. Г1ервый из них (3) представляет собой низкочастотный фильтр с крутизной спада 18 дБ/окт, начиная от 200 Гц, Этот фильтр служит для выделения первой гармоники сигнала, Фильтр 4 является полосовым фильтром а области спектра третьей форманты 2200 вЂ” 3200 Гц.

Фильтр 5 также является полосным фильтром в области четвертой форманты спектра

2800-4000 Гц.

Проходящие через указанные фильтры сигналы далее подаются на блоки

6, 7 и 8 (р-метры), формирующие последовательность значений нулевых точек сигнала, р-метры представляют собой простые конденсаторные накопители или интеграторы, выдающие определенные потенциалы в зависимости от числа нулевых точек поступающего на них сигнала в промежутке между двумя тактовыми импульсами, Очевидно, чем выше частота речевого сигнала, проходящего через фильтры 3, 4 и

5, тем больше число нулевых точек и, поэтому, тем выше потенциал на накопителе в пределах двух соседних тактовых импульсов. Измеренные таким образом значения на выходах блоков 6 вЂ” 8 отражают как индивидуальные особенности основного тона голоса и двух высших формант, так и особенность их изменения во времени в дискретные моменты времени, обусловленные тактовыми импульсами. Последовательности этих дискретных значений отражают на выходе блока 6 характер изменения (мелодию) основного тона голоса, на выходах же блоков 7 и 8 характер изменения третьей и четвертой формант речи.

Для формирования матрицы данных дискретные значения всех выделенных признаков (p<,p<, ир ) записывают в запоминающее устройство (блок 9) со строго определенной адресацией. Управление процессом дискретизации значений

pp(t),p1(t), иpz{t) р и запись этих значений

1675936 в ЗУ осуществляет блок 10, фиксирующий начало и конец звонких участков. сигнала и, тем самым. определяющий адрес записи соответствующих данных в 3 и блок 11, представляющий собой генератор так- 5 товых импульсов, служащий для преобразования с частотой 25 Гц аналоговых значений признаков в цифровые в промежутке между управляющими импульсами (блок 10). Сформированная таким образом 10 матрица данных служит основой для характеристики голоса человека. В режимеобучения (правое положение переключателя 12) матрица данных передается в долговременное запоминающее устройство (блок 13) 15 в режиме верификации (левое положение переключателя 12) эти данные передаются в блок 14, где происходит их сравнение с данными блоками 13. Блок 14 фактически является арифметическим устройством, вы- 20 числяющим разницу между двумя матрицами. При этом разность берется раздельно по различным участкам матрицы, соответствующим подматрицам. Каждая подматрица отражает соответствующий звонкий 25 участок произносимого речевого отрезка.

При неравенстве числа подматриц в контрольном произнесении и эталоне на блок

15 принятия решения выдается отрицательный сигнал, указывающий на "чу- 30 жое" произнесение. При равенстве числа подматриц блок принятия решен ия а нал из и рует значение разности матриц и, в зависимости от того, меньше или больше полученное в блоке сравнения аб- 35 солютное значение разности матриц некоторого порога 9, констатирует, что диктор

"свой" или "чужой", соответственно. В качестве порога 0 берут 10-20 суммы всех членов эталонной матрицы. В случае реше- 40 ния "свой" блок 15 выдает на выходе исполнительный импульс.

В случае неравенства числа столбцов контрольной подматрицы и эталонной подматрицы сравнение производят по тем столбцам, которые в обоих подматрицах имеют место ненулевые значения, т. е. сравнение происходит по наикратчайшей (по числу столбцов) матрице (по значимым отличным от нуля столбцам матрицы).

Формула изобретения

Способ верификации диктора, заключающийся в произнесении диктором заранее выбранной контрольной фразы, выделении акустических признаков речевого сигнала, определении их параметров и порогового сравнения параметров выделенных признаков с заранее установленными эталонными значениями, о т л и ч а юшийся тем, что, с целью упрощения и повышения быстродействия путем упрощенного упорядочения сопоставляемых сигналов, обеспечивающего минимизацию ошибок без применения операции нелинейной нормализации сигналов, в качестве контрольной фразыы испол ьзуют речевой отрезок, с последовательностью глухих и однофонемных звонких участков, выбранный речевой отрезок сегментируют на звонкие и глухие участки, определяют последовательность значений плотностей нулевых пересечений сигналов, соответствующих выделенным звонким участкам речевого отрезка в отфильтрованных частотных полосах основного тона голоса и третьей и четвертой формант, а пороговое сравнение параметров выделенных признаков производят самостоятельно в пределах каждого выделенного участка.

1675936

r((Peed(r((г(и(((ел

1 ! !

4гаж(иец е((иде(и- I а и 1 аи а. ! I

1 Ф жди(и((((и .(йе ви((I и щи((,(ееиииии(( реиеию еиен(и.

1 1

1! !

ЮУерю4мищие а((еу(е(э(1

1 !

yrт Ае у (3 вЂ” ) 1- вЂ”

О ) I

Ли(е(и ее (иirr

j ее!РРе @мдPo(ster.ф(((ил(ии((а ди(еюь(е е((вЧЯ(еи+Е1 "

° е(gs4и Jc (ra Ic) "

Pii Pie ° Я(-((У(("ю"

А(Ае" ° Pr rr r»fi(r ra "

Exode

Редактор Н.Гунько

Заказ 3006 Тираж Подписное

ВНИИПИ Государственного комитета по изобретениям и открытиям при ГКНТ СССР

113035, Москва, Ж-35, Раушская наб., 4/5

Производственно-издательский комбинат "Патент", r. Ужгород, ул.Гагарина, 101

3 еУ.

4 > е)Я

6f ((!!Я

Составитель Ю.Алешин

Техред M,Mîpãåíòàë Корректор О,Кундрик

Способ идентификации говорящего // 1453442

Способ идентификации говорящего // 1394233

Способ идентификации говорящего // 1394232

Способ опознания говорящего и устройство для его осуществления // 1117687

Способ опознавания диктора // 898496

Вокодер с подстройкой к говорящему // 711615

Устройство для сегментации,анализа и монтажа сигналов // 532880

Способ идентификации личности по голосу // 518791

Способ определения натуральности звучания и разборчивости речи, передаваемой по телефонному каналу // 110566

Система для верификации говорящего // 2161336

Изобретение относится к системам распознавания речи

Способ автоматической идентификации личности // 2161826

Изобретение относится к обработке информации и может быть использовано в телекоммуникационных системах

Способ и устройство для управления вводами речевой регистрации устройства распознавания речи для использования в микротелефонной трубке и в комплекте громкоговорящей связи // 2187902

Изобретение относится к телефонии

Метод распознавания диктора и устройство для его осуществления // 2230375

Изобретение относится к области техники анализа речи, в частности к системам ограничения несанкционированного доступа к материальным или информационным ресурсам на основе биометрической информации о говорящем

Способ автоматического распознавания человека с использованием акустических сигналов, снимаемых с тела человека // 2263358

Изобретение относится к области автоматического распознавания человека по его голосовым характеристикам и может быть использовано для ограничения и разграничения доступа (в том числе удаленного) к устройствам и системам, к средствам электронно-вычислительной техники, к конфиденциальной информации, к услугам (например, телекоммуникационным, информационным, банковским), а также к охраняемым зонам и помещениям

Способ и система автоматической проверки присутствия лица живого человека в биометрических системах безопасности // 2316051

Изобретение относится к системам безопасности и контроля

Система голосового распознавания пользователя транспортного средства // 2337020

Изобретение относится к системам распознавания человека, в частности к системам идентификации личности по голосу, и предназначено для использования в охранных и противоугонных системах для транспортных средств (ТС)

Способ верификации пользователя в системах санкционирования доступа // 2351023

Изобретение относится к системам биометрии человека по индивидуальным характеристикам его голоса к санкционированному доступу, например, к операционной системе, компьютерным ресурсам, банковскому счету или физическому доступу к помещению и к случаям, требующим санкционированного доступа

Усовершенствованная идентификация вызывающего абонента на основе распознавания речи // 2383938

Изобретение относится к идентификации вызывающего абонента

Способ и устройство автоматической верификации личности по голосу // 2399102

Изобретение относится к системам установления или подтверждения личности говорящего