Способ идентификации говорящего

 

Изобретение касается анализа речевых сигналов и автоматического распознавания образов и может быть использовано для автоматизации контрольно-пропускных пунктов и разработки голосовых клкмей ; Применение способа повышает надежность идентификации личности и обеспечение устойчивости система к попыткам имитации голоса. Способ заключается в сравнении временной последовательности комплекса параметров речевого сигнала с индивидуальными для диктора эталонами.

СОЮЗ СОВЕТСНИХ

СОЦИАЛИСТИЧЕСНИХ

РЕаЪБЛИН (51) 4 G 10 L 9 06

ОПИСАНИЕ ИЗОБРЕТЕНИЯ

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ

ГОСУДАРСТВЕННЫЙ НОМИТЕТ

ПО ИЗОБРЕТЕНИЯМ И OTHPblTHSIM

ПРИ ГННТ СССР (21) 4082720/24-10 (22) 05.05.86 (46) 23.01.89. Бюл.. В 3 (71) Институт систем управления

АН ГССР (72) Г.С. Рамишвили, P.P. Саакян и М.А. Тушишвили (53) 534.782 (088.8) (56) Авторское свидетельство СССР

У 1117687, кл. G 10 Ь 9/06, 1983.

Заявка Японии У 56-80100» кл. 6 10 ?. 9/06, 1981. (54) СПОСОБ ИДЕНТИФИКАЦНИ ГОВОРЯ- .

ЩЕГО

„„SU„„3453442 А1 (57) Изобретение касается анализа речевых сигналов и автоматического распознавания образов и может быть использовано для автоматизации контрольно-пропускных пунктов и разработки "голосовых ключей"; Применение способа повышает надежность. идентификации личности и обеспечение у©тойчивости система к попыткам имитации голоса. Способ заключается в сра» внении временной последовательности комплекса параметров речевого сигнала с индивидуальными для диктора эталонами.

145 3442

Изобретение относится к анализу речевых сигналов и автоматическому распознаванию образов и может быть использовано для автоматизации контрольно-пропускных пунктов (КПП) учреждений и разработки "голосовых

ll ключей, обеспечивающих санкционированный доступ определенных лиц к банкам или механизмам специального назначения на основе предъявления этими лицами в качестве свидетельст ва о личности своей речи.

Целью изобретения является повышение надежности. идентификации говорящего путем анализа наиболее инфор,мативных с точки зрения различения

; голосов гласных фонем, выделяемых

;лишь по признаку наибольшей интенсив ности и звонкости звука.

Способ свободен от необходимости осуществления сложных процедур нели"

: нейной нормализации продолжительнос ти звучания фразы. Действительно, простая по своей природе операция 25 не вносит больших интраиндивидуальных вариаций при различных произнесениях одного и того же диктора, и в то же время может обеспечить сущест,венный вклад при отстранении чужих"

,голосов за счет возможной неидентичной экстракции опорных гласных для разных дикторов даже в случае, если мистификатору известна парольная фраза.

На фиг. 1 показан пример устройства, .реализующего способ; на фиг. 2 — вре -. менные диаграммы, иллюстрирующие способ идентификации.

Устройство содержит кнопку 1 запус ка, усилитель 2, выделитель 3 звонких участков еигнала, механический фикса:тор 4 кода для установки числа выде ляемых опорных сегментов, экстрактор 5 интенсивных фонем, а также началь ного и конечного сегментов сигнала, 45 измеритель 6 длительности между опорными сегментами, счетчик-определитель

7 числа экстремальных точек, детектор 8 первой гармоники сигнала, счетчик. 9 числа нулевых точек, формирова- 50 тель 10 матрицы признаков, переключа-, тель 11 режимов обучения и верифиКацни, блок 12 обучения, блок 13 сравнения и блок 14 принятия решения.

Пусть в качестве парольной фразы идентифицируемым лицом выбрана фраЗа: "Мой голос-мой код" (фиг. 2). характер огибающего речевого сигнала, соответствующего этой парольной фразе, приводится на фиг. 2а. Для удобства под иллюстрацией дается буквенная (а не фонематическая) запись парольной фразы.

С произнесением фразы сигнал через усилитель 2 поступает на вьщелитель звонких участков сигнала 3. Этот блок состоит иэ набора узкополосных фильтров с частотным диапазоном 100500 Гц. Ширина полосы пропускания каждого фильтра не больше возможного периода основного тона голоса и составляет примерно 70-80 Гц. Во время произнесения звонких звуков это позволяет определить линейчатость структуры сигнала, так как гармоники сигнала не смогут одновременно попасть во все фильтры. Обратная картина имеет место при произнесении глухих звуков.

Разделение сигнала на звонкие и не звонкие участки сигнала показано на фиг. 2б. Заштрихованная часть диаграммы указывает на звонкий характер сигнала.

Далее с помощью экстрактора 5 из сигнала вьщеляются интенсивные участки на местах ударных гласных звуков, а также в начале и в конце произнесения. Этот блок представляет собой микропроцессор, включающий в себя запоминающее устройство и вычислитель числа (задаваемого заранее с помощью фиксатора 4) энергетически мощных участков сигнала, а также стандартных по длительности участков в начальной и конечной части сигнала, Для случая п = 5 эта операция показана на фиг. 2в.

Далее с помощью блока 6 определяются длительности Т., — T„ между началами выбранных мощных учатсков (опорных сегментов) сигнала, а также длительность времени То от запуска (кнонкой

i) устройства до начала произнесения. Эти параметры показаны на фиг.2г.

Счетчик 7 определяет число экстремумов речевого сигнала за стандартный период выбранных опорных сегментов (фиг. 2д), счетчик 9 — число нулевых точек после детектирования блоком 7 (этот блок представляет собой низкочастотный фильтр с крутизной спада 18 дБ/окт., начиная с 200 Гц) первой гармоники сигнала (фиг. 2е).

Эти последние параметры используют в дальнейшем для вычисления значения

1453442

Nu/N„, где N — число нулевых точек первой гармоники сигнала в начальном о опорном сегменте; N „- в конечном опорном сегменте.

Формирователь 10 признаков (мат5 рицы) представляет собой буферное запоминающее устройство, куда поступают перечисленные данные из блока б и счетчиков 7 и 9: ТО-Т„, N И и о о

Ин/N „.

Необходимо отметить,,что. число столбцов матрицы для разных случаев задания будет разным и, таким образом, оно также, как и другие призна- 15 ки индивидуальности голоса, участвует в правильной верификации диктора.

В режиме обучения, т.е. в режиме запоминания голосовых и произносительных характеристик идентифицируемого лица, переключатель 11 находится в правом положении. В этом случае все данные из формирователя 10 мат" рицы передаются в блок 12, который представляет собой долговременное 25 запоминающее устройство (ДЗУ).

В режиме идентификации (переключатель 11 находится в левом положении) данные анализа контрольной фразы из блока 10 формирования признаков по- 0 даются уже на блок 13, который производит сопоставление и сравнение этих данных с данными обучения из блока 12.

В результате формируется разностный сигнал а между сравниваемыми матрица35 ми, который подается на блок 14 принятия решения. В этом блоке, также представляющем сравнивающее устройство, происходит сопоставление d c некоторым заранее установленным поро- 4 гом 8 . При Д 8 происходит отстранение лица, произносящего испытательную фразу, при д (О диктор квалифици- . руется как личность, на которую настроен верификатор.

Таким образом, сущность способа соссостоит в том, что преобразованный из парольной фразы речевой сигнал усиливают, выделяют из него звонкие участки, из которых выделяют заранее выбранное число сегментов одинаковой длительности на местах интенсивных гласных звуков и в начале и в конце парольной фразы, определяют временные интервалы между сегментами, определяют выдержку времени до начала произнесения парольной фразы, подсчитывают число экстремальных точек в каждом из выделенных сегментов,определяют отношение числа нулей, подсчитанных на первой гармонике сигнала в начальном и конечном сегментах,и сравнивают полученный комплекс параметров с индивидуальными для диктора эталонами. При этом из звонких участков на местах интенсивных гласных звуков и в начале и в конце парольной фразы выделяют заранее выбранное число сегментов одинаковой длительности; определяют временные интервалы между этими сегментами; определяют выдержку времени до начала произнесения парольной фразы; подсчитывают число экстремальных точек в каждом иэ выделенных сегментов; определяют отношение числа нулей, подсчитанных по первой гармонике сигнала в начальном и конечном сегментах.

Формула изобретения

Способ идентификации говорящего путем произнесения им парольной фразы, выделения временных параметров

1 этой фразы и порогового сравнения с эталонными параметрами, о т л и ч аю щ ий с я тем, что, с целью повышения надежности идентификации, параметры произнесения контрольной фразы устанавливают индивидуально по трудно имитируемьм неконтролируе мым на слух особенностям речевогоповедения говорящего, при этом параметры для идентификации выбирают as совокупности временных интервалов между заранее выбранными наиболее ин-. тенсивными сегментами одинаковой длительности на звонких участках и в начале и конце парольной фразы, определяют выдержку времени до начала произнесения парольной фразы,. опре" деляют интервалы между переходами через нуль речевых колебаний, соответствующих этим сегментам, и определяют соотношение фильтрованных в частотной области первой гармоники сигнала числа нулей в начальной и конечном сегментах.

1453442

I

Составитель В. Махонин

Редактор С. Патрушева Техред М.Дидык

Корректор А. Ворович

Производственно-полиграфическое предприятие, r. Ужгород, ул. Проектная, 4

Заказ 7289/48 Тираж 343 Подписное

ВНИИПИ Государственного комитета по изобретениям и открытиям при ГКНТ СГС

113035, Москва, Ж-35, Раушская наб., д. 4/5

Способ идентификации говорящего Способ идентификации говорящего Способ идентификации говорящего Способ идентификации говорящего 

 

Похожие патенты:

Изобретение относится к системам распознавания речи

Изобретение относится к обработке информации и может быть использовано в телекоммуникационных системах

Изобретение относится к области техники анализа речи, в частности к системам ограничения несанкционированного доступа к материальным или информационным ресурсам на основе биометрической информации о говорящем

Изобретение относится к области автоматического распознавания человека по его голосовым характеристикам и может быть использовано для ограничения и разграничения доступа (в том числе удаленного) к устройствам и системам, к средствам электронно-вычислительной техники, к конфиденциальной информации, к услугам (например, телекоммуникационным, информационным, банковским), а также к охраняемым зонам и помещениям

Изобретение относится к системам распознавания человека, в частности к системам идентификации личности по голосу, и предназначено для использования в охранных и противоугонных системах для транспортных средств (ТС)

Изобретение относится к системам биометрии человека по индивидуальным характеристикам его голоса к санкционированному доступу, например, к операционной системе, компьютерным ресурсам, банковскому счету или физическому доступу к помещению и к случаям, требующим санкционированного доступа

Изобретение относится к идентификации вызывающего абонента

Изобретение относится к системам установления или подтверждения личности говорящего
Наверх