Способ возбуждения синтезаторов речи
Союз Советсиик
Социалистических
Республик
ОЛ ИСАНИЕ
ИЗОБРЕТЕН ИЯ
К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ
G 10 L 1/10 9мударетвекаЫ1 кюиатвт СССР ю делан изобретений и аткрнтий Опубликовано 15.10.82. Бюллетень М 38 (53) УДК 621. ° 391 ° 19 (088.8) Дата опубликовании описания 18 . 10 .82 (72) Автори изобретения В.Н. Сорокин и Е.В. Власов 1 -:, "ЕЬР Институт проблем передачи информации (71) Заявитель (54) СПОСОБ ВОЗБУЖДЕНИЯ СИНТЕЗАТОРОВ .РЕЧИ га Изобретение относится к автоматическому синтезу речи, а именно к ме. . тодам возбуждения синтезаторов речи источником голосовых импульсов, и -может быть использовано в системах вывода информации в речевой форме и в системах синтетической телефонии. Характеристики источника голосовых импульсов, как известно, оказывают решающее влияние на натуральность звучания синтезированного речевого сигнала. До настоящего времени способы и устройства голосового возбуждения синтезаторов речи опирались, главным образом, на исследования поведения воздушного потока, протекающего через голосовую щель и модулируемого колебаниями голосовых связок. Этот источник называется источником объемной скорости. Известен источник объемной скорости,(1 1, представляющий собой модель голосовых связок, рассматриваемых как система с сосредоточенными 2 параметрами, причем автоколебания связок возникают за счет эффекта Бернулли, создаваемого движущимся потоком воздуха. Детальные исследования движений голосовых связок показали, что они совершают изгибные колебания во всех трех измерениях: вдоль голо-. совой щели, поперек голосовой щели во фронтальной плоскости и вдоль оси голосового тракта. Колебания голосо-, вых связок во фронтальной плоскости. проявляются, в основном, в разности фаз движения верхней и нижней кромок связок. Этот эффект положен в основу так называемой двухмассовой модели голосового источника. Р Известна двухмассовая модель голосового источника, в которой голосовые связки определены в виде двух сосредоточенных масс, связанных друг с другом и жесткими стенками через упругие и деформирующие элементы. Выбирая определенные соотношения этих масс и 966725 1 верх. Непосредственные измерения верикальных движений связок показывают, то на интервале открытой голосовой ели они однозначно связаны с амплитуой горизонтальных движений связок, этот факт может быть использован ля упрощения вычислений. Когда связки сомкнуты, подъем верхней поверхности происходит в результате того, что после соударения связок движение, частиц их массы по инерции продолжается, но поскольку их горизонтальное движение ограничено, то происходит растекание смещений, главным образом, в вертикальном наI правлении. Кроме того, несовпадение вертикальных координат центров тяжести связок и точки приложения равнодействующих сил при соударении приводит к возникновению вращающего мо.мента и дополнительному подъему верхних кромок связок. Акустические следствия вертикальных смещений верхней поверхности голосовых связок можно продемонстрировать, рассмотрев волновое уравнение и его граничные условия. Обозначив через W(t) объемную скорость воздушного потока через голосовую щель и через H(t) - вертикальное смещение верхней поверхности голосовых связок, считая, что все точки этой .поверхности совершают синфазное движние, тогда для волнового уравнения относительно акустического давления 1 д (й ) 1др 0 (1) S dx dx c dt граничные условия на голосовых связках есть сН4 Р сРН вЂ” К- - — 7 (2) dx(x=O S0 dt o где х - криволинейная кордината вдоль оси голосового тракта (х = 0 на верхней. кромке голосовых связок); - время; р -. акустическое давление; S - площадь поперечного сечения голосового тракта; с - скорость звука в воздухе;. о - плотность воздуха; 0 S0 - площадь голосового тракта непосредственно у связок; - длина голосовых связок; К . - некоторый коэффициент. Неоднородные граничные условия (2) сводятся к однородным путем перехода к новой искомой переменной р, что приводит к, появлению возбуждающей сижесткости упругих элементов, добиваются сдвига колебаний масс (2). т Однако данная модель характеризуется неправдоподобностью параметров щ по сравнению с данными о геометрии и д характеристиках голосовых связок, а также недостаточной натуральностью д звучания синтезированной речи, проявI ляющейся в "машиноподобном" тембре. Наиболее близкой к предлагаемой 1в является модель трехмерных упругих колебаний голосовых связок (3 J, Однако в известной модели не выявлена роль вертикальных смещений голосовых связок в возбуждении акусти- д ческих колебаний в голосовом тракте. Цель изобретения - повышение натуральности синтезированной речи и расширение возможностей в управлении ее тембром. Поставленная цель достигается тем, что для голосового источника возбуждения синтезаторов речи используется модель трехмерных колебаний голосовых связок, причем сигнал голосового д возбуждения формируют как сумму первой и третьей производных от сигнала, пропорционального объемной скорости воздушного потока, протекающего через голосовую щель, и второй и четвертый .Зв производных от сигнала, пропорционального вертикальному смещению верхней поверхности голосовых связок. Источник, возбуждающий акустические колебания в трубе за счет движения верхней поверхности голосовых связок, называется поршневым. На фиг. 1 показаны импульсы объемной скорости воздушного потока через голосовую щель; на фиг. 2 - смещение верхней поверхности голосовых связок; на фиг. 3 - синтезированные речевые сигналы, соответствующие гласному звуку "А". На фиг. 3 обозначено: 1 - только объемный источник возбуждения, 2объемный и поршневой источники. физические причины вертикального движения верхней поверхности голосовых связок различны для интервалов, SO на которых голосовая щель открыта или закрыта. В первом случае подъем крОмки свяэОк прОисхОдит под влиянием избыточного, давления- в легких и в ре- . зультате того, что нижние кромки связок начинают расходиться раньше верх- SS них. Вследствие этого толщина верхних кромок уменьшается и под действи ем легочного давления они прогибаются 5 96672 лы F (x, t)в правой части волнового уравнения (1). Иожно показать, что конечный результат этих преобразований приводит к уравнению — (S - ) ".. — - = F(x, й) 1 d" d 1 d2 Т dx dx с dt s где возбуждающая сила F(x, t) есть F(x t) = - (1+ — — (х-I?) f(t)У, Е (х (х Р)2 d2f(t) 2с dt 2 l dW К сРН и f(t) — — — 4 — S0 dt О 1$ где 3 - длина голосового тракта. Таким образом, возбуждающая функция F(x, t) зависит от первой и третьей производных по времени от объемной скорости W(t) и от второй и чет20 вертой производных по времени от вертикального смещения верхней поверх. ности голосовых связок H(t). Аналитические оценки энергетичес кого вклада поршневого источника в 23 акустические колебания на интервале открытой голосовой щели показывают, что по порядку величины он сравним с вкладом объемного источника. Вертикальные смещения голосовых связок на интервале закрытой голосовой щели, хотя и меньше по степени их влияния, приводят к тому, что свободные затухающие акустические колебания в голосовом тракте отсутствуют. Эти результаты объясняют некоторые эксперименты по обратной фильтрации речевых сигналов, в которых обнаружено дополнительное возбуждение колебаний на интервале закрытой голосовой щели.! 5 6 Аудиторская экспертиза звуков ре" чи, синтезированных с поршневым источником. показывает улучшение нату- . ральности звучания по сравнению с объемным источником и возможность управления тембром речи эа счет соответствующего выбора параметров поршневого источника. Формула изобретения Способ возбуждения синтезаторов речи, использующий трехмерную модель колебаний голосовых связок, о т л ич а ю шийся тем, что, с целью повышения натуральности синтезированной речи и расширения возможности в управлении ее тембром, сигнал голосового возбуждения формируют как сумму первой и третьей производных от сигнала, пропорционального объемной скорости воздушного потока, протекающего через голосовую щель, и второй и четвертой производных от сигнала, пропорционального вертикальному смещению верхней поверхности голосовых связок. Источники информации, принятые во внимание при экспертизе 1. Патент CIIIA Ii" 351I932, кл. 179/1, 1970 ° 2. 3shlzaku К., Flanagan 3 Synthesis of voiced Sounds from a two-mass, model of the Vocal Cords. "BeII Syst. Techn. 3 .", 1972, ч ° 50, N 6, р. 1233-1268. 3. Т.11ле 3 . R., Ta l k i n D.Т. А theo retical Study of the effects of чаrious laryneal configurations on the acoustics of phonation. — "3. Acoust. Soc. Am., 1979, ч.66, N 1, р. 60-74. 966725 Фиа! Фиа2 г Фиг3 Тираж 390 Подписное ВНИИПИ Государственного комитета CCCP по делам изобретений и открытий 113035, Москва, Ж-35; Раушская наб., д. 4/5 Заказ 849/68 филиал ППП "Патент", г. Ужгород, ул. Проектная, 4 Составитель Б. Поспелов Редактор К. Волощук Техред С. Мигунова Корректор Г. Решетник