Способ компиляционного синтеза речи

 

Изобретение относится к речевой информатике. Цель изобретения - повышение натуральности звучания компилируемых речевых сообщений - достигается стыковкой фрагментов фонограмм заранее записанных дифонов и протяженых гласных звуков, которые вводят на 20 - 40 мс перед предударными дифонами и на 40 - 60 мс перед ударными. 1 ил.

СОЮЗ СОВЕТСНИХ

СОЦИАЛИСТИЧЕСНИЯ

РЕСПУБЛИК

„„SU 1599888

А1 (51)5 0 10 L 5/02

ОПИСАНИЕ ИЗОБРЕТЕНИЯ

К А ВТОРСНОМ / СВИДЕТЕЛЬСТВУ

ГОСУДАРСТВЕННЫЙ КОМИТЕТ

ПО ИЗОБРЕТЕНИЯМ И ОТКРЫТИЯМ

ПРИ ГННТ СССР, (21) 4410536/24-10 (22) 18.04,88 (46) 15.10.90. Бюл. К 38 (7 1) Ереванский политехнический институт им. К.Маркса (72) А.А.Григорян и К.О, Канаян (53) 534.78(088,8) (56) Авторское свидетельство СССР

К 1451762, кл. C 10 1. 5/02, 1985.

Авторское свидетельство СГСР

Р 1075300, кл. Г. 10 1. 5/02 1982.

Изобретение относится к речевой информатике и приборостроению для синтеза речевых сообщений по тексту в системах акустического общения человека с автоматами.

Пель изобретения — повышение разборчивости и натуральности синтеэируемой речи.

Повышение натуральности и разборчивости компилируемых сообщений достигается стыковкой фрагментов фонограмм, выбираемых иэ заранее записанных сегментов соответствующих дифонов натуральной речи, содержащий конечную часть предшествующего и начальную часть последующего звуков, общей продолжительностью от 80 до

120 мс. Интонационные свойства высказываний моделируют вставками иэ фонограмм, отдельно хранящихся стационарных участков гласных звуков. При компиляции вставки между дифонами, соответствующими предударным гласным, имеют продолжительность в пределах от 20 до 40 мс, а между дифонами, /

2 (54) .СПОСОБ К0ИПИЛЯ1ИОННОГО СИНТЕЗА

РЕЧИ (57) Изобретение относится к речевой информатике. Пель изобретения — повышение натуральности звучания компилируемых речевых сообщений — достигается стыковкой фрагментов фонограмм заранее записанных дигонов и протяжных гласных звуков, которые вводят на 20-40 мс перед предударными дифонами и на 40-60 мс перед ударными.

1 ил. соответствующими ударной гласной, продолжительностью в пределах от 40 до 60 мс.

На чертеже представлена блок-схема, поясняющая способ.

Текст с дополнительными знаками ударений вводят в текстовый процессор 1, соединенный с постоянными запоминающими устройствами 2 и 3, где хранят заранее записанные дифоны и протяжно произнесенные отдельные гласные звуки соответственно.

Считываемые фонограммы поблочно через буферное запоминающее устрой ство 4 соответственно выбранным дли- тельностям преобразуют цифро-аналого-вым преобразователем 5 и воспроизводят электроакустическим агрегатом 6.

Компиляция сообщений из натуральных дифонов и фрагментов протяжных гласных обеспечивает естественный оттенок и разборчивость синтеэируемых сообщений.

1599888

Ф о р м у л а изобретения

Составитель В. Махонин

Редактор И. Сегляник . Техред М.Дидык Корректор А. 0сауленко

Заказ 3145 Тираж 321 Подписное

BHHHIIH Государственного комитета по изобретениям и открытиям при ГКНТ СССР

113035, Москва, Ж-35, Раушская наб., д. 4/5

Производственно-издательский комбинат "Патент", г. Ужгород, ул. Гагарина, 101

Способ компиляционного синтеза речи, включающий воспроизведение отрезков из,заранее выделенных и записанных юрагментов ннтуральной речи при управлении длительностью отрезков сигналами, Формируемыми прн транскрибировании сннтезируемых текстов в последовательности отрезков, о т л ич а ю шийся тем, что, с целью повыпения разборчивости и натуральности синтезируемой речи, выделяют и записывают все дид оны, содержащие конечную часть предпествующего и начальную часть последующего звуков общей продолжительностью s 80- 120 мс и изолированные стационарные участки гласных естественной речи, а при воспроизведении синтеэируемое сообщение компилируют иэ дигонов с включением между дифонами, соответствующими предударным гласным, отрезков соответствующих гласных продолжительностью в 20-40 мс и с включением между дибонами, содержащими ударные гласные, отрезков соответствующих гласных продолжительностью в 40-60 мс.

Способ компиляционного синтеза речи Способ компиляционного синтеза речи 

 

Похожие патенты:

Изобретение относится к технике синтеза речевой информации, выводимой из ЭВМ, и может быть использовано в информаторах - синтезаторах на транспорте, связи, измерительных и технологических комплексах

Изобретение относится к речевой информатике и может быть использовано в вычислительной технике и технике связи для выделения и реконструкции речевых сообщений

Изобретение относится к речевой информатике и может быть использовано в системах речевого взаимодействия человека с ЭВМ

Изобретение относится к технике обработки сигналов для речевой информатики и синтеза речевых сообщений для абонентов телефонных связей.Цель изобретения - повышение качества звучания речи, синтезируемой под контролем компьютера, обслуживающего сеть цифровых абонентских синтезаторов речи

Изобретение относится к радиотехнике и связи и может быть использовано в системах передачи и приема речевых и музыкальных сигналов

Изобретение относится к технике цифровой обработки речевых сигналов, передаваемых по линиям связи методом импульсно-кодовой модуляции (ИКМ), и может быть использовано для повышения помехозащищенности многоканальных систем передачи цифровой телефонии

Изобретение относится к средствам цифрового кодирования речевых сигналов и предназначено для их компактного представления в целях передачи и хранения

Изобретение относится к технике цифровой обработки речевых сигналов, передаваемых по линии связи методом ИКМ

Изобретение относится к мобильным устройствам

Изобретение относится к речевой информатике и может быть использовано в системах взаимодействия человека и компьютера

Изобретение направлено на формирование речевого сигнала с заданными характеристиками. Технический результат заключается в повышении естественности, разборчивости речи и ее эмоциональной окраски при генерации речевого сигнала при уменьшении вычислительной сложности за счет усовершенствования структуры элементов системы синтеза речи и разделения используемых баз данных. Устройство синтеза речи на основе текста, содержит блок, принимающий текстовую строку и формирующий из нее последовательность идентификаторов звуковых единиц, подаваемую в блок формирования звукового сигнала, а затем в блок воспроизведения. В блок формирования звукового сигнала параллельно подаются дополнительные команды управления, вырабатываемые из сформированной последовательности идентификаторов звуковых единиц блоком формирования управляющих команд, зависящих от языка, блоком формирования управляющих команд, зависящих от моделируемых параметров диктора, а именно параметров голоса и/или его физических и физиологических параметров, и блоком формирования управляющих параметров окраса голоса, настроенных на определенное психофизиологическое состояние, предназначенных для формирования управляющих параметров для коррекции интенсивности речевого сигнала. 1 з.п. ф-лы, 1 ил.
Наверх