Способ компиляционного синтеза речи

Авторы патента:

G10L13/02 - способы синтезирования речи; синтезаторы речи

Изобретение относится к речевой информатике. Цель изобретения - повышение натуральности звучания компилируемых речевых сообщений - достигается стыковкой фрагментов фонограмм заранее записанных дифонов и протяженых гласных звуков, которые вводят на 20 - 40 мс перед предударными дифонами и на 40 - 60 мс перед ударными. 1 ил.

СОЮЗ СОВЕТСНИХ

СОЦИАЛИСТИЧЕСНИЯ

РЕСПУБЛИК

„„SU 1599888

А1 (51)5 0 10 L 5/02

ОПИСАНИЕ ИЗОБРЕТЕНИЯ

К А ВТОРСНОМ / СВИДЕТЕЛЬСТВУ

ГОСУДАРСТВЕННЫЙ КОМИТЕТ

ПО ИЗОБРЕТЕНИЯМ И ОТКРЫТИЯМ

ПРИ ГННТ СССР, (21) 4410536/24-10 (22) 18.04,88 (46) 15.10.90. Бюл. К 38 (7 1) Ереванский политехнический институт им. К.Маркса (72) А.А.Григорян и К.О, Канаян (53) 534.78(088,8) (56) Авторское свидетельство СССР

К 1451762, кл. C 10 1. 5/02, 1985.

Авторское свидетельство СГСР

Р 1075300, кл. Г. 10 1. 5/02 1982.

Изобретение относится к речевой информатике и приборостроению для синтеза речевых сообщений по тексту в системах акустического общения человека с автоматами.

Пель изобретения вЂ” повышение разборчивости и натуральности синтеэируемой речи.

Повышение натуральности и разборчивости компилируемых сообщений достигается стыковкой фрагментов фонограмм, выбираемых иэ заранее записанных сегментов соответствующих дифонов натуральной речи, содержащий конечную часть предшествующего и начальную часть последующего звуков, общей продолжительностью от 80 до

120 мс. Интонационные свойства высказываний моделируют вставками иэ фонограмм, отдельно хранящихся стационарных участков гласных звуков. При компиляции вставки между дифонами, соответствующими предударным гласным, имеют продолжительность в пределах от 20 до 40 мс, а между дифонами, /

2 (54) .СПОСОБ К0ИПИЛЯ1ИОННОГО СИНТЕЗА

РЕЧИ (57) Изобретение относится к речевой информатике. Пель изобретения вЂ” повышение натуральности звучания компилируемых речевых сообщений вЂ” достигается стыковкой фрагментов фонограмм заранее записанных дигонов и протяжных гласных звуков, которые вводят на 20-40 мс перед предударными дифонами и на 40-60 мс перед ударными.

1 ил. соответствующими ударной гласной, продолжительностью в пределах от 40 до 60 мс.

На чертеже представлена блок-схема, поясняющая способ.

Текст с дополнительными знаками ударений вводят в текстовый процессор 1, соединенный с постоянными запоминающими устройствами 2 и 3, где хранят заранее записанные дифоны и протяжно произнесенные отдельные гласные звуки соответственно.

Считываемые фонограммы поблочно через буферное запоминающее устрой ство 4 соответственно выбранным дли- тельностям преобразуют цифро-аналого-вым преобразователем 5 и воспроизводят электроакустическим агрегатом 6.

Компиляция сообщений из натуральных дифонов и фрагментов протяжных гласных обеспечивает естественный оттенок и разборчивость синтеэируемых сообщений.

1599888

Ф о р м у л а изобретения

Составитель В. Махонин

Редактор И. Сегляник . Техред М.Дидык Корректор А. 0сауленко

Заказ 3145 Тираж 321 Подписное

BHHHIIH Государственного комитета по изобретениям и открытиям при ГКНТ СССР

113035, Москва, Ж-35, Раушская наб., д. 4/5

Производственно-издательский комбинат "Патент", г. Ужгород, ул. Гагарина, 101

Способ компиляционного синтеза речи, включающий воспроизведение отрезков из,заранее выделенных и записанных юрагментов ннтуральной речи при управлении длительностью отрезков сигналами, Формируемыми прн транскрибировании сннтезируемых текстов в последовательности отрезков, о т л ич а ю шийся тем, что, с целью повыпения разборчивости и натуральности синтезируемой речи, выделяют и записывают все дид оны, содержащие конечную часть предпествующего и начальную часть последующего звуков общей продолжительностью s 80- 120 мс и изолированные стационарные участки гласных естественной речи, а при воспроизведении синтеэируемое сообщение компилируют иэ дигонов с включением между дифонами, соответствующими предударным гласным, отрезков соответствующих гласных продолжительностью в 20-40 мс и с включением между дибонами, содержащими ударные гласные, отрезков соответствующих гласных продолжительностью в 40-60 мс.

Похожие патенты:

Способ синтеза речи // 1531133

Изобретение относится к технике синтеза речевой информации, выводимой из ЭВМ, и может быть использовано в информаторах - синтезаторах на транспорте, связи, измерительных и технологических комплексах

Способ анализа и синтеза речи и устройство для его осуществления // 1501138

Изобретение относится к речевой информатике и может быть использовано в вычислительной технике и технике связи для выделения и реконструкции речевых сообщений

Устройство для воспроизведения звуковых сообщений // 1456991

Устройство для синтеза речи // 1451762

Изобретение относится к речевой информатике и может быть использовано в системах речевого взаимодействия человека с ЭВМ

Способ синтеза речевых сигналов и устройство для его осуществления // 1408450

Цифровой синтезатор речи // 1297098

Изобретение относится к технике обработки сигналов для речевой информатики и синтеза речевых сообщений для абонентов телефонных связей.Цель изобретения - повышение качества звучания речи, синтезируемой под контролем компьютера, обслуживающего сеть цифровых абонентских синтезаторов речи

Устройство для формирования сигналов управления синтезом речи // 1152028

Синтезатор речи // 1084870

Цифровой синтезатор речи // 1080198

Способ формирования сигналов управления синтезом речи и устройство для его осуществления // 1043737

Передающая система на принципах различного кодирования // 2144261

Изобретение относится к радиотехнике и связи и может быть использовано в системах передачи и приема речевых и музыкальных сигналов

Устройство обнаружения и коррекции аномальных цифровых ошибок при передаче речи методом импульсно-кодовой модуляции // 2159470

Изобретение относится к технике цифровой обработки речевых сигналов, передаваемых по линиям связи методом импульсно-кодовой модуляции (ИКМ), и может быть использовано для повышения помехозащищенности многоканальных систем передачи цифровой телефонии

Способ преобразования речи и устройство для его осуществления // 2166804

Изобретение относится к средствам цифрового кодирования речевых сигналов и предназначено для их компактного представления в целях передачи и хранения

Способ обнаружения и коррекции ложных импульсов при передаче речи методом импульсно-кодовой модуляции // 2191434

Изобретение относится к технике цифровой обработки речевых сигналов, передаваемых по линии связи методом ИКМ

Устройство на основе личности // 2471251

Изобретение относится к мобильным устройствам

Устройство для синтеза речи // 1606994

Изобретение относится к речевой информатике и может быть использовано в системах взаимодействия человека и компьютера

Способ компиляционного синтеза речи и устройство для его осуществления // 1683063

Устройство синтеза речи // 2606312

Изобретение направлено на формирование речевого сигнала с заданными характеристиками. Технический результат заключается в повышении естественности, разборчивости речи и ее эмоциональной окраски при генерации речевого сигнала при уменьшении вычислительной сложности за счет усовершенствования структуры элементов системы синтеза речи и разделения используемых баз данных. Устройство синтеза речи на основе текста, содержит блок, принимающий текстовую строку и формирующий из нее последовательность идентификаторов звуковых единиц, подаваемую в блок формирования звукового сигнала, а затем в блок воспроизведения. В блок формирования звукового сигнала параллельно подаются дополнительные команды управления, вырабатываемые из сформированной последовательности идентификаторов звуковых единиц блоком формирования управляющих команд, зависящих от языка, блоком формирования управляющих команд, зависящих от моделируемых параметров диктора, а именно параметров голоса и/или его физических и физиологических параметров, и блоком формирования управляющих параметров окраса голоса, настроенных на определенное психофизиологическое состояние, предназначенных для формирования управляющих параметров для коррекции интенсивности речевого сигнала. 1 з.п. ф-лы, 1 ил.