Способ ускоренного воспроизведения речевых сообщений и устройство для его осуществления

 

СОЮЗ СОВЕТСКИХ

СОЦИАЛИСТИЧЕСКИХ

РЕСПУБЛИК

„„SU„„1406636 A 1

ы) 4 G 10 1 3/02

ГОСУДАРСТВЕННЫЙ КОМИТЕТ СССР

ПO ДЕЛАМ ИЗОБРЕТЕНИЙ И ОТКРЫТИЙ

ОПИСАНИЕ ИЗОБРЕТЕНИЯ /Я, I

; /

Г

В г

К А BTOPCKOMV СВИДЕТЕЛЬСТВУ

8bvod

Вход (21) 3833250/24-10 (22) 02.01..85 (46) 30.06.88. Бюл. № 24 (71) Львовский политехнический институт им. Ленинского комсомола (72) С. В. Балицкий, Я. H. Гнатив и Ю. М. Рашкевич (53) 534.782 (088.8) (56) Патент США № 4464784, кл. G 10 L 3/02, оп убл и к. 14.08.84.

Авторское свидетельство СССР № 1173438, кл. С 10 1 3/02, 1983.

Авторское свидетельство СССР № 1259862, кл. G 10 1 3/02, 1984. (54) (57) СПОСОБ УСКОРЕННОГО ВОСПРОИЗВЕДЕНИЯ РЕЧЕВЫХ СООБЩЕНИЙ И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯЯ

l. Способ ускоренного воспроизведения речевых сообщений путем выделения сегментов фонограммы, считываемой с повышенной скоростью, и последующей компиляции части сегментов, отличающийся тем, что, с целью повышения разборчивости воспроизводимых сообщений, по параметрам выделенных сегментов проверяют их принадлежность к одинаковым стационарным звукам, и при воспроизведении компилируют сегменты, не повторяющие по признаку при Hàäëåæ Hoñти предыдущие компилированные сегменты.

1406636

2. Устройство для ускоренного воспроизведения речевых сообщений, содержащее последовательно соединенные входной аналого-цифровой преобразователь, оператив ное запоминающее устройство и выходной цифроаналоговый преобразователь, два регистра и блок управления с генератором тактовы.х импульсов, отличающееся тем, что, с целью повышения разборчивости сообщения, в него дополнительно введены второе и третье оперативные запоминающие устройства, четыре коммутатора, четыре счетчика и блок определения параметров сегмента, при этом выход первого оперативного запоминающего устройства соединен с входом выходного цифроаналогового вреИзобретение относится к речевой информатике и может быть использовано для ускоренного прослушивания фонограмм при поиске речены сообщений заданного содержания на носителях болыпой продолжи- 5 тельности.

1 елью изобретения является повышение разборчивости речевых сообщений, ускоренно воспроизводимых путем выделения сегментов фонограммы, считываемой с повышенной скоростью, и последующей компиляции части сегментов.

Предлагаемый способ основан на введении операции проверки принадлежности каждого из последовательных сегментов, на которые расчленяется фонограмма, к тому стацио- 15 нарному звуку, начальный сегмент которого был последним включен в компилируемое выходное сообщение. Если такая принадлежность установлена, этот избыточный для передачи смысла при быстром прослушивании сегмент не компилируют. Благодаря такому прореживанию выходное сообщение не содержит floBTopHlolHHxcH по принадлежности к одному звуку сегментов, его длительность сокращается по отношению к длительности входного в несколько раз, что поз- 25 вол яет соответственно ускорить считывание исходной фонограммы. Непрерывность прослушиваемого сообщения обеспечивается упругой задержкой компилированного сигнала после компиляции речевого сообщения.

На чертеже приведена блок-схема устрой- 30 ства для ускоренного воспроизведения речевых сообщений.

Устройство содержит входной аналогоцифровой преобразователь l, оперативные запоминающие устройства 2 — 4, выходной цифроаналоговый преобразователь 5, комму- 35 образователя через последовательно соединенные второе и третье оперативные запоминающие устройства, адресные и управляющие входы оперативных запоминающих устройств соединены соответственно через первый, второй и третий коммутаторы с выходами счетчиков, причем управляющие входы коммутаторов соединены с соответствующими выходами блока управления, входы которого соединены через регистры, четвертый коммутатор и блок определения параметров сегментов с выходом второго оперативного запоминающего устройства, входы первых грех счетчиков присоединены к генератору тактовых импульсов, а вход четвертого — к соответствующему выходу блока управления. таторы 6 — 9, счетчики 10 -13, блок 14 определения параметров сегмента, регистры 15 и 16, генератор 17 тактовых импульсов и блок 18 управления. Вход устройства через аналого-цифровой преобразователь и последовательно соединенные оперативные запоминающие устройства 2 4 соединен с цифроаналоговым преобразователем 5, выход которого является выходом устройства.

Выходы первого 6, второго 7 и третьего 8 коммутаторов соединены с соответствующими входами оперативных запоминающих устройств, а выходы четвертого коммутатора 9 через регистры 15 и 16 — с входами блоKd 18 управления, выходы которого соединены с управляющими входами коммутаторов 6 9. Входы трех коммутаторов соединены с выходами счетчиков: первый коммутатор — с первым 10 и вторым 11 счетчиками, второй -- с вторым 11 и третьим 12 счетчиками, третий — с третьим 12 и четвертым 13 счетчиками, вход четвертого коммутатора 9 соединен с выходом блока 14 определения параметров сегментов, вход которого присоединен к выходу второго оперативного запоминающего устройства 3. Входы первых трех счетчиков 10 12 присоединены к генератору !7 тактовых импульсов, а вход четвертого — к соответствующему выходу блока 18 управления.

Устройство работает следующим образом.

Входной сигнал поступает в устройство с повышенной скоростью и преобразуется в цифровой вид аналого-цифровым преобразователем I и записывается в темпе поступления в первое оперативное запоминающее устройство 2, откуда посегментно с большой скоростью пересылается во второе опера1406636

Составитель В Матинин

Редактор 4. Слиган Текред И Верее Корректор М Шароши

Заказ 3!98> 47 Тираж 350 Подписное

ВП!!!!(!!! Гос1дарственног<> коиитетл СССР по делая изодретсний и откр><тий ! 3035, Москва, Ж 3 >, Рг>1 шская най., д. 4 5

Прои >вод<та< нно-поли< ра<1>инеское < редприятие. г. Ужгород, ул. Проектная, 4 тивное запоминающее устройство 3, с выхода которого отводят сигналы для определения параметров сегментов в соответствующем блоке 14. Параметры сегмента в зависимости от состояния коммутатора 9 пересылаются в регистр 15 или 16. Содержимое регистров сравнивается в блоке 18 управления, где принимается решение о том, являются ли сравниваемые сегменты отрезками одного стационарного звука, и если не являются, то блок управления направляет соответствующие сигналы в коммутаторы 6 — 9 и четвертый счетчик 13, что приводит к пересылке этого сегмента в оперативное запоминающее устройство 4 для последующего вывода с нормальной скоростью через выходной цифроаналоговый преобразователь 5.

Необходимое соотношение между скоростями записи, переписи и вывода обеспечивается счетчиками 10 — 12, получающими тактовые импульсы от генератора 17 тактовых импульсов. Если принимается решение о том, 2О что поступившие параметры сегмента повторяют параметры сегмента, скомпилированного последним в оперативном запоминающем устройстве 4, то этот, поступивший из второго оперативного запоминающего устройства 3 сегмент не компилируется, что и обеспечивает вывод с нормальной скоростью сжатого сообщения, поступавшего с повышенной скоростью. Экспериментально установлено, что для обеспечения нормальной работы этой цифровой системы упругой задержки объем последнего оперативного запоминающего устройства должен быть достаточен для хранения одной секунды компилированной речи. При этом разборчивость компилированных сообщений достигает 95о, а коэффициент ускорения прослушивания записей, полученных по телефону, равен трем.

Способ и устройство для ускоренного воспроизведения речевых сообщений найдут применение при поиске сообщений, зафиксированных автоматическими телефонными службами.

Способ ускоренного воспроизведения речевых сообщений и устройство для его осуществления Способ ускоренного воспроизведения речевых сообщений и устройство для его осуществления Способ ускоренного воспроизведения речевых сообщений и устройство для его осуществления 

 

Похожие патенты:

Изобретение относится к приборостроению

Изобретение относится к контрольно-измерительной технике и позволяет повысить точность и надежность измерения за счет устранения перегрузок дифференциального датчика 1давления (ДДД)

Изобретение относится к информатике и технике связи и может быть использовано для согласования частотного диапазона сообщения с каналом звуковоспроизведения

Изобретение относится к обработке информации и может быть использовано в телекоммуникационных системах

Изобретение относится к области автоматического распознавания человека по его голосовым характеристикам и может быть использовано для ограничения и разграничения доступа (в том числе удаленного) к устройствам и системам, к средствам электронно-вычислительной техники, к конфиденциальной информации, к услугам (например, телекоммуникационным, информационным, банковским), а также к охраняемым зонам и помещениям

Изобретение относится к области анализа и распознавания речевых сигналов и касается способа распознавания фонем речи

Изобретение относится к области анализа и распознавания речевых сигналов

Изобретение относится к области электроники, в частности к переводу фраз с первого языка на второй

Изобретение относится к способам и устройствам детектирования автоответчика, используемым для определения того, является ли получатель вызова реальной персоной или автоответчиком

Изобретение относится к речевой информатике

Изобретение относится к средствам синтеза речи по тексту. Технический результат заключается в повышении естественности человеческого голоса в синтезированной речи. Акустическая пространственная модель обучается на основе обучающих данных речевых атрибутов с использованием глубокой нейронной сети для определения факторов взаимозависимости между речевыми атрибутами в обучающих данных. Глубокая нейронная сеть создает единственную непрерывную акустическую пространственную модель на основе факторов взаимозависимости. Акустическая пространственная модель, таким образом, учитывает множество взаимозависимых речевых атрибутов и дает возможность моделировать непрерывный спектр взаимозависимых речевых атрибутов. Далее происходит получение текста; получение выбора одного или нескольких речевых атрибутов, причем каждый речевой атрибут обладает весом выбранного атрибута. Текст преобразуется в синтезированную речь с использованием акустической пространственной модели, и синтезированная речь обладает выбранным речевым атрибутом. Синтезированная речь выводится в виде аудио, обладающего выбранным речевым атрибутом. 2 н. и 12 з.п. ф-лы, 4 ил.
Наверх