Способ и устройство для оценки структуры в сигнале

Настоящее изобретение относится к способу для оценки основного тона и/или основной частоты в сигнале, имеющем периодическую или квазипериодическую составляющую. Технический результат заключается в повышении надежности оценки основного тона и/или основной частоты в сигнале. Сигнал преобразовывается из временной области в частотную область, чтобы получать спектр сигнала, спектр обрабатывается, чтобы получать спектр нулевой фазы сигнала, спектр сигнала преобразовывается во временную область, чтобы получать сигнал корреляции, спектр и сигналы корреляции комбинируются в комбинированный спектр, и структура оценивается на основе комбинированного спектра. 3 н. и 12 з.п. ф-лы, 8 ил.

 

Область техники, к которой относится изобретение

Настоящее изобретение относится к способу, соответствующему устройству и соответствующей компьютерной программе для оценки структуры, в частности основного тона и/или основной частоты, в сигнале, имеющем периодическую, квазипериодическую или виртуально периодическую составляющую.

Уровень техники

Обнаружение основного тона может использоваться для разных приложений, таких как модификация речи, преобразование текста в речь, кодирование речевого сигнала, извлечение музыкальной информации, системы музыкального исполнения, биометрические измерения, астрофизические измерения и т.д. Для обнаружения основного тона подходы, основанные на временной области и частотной области, являются хорошо известными. Подходы, основанные на временной области, могут осуществляться дешево и легко, например, посредством измерения частоты пересечения нуля, как описано в C.H. Chen, Signal Processing Handbook, New York: Dekker, стр. 531, 1988, или посредством вариации автокорреляции посредством использования подобия последовательных периодов основного тона, как описано в R. Bracewell, The Autocorrelation Function, в The Fourier Transform and Its Applications, New York: MacGraw-Hill, стр. 40-45, 1965. Подходы, основанные на частотной области, обычно являются более сложными и включают в себя этапы быстрого преобразования Фурье (FFT), чтобы преобразовывать сигнал временной области в сигнал частотной области, удаления влияния фазы посредством рассмотрения только мощности частотных составляющих, сжатия значений, чтобы уменьшать влияние огибающей спектра, выработки кандидатов основного тона посредством корреляции лежащих в основе гармоник, как, например, суммирование субгармоник, и нахождения кандидата посредством выбора наивысшего пика. Такие способы являются известными, например, из D.J. Hermes, Measurement of pitch by subharmonic summation, in Journal of the Acoustic Society of America, 83, стр. 257-264, 1988. Другая возможность, чтобы получать кандидаты основного тона, является преобразованием сигнала частотной области назад во временную область посредством обратного преобразования Фурье (IFFT). Например, алгоритм обнаружения основного тона, как известно из B.E. Bongart и др., The Frequency Analysis of Time Series for Echos: Cepstrum, Pseudoautocovariants, Cross-Cepstrum and Saphe Cracking, в Proceedings of the Symposium on Time Series Analysis, Chapter 15 стр. 209-243, New York: Wiley, 1963, основывается на спектральном анализе и использует функцию log для сжатия. Если амплитуда используется как операция сжатия, результирующее обратное преобразование является сигналом нулевой фазы. В этом отношении может использоваться автокорреляция, если не применяется никакое сжатие к спектру мощности.

Сильное сжатие, такое как функция log, усиливает влияние шума и формирует неправильные кандидаты основного тона. Малое сжатие, такое как операция взятия абсолютного значения, является слишком низким, чтобы подавлять влияние огибающих спектра, и поэтому вырабатывает неверные кандидаты из более высоких гармоник. Компромисс состоит в применении операции взятия квадратного корня к значениям амплитуды, как используется в кодере гармонической речи, который известен из R. Taori и др., Harmony-1: A Versatile Low Bit Rate Speech Coding System, Nat. Lab. Technical Note 157/97. Способы обнаружения основного тона обеспечиваются, чтобы определять правильный кандидат из множественных кандидатов, однако если кандидаты являются близкими друг к другу, может выбираться неверный кандидат. Дополнительно, если более высокая и/или более низкая октавы основного тона представлены сильно, способами обнаружения основного тона, известными из предшествующего уровня техники, могут выбираться ложные кандидаты.

Сущность изобретения

Задачей настоящего изобретения является обеспечение улучшенных способа, устройства и компьютерной программы для более надежной оценки структуры, в частности основного тона и/или основной частоты, в сигнале.

В первом аспекте настоящего изобретения способ для оценки структуры, в частности основного тона и/или основной частоты, в сигнале, имеющем периодическую, квазипериодическую или виртуально периодическую составляющую, содержит:

преобразование сигнала из временной области в частотную область, чтобы получать спектр сигнала,

обработку спектра, чтобы получать спектр нулевой фазы сигнала,

преобразование спектра нулевой фазы сигнала во временную область, чтобы получать сигнал корреляции,

комбинирование спектра и сигнала корреляции в комбинированный спектр, и

оценку структуры на основе комбинированного спектра.

В дополнительном аспекте настоящего изобретения представлено соответствующее устройство, например, содержащее блок обработки для выполнения этапов вышеупомянутого способа.

В дополнительном аспекте настоящего изобретения представлена соответствующая компьютерная программа, содержащая средство программного кода для побуждения компьютера выполнять этапы предложенного способа, когда упомянутая компьютерная программа выполняется на компьютере.

Предпочтительные варианты осуществления изобретения определяются в зависимых пунктах формулы изобретения. Следует понимать, что заявленное устройство и заявленная компьютерная программа имеют аналогичные и/или идентичные предпочтительные варианты осуществления, что и заявленный способ и как определяется в зависимых пунктах формулы изобретения.

Настоящее изобретение основывается на идее, что на дополнительном этапе спектр частотной области комбинируется с его преобразованием временной области, так что результирующий спектр имеет отчетливый пик в местоположении основного тона и сильное ослабление на более высоких и более низких октавах. Этот способ может использоваться, чтобы оценивать основной тон и/или основную частоту сигнала. Так как результирующий спектр имеет просто отчетливый пик в местоположении основного тона и/или основной частоты, основной тон и/или основная частота может легко обнаруживаться с высокой надежностью.

Согласно предпочтительному варианту осуществления этап преобразования сигнала из временной области в частотную область содержит преобразование Фурье, в частности быстрое преобразование Фурье. Это обеспечивает возможность осуществлять преобразование из временной области в частотную область с малым усилием.

Согласно дополнительному варианту осуществления сигнал обрабатывается посредством узкополосного режекторного фильтра DC. Узкополосный режекторный фильтр DC удаляет низкочастотные сигналы, чтобы предотвращать ложное обнаружение.

DC фильтрованный сигнал предпочтительно умножается на оконную функцию. Эта оконная операция ограничивает спектр до области, которая содержит, по меньшей мере, два периода основного тона.

Согласно дополнительному варианту осуществления спектр сигнала обрабатывается, чтобы получать спектр амплитуды сигнала. Вычисление амплитуды сигнала обеспечивает операцию сжатия, которая является легко реализуемой и дает результатом сигнал нулевой фазы после обратного преобразования.

Согласно дополнительному варианту осуществления спектр сигнала сжимается в сжатый спектр, в частности посредством операции взятия квадратного корня. Альтернативно, функция сжатия может быть функцией корня, в общем использующей, например, 0,6 в качестве показателя степени. Эта операция акцентирует гармоники основного тона и ослабляет влияние огибающих спектра.

Согласно дополнительному варианту осуществления спектр сигнала подвергается оконной обработке посредством оконной функции, в частности посредством использования правой половины окна Хенинга или других оконных функций, которые имеют аналогичный эффект. Эта оконная операция ослабляет шумовые высокочастотные составляющие.

Согласно дополнительному варианту осуществления преобразование спектра нулевой фазы, в частности сжатого спектра амплитуды сигнала, во временную область содержит обратное преобразование Фурье. Так как фаза спектра, в частности сжатого спектра, является нулевой, должна вычисляться только положительная ось действительной части спектра. Это обеспечивает возможность получать сигнал корреляции, имеющий пики в кратных периода основного тона.

Согласно дополнительному предпочтительному варианту осуществления сигналы корреляции ослабляются посредством оконной функции. Эта оконная операция ослабляет влияние огибающей спектра на сигнал корреляции.

Согласно предпочтительному варианту осуществления комбинирование спектра и сигнала корреляции содержит повторную дискретизацию, по меньшей мере, одного из спектра или сигнала корреляции. Повторная дискретизация обеспечивает возможность комбинировать спектр и сигнал корреляции, имеющий обратно пропорциональные оси. В частности, является предпочтительным использовать логарифмическую шкалу. Это обеспечивает возможность комбинировать спектр и сигнал, имеющий большое различие в разрешении для высоких и низких частот разных областей.

Согласно предпочтительному варианту осуществления оценка структуры содержит поиск абсолютного максимума комбинированного сигнала. Это обеспечивает надежную и простую возможность находить основной тон и/или основную частоту сигнала.

Согласно предпочтительному варианту осуществления сигнал выпрямляется, в частности посредством функции двухполупериодного выпрямления. Это обеспечивает возможность определять основной тон и/или основную частоту сигнала, когда основная частота отсутствует, без ухудшения характеристики для нефильтрованных сигналов.

Согласно предпочтительному варианту осуществления спектр нулевой фазы выпрямленного сигнала сравнивается со спектром нулевой фазы невыпрямленного сигнала, и при этом максимум этих сигналов выбирается и комбинируется с сигналом корреляции, чтобы формировать комбинированный сигнал. Причина, чтобы брать максимум спектров, состоит в том, что в случае чистых синусоидальных сигналов выпрямление удаляет основную частоту и вырабатывает только более высокие гармоники. Чтобы уменьшать искажение, спектры выпрямленного и невыпрямленного сигнала комбинируются посредством выбора максимума этих спектров.

Краткое описание чертежей

Эти и другие аспекты изобретения будут видны из и объяснены со ссылкой на вариант(ы) осуществления, описанный(е) ниже. На следующих чертежах:

фиг. 1 показывает схематичную диаграмму последовательности операций способа обнаружения основного тона согласно настоящему изобретению,

фиг. 2 показывает диаграмму исходного сигнала, подлежащего обработке, и сжатый спектр, сигнал корреляции, комбинированный спектр и измеренный основной тон, выведенный из исходного сигнала посредством способа обнаружения основного тона,

фиг. 3 показывает схематичный чертеж устройства для выполнения обнаружения основного тона согласно настоящему изобретению,

фиг. 4 показывает диаграмму последовательности операций одного варианта осуществления способа для обнаружения основного тона,

фиг. 5 показывает диаграмму последовательности операций дополнительного варианта осуществления способа для обнаружения основного тона,

фиг. 6 показывает блок-схему блока обработки, выполняющего способ согласно фиг. 4,

фиг. 7 показывает блок-схему блока обработки, выполняющего способ согласно фиг. 5, и

фиг. 8 показывает блок-схему блока обработки, выполняющего способ согласно фиг. 1.

Подробное описание изобретения

Фиг. 1 показывает диаграмму последовательности операций способа для обнаружения основного тона и/или основной частоты сигнала, имеющего периодическую, квазипериодическую или виртуальную периодическую составляющую, в общем обозначаемого посредством 10. Примерами для этих сигналов являются запись голосовой речи, музыкальный тон инструмента, сигналы тела, такие как биение сердца, радиосигналы от звезд, сигналы наблюдения деятельности. Входной сигнал s, который является квазипериодическим или виртуально периодическим сигналом, таким как речевой сигнал, преобразовывается на этапе S1 из сигнала временной области в спектр частотной области. Преобразование предпочтительно содержит быстрое преобразование Фурье (FFT). Этап S1 обеспечивает спектр S сигнала s. Спектр S обрабатывается на этапе S2, чтобы удалять информацию фазы спектра и чтобы получать спектр нулевой фазы (Sm). Обработка содержит вычисление амплитуды спектра S и факультативно спектральное сжатие спектра S, например, посредством операции взятия квадратного корня. Этап S2 обработки и/или сжатия акцентирует гармоники основного тона и ослабляет влияние огибающей спектра. Этап S2 обеспечивает спектр нулевой фазы Sm.

Спектр нулевой фазы Sm преобразовывается на этапе S3 из частотной области во временную область предпочтительно с использованием обратного преобразования Фурье. Этап S3 преобразования обеспечивает сигнал корреляции c, который содержит пики в кратных периода основного тона.

Спектр нулевой фазы Sm и сигнал корреляции c комбинируются на этапе S4 в комбинированный спектр b. Комбинированный спектр b содержит отчетливый пик на основном тоне, при этом более высокие гармоники в частотном спектре и кратных периода основного тона ослабляются, оставляя основной тон и/или основную частоту как преобладающий пик. Комбинирование S4 выполняется посредством умножения спектра нулевой фазы Sm на сигнал корреляции c.

На основе комбинированного спектра b выполняется обнаружение S5 пика, чтобы оценивать основной тон и/или основную частоту сигнала. Обнаружение S5 пика содержит поиск максимума в комбинированном спектре b и обеспечивает выходной сигнал p, который соответствует основному тону и/или основной частоте исходного сигнала s.

Этап S4 комбинирования спектра нулевой фазы Sm с его преобразованием временной области c дает результатом комбинированный спектр b, который имеет отчетливый пик в местоположении основного тона и/или основной частоты и сильное ослабление на более высоких и более низких октавах. Следовательно, обнаружение пика является надежным, так как местоположение основного тона и/или основная частота соответствуют наивысшему пику в комбинированном спектре b.

Фиг. 2 показывает пять диаграмм фиг. 2a-e, показывающих амплитуду исходного сигнала s, частоту сжатого спектра Sc, частоту сигнала корреляции c, частоту комбинированного спектра b и выходной сигнал, основной тон p исходного сигнала s по отношению к времени.

Исходный сигнал s, показанный на фиг. 2a, является временной областью английского предложения "do they take the car when they go aboard". Сжатый сигнал Sc, выведенный из исходного сигнала s посредством этапа S1 преобразования и этапа S2 обработки и сжатия, показан на фиг. 2b.

Частота сигнала корреляции c, выведенного из сжатого спектра Sc посредством этапа S3 преобразования, показана на фиг. 2C.

Частота комбинированного спектра b, выведенного из комбинирования сжатого спектра Sc и сигнала корреляции c посредством этапа S4, показана на фиг. 2d.

Основной тон p по отношению к времени, выведенный из комбинированного спектра b посредством обнаружения пика из этапа S5, показан на фиг. 2e.

Следовательно, фиг. 2 показывает сигналы или спектры, обеспеченные посредством некоторых этапов S1 по S5 способа, по отношению к времени.

Фиг. 3 показывает блок-схему устройства для выполнения обнаружения основного тона, которое, в общем, обозначено посредством 20.

Устройство 20 содержит вход 22 сигнала и выход 24 сигнала, чтобы принимать исходный сигнал s и обеспечивать выходной сигнал p, соответственно. Устройство 20 содержит блок 26 обработки для обработки входного сигнала s и чтобы оценивать основной тон и/или основную частоту входного сигнала s. Блок 26 обработки обеспечивает выходной сигнал p на выход 24 устройства 20. Блок 26 обработки содержит память 28, чтобы хранить программные коды для побуждения блока 26 обработки выполнять этапы способа для обработки входного сигнала s.

Блок 26 обработки может осуществляться посредством интегральной схемы или компьютера или может осуществляться посредством дискретных элементов и/или устройств, которые выполняют необходимые этапы обработки.

Фиг. 4 показывает диаграмму последовательности операций способа обнаружения основного тона, в общем, обозначаемого посредством 30, и соответствующие сигналы или спектры, обеспечиваемые посредством некоторых этапов способа.

Исходный сигнал s предпочтительно фильтруется посредством узкополосного режекторного фильтра DC на первом этапе S6. Низкие частоты входного сигнала s могут искажать обработку обнаружения основного тона вследствие этапа оконной обработки перед преобразованием Фурье из временной области в частотную область. Этап оконной обработки размывает (перераспределяет) энергию доминирующего сигнала DC к более высоким частотам и может акцентировать слабые низкие частоты исходного сигнала s. Чтобы предотвращать ложное обнаружение, низкие частоты исходного сигнала s должны удаляться до последующей оконной обработки. Узкополосный режекторный фильтр DC этапа S6 используется, чтобы удалять низкие частоты исходного сигнала s. Узкополосный режекторный фильтр DC согласно S6 содержит передаточную функцию:

где

fs является частотой дискретизации и fc является обрезающей частотой в Гц, на которой выходная мощность узкополосного режекторного фильтра DC уменьшается до 50% входной мощности (-3 дБ). Реализация фильтра во временной области дается посредством:

содержит исходный сигнал s, DC фильтрованный сигнал sf как выходной сигнал этапа S6 и n как n входной отсчет. Для речевого сигнала, частота дискретизации 8 кГц и обрезающая частота 500 Гц, α приблизительно равняется 0,94. Выходной сигнал узкополосного режекторного фильтра DC sf не содержит низкочастотных составляющих, как показано на фиг. 4.

Следующий этап S7 является оконной функцией. DC фильтрованный сигнал sf умножается на оконную функцию 32. Оконная функция 32 ослабляет возможные разрывы на границах и ограничивает сигнал областью, которая содержит, по меньшей мере, два периода основного тона. Например, если ожидается, что наименьший основной тон 40 Гц, продолжительность окна должна быть, по меньшей мере, 50 мс. Предпочтительно, используется оконная функция Хенинга:

Альтернативно может использоваться оконная функция Хемминга или любая другая оконная функция с аналогичными характеристиками. L зависит от частоты дискретизации, при этом L равняется 400 для частоты дискретизации 8 кГц и продолжительности 50 мс.

Оконная операция определяется посредством:

где sw является выходным сигналом оконной функции этапа S7. Сигнал sw преобразовывается из временной области в частотную область на этапе S8. Это преобразование содержит дискретное преобразование Фурье (DFT), чтобы обеспечивать спектр S сигнала sw. Функция преобразования дискретного преобразования Фурье задается посредством:

По причинам эффективности предпочтительно используется FFT по основанию 2. В этом случае размер M преобразования DFT имеет степень 2 и является самым близким к, но не меньшим, чем L. Например, для L, равного 400, M устанавливается на 512.

На этапе S9 вычисляется спектр амплитуды частотного спектра S. Так как sw является действительно-значным сигналом и S является симметрическим относительно нуля, для вычисления амплитуды используется только положительная ось. Таким образом, формула преобразования Фурье, упомянутая выше, может быть переписана как:

где SR является действительной частью и SI является мнимой частью спектра. Амплитуда вычисляется на этапе S9 посредством формулы:

где Sm является выходным частотным спектром из этапа S9. На последующем этапе S10 спектр амплитуды Sm сжимается посредством операции взятия квадратного корня:

Операция взятия квадратного корня акцентирует гармоники основного тона и ослабляет влияние огибающей спектра, например, как форманты в речевом сигнале. Выходной сигнал сжатия из S10 является сжатым спектром амплитуды Sc.

На этапе S11 сжатый спектр амплитуды Sc подвергается оконной обработке в частотной области, чтобы ослаблять шумовые высокочастотные составляющие предпочтительно посредством использования правой половины окна Хенинга:

где

0, иначе

N определяет размер диапазона пропускания. Для речевого сигнала, имеющего частоту дискретизации 8 кГц и диапазон пропускания 2 кГц . Оконная функция из S10 показана посредством ссылочной позиции 34. Выходной сигнал этапа S11 является подвергнутым оконной обработке сжатым спектром амплитуды Sw, как показано на фиг. 4.

Подвергнутый оконной обработке сжатый спектр амплитуды Sw преобразовывается на этапе S12 во временную область с использованием обратного преобразования Фурье (IFT). Размер FFT остается, как показано выше:

Так как фаза подвергнутого оконной обработке сжатого спектра амплитуды Sw равняется нулю, для обратного преобразования необходима только положительная ось действительной части спектра:

Это преобразование во временную область используется, чтобы получать сигнал корреляции c, который содержит пики в кратных периода основного тона, как показано на фиг. 4.

На этапе S13 сигнал корреляции c подвергается оконной обработке, чтобы дополнительно ослаблять влияние огибающей спектра. Предпочтительно для этого этапа ослабления используется простая оконная функция 36:

Выходной сигнал этапа S13 является подвергнутым оконной обработке сигналом корреляции cw.

На этапе 14 комбинированный спектр b формируется посредством умножения сжатого спектра амплитуды Sc и ослабленного сигнала корреляции cw. Этот комбинированный спектр b имеет отчетливый пик на основной частоте. Посредством умножения этих спектров, более высокие гармоники в частотных спектрах и кратных периодов основного тона ослабляются, при этом основная частота и/или основной тон остается как преобладающий пик. До комбинирования спектров может использоваться повторная дискретизация, по меньшей мере, одного из спектров, так как оси являются обратно пропорциональными, при этом:

Из-за различия разрешения для низких и высоких частот между разными областями, комбинирование предпочтительно выполняется посредством использования логарифмической шкалы:

где kmin и kmax соответствуют действительному диапазону основного тона. Например, для речи, является обычным диапазон основного тона между 40 и 600 Гц. R определяет размер выходного массива. Является достаточным использовать длину входного окна для R с L=R.

Операция повторной дискретизации предпочтительно выполняется посредством использования сплайновой интерполяции:

где и обозначает операцию квантизации, которая удаляет дробную часть. Такая же интерполяция также применяется к Sw, при этом ki' является квантованным индексом ki.

Квантованные индексы также как сплайновые коэффициенты могут предварительно вычисляться и сохраняться в массиве, чтобы избегать длительных вычислений для комплексных логарифмических и экспоненциальных операций. Повторно дискретизированные спектры, которые комбинируются на S14, показаны на фиг. 4 и обозначены посредством 38, 40.

Обнаружение пикового положения как конечный этап S15 содержит поиск максимума комбинированного спектра b:

где ml является максимумом и pl является положением максимума в масштабированной логарифмической области. Основной тон в линейной области в Гц определяется посредством:

На фиг. 5 дополнительный вариант осуществления способа для обнаружения основного тона, в общем, обозначен посредством 50. Способ 50 является аналогичным способу 30, показанному на фиг. 4. Идентичные этапы и сигналы обозначаются посредством идентичных ссылочных позиций, при этом подробно описываются только различия.

Способ 50 предпочтительно используется для нахождения основного тона исходного сигнала s, когда основная частота отсутствует. В случаях когда высокочастотные фильтры применяются к сигналу до обнаружения основного тона, например, как в телефонной речи, основная частота теряется. Обеспечивается способ 50, чтобы приводить основную частоту назад без ухудшения характеристики для нефильтрованных сигналов.

Способ 50 содержит отдельный путь 52 для обеспечения выпрямленного спектра DC фильтрованного сигнала sf.

DC фильтрованный сигнал sf выпрямляется на этапе S16, чтобы обеспечивать выпрямленный сигнал r. Предпочтительно осуществляется двухполупериодное выпрямление DC фильтрованного сигнала sf посредством двухполупериодного выпрямителя. Формула двухполупериодного выпрямителя дается посредством:

За этапом S16 выпрямления следуют этапы S6' по S10', чтобы обеспечивать выпрямленный сжатый спектр амплитуды Rc выпрямленного сигнала. Этапы S6' по S10' являются идентичными этапам S6 по S10, как описано выше. На этапе S17 комбинируются сжатый спектр амплитуды Sc невыпрямленного сигнала sf и выпрямленного сжатого спектра амплитуды Rc. Для уменьшения искажения и для случая, когда выпрямление удаляет основную частоту и вырабатывает только более высокие гармоники, выпрямленный сжатый спектр амплитуды Rc выпрямленного сигнала r и невыпрямленный сигнал s комбинируются, при этом максимум этих спектров выбирается согласно формуле:

где d является масштабирующим коэффициентом и предпочтительно устанавливается на 2. Выходной сигнал из S17 является Rc', максимумом сжатого спектра амплитуды выпрямленного сигнала и невыпрямленного сигнала.

Выходной сигнал из S17 комбинируется с ослабленным сигналом корреляции cw на этапе S14, как описано выше.

Фиг. 6 показывает блок-схему одного варианта осуществления блока 26 обработки, как показано на фиг. 3. Блок 26 обработки согласно фиг. 6 содержит некоторые дискретные элементы или устройства, которые обеспечиваются, чтобы выполнять этапы способа согласно фиг. 4.

Вход 22 соединяется с узкополосным режекторным фильтром 54 DC, выполняющим этап S6. Узкополосный режекторный фильтр 54 DC соединен с оконным элементом 56, выполняющим этап S7. Оконный элемент 56 соединен с элементом 58 преобразования Фурье, выполняющим этап S8. Элемент 58 преобразования Фурье соединен с элементом 60 вычисления абсолютного значения, обеспеченным, чтобы вычислять амплитуду согласно этапу S9. Элемент 60 вычисления абсолютного значения соединен с элементом 62 операции взятия корня, который выполняет этап S10. Элемент 62 операции взятия корня соединен с оконным элементом 64, который обеспечивается, чтобы выполнять этап S11. Оконный элемент 64 соединен с элементом 66 обратного преобразования Фурье, который обеспечивается, чтобы выполнять S12. Элемент обратного преобразования Фурье соединен с оконным элементом 68, который обеспечивается, чтобы выполнять S13. Оконный элемент 68 соединен с элементом 70 комбинирования, который обеспечивается, чтобы выполнять S14. Элемент 62 операции взятия корня также соединен с элементом 70 комбинирования, чтобы обеспечивать сжатый спектр амплитуды Sc в элемент 70 комбинирования. Элемент 70 комбинирования соединен с элементом 72 детектора пикового положения, который обеспечивается, чтобы выполнять этап S15. Элемент 72 обнаружения пикового положения соединен с выходом блока 26 обработки, чтобы обеспечивать основной тон p на выход 24.

Фиг. 7 показывает схематическую блок-схему одного варианта осуществления блока 26 обработки, как показано на фиг. 6. Ссылка делается на фиг. 6, при этом идентичные этапы, элементы и сигналы обозначаются посредством идентичных ссылочных позиций и подробно описываются только различия. Блок 26 обработки согласно фиг. 7 содержит некоторые дискретные элементы или устройства, которые обеспечиваются, чтобы выполнять этапы способа согласно фиг. 5.

Согласно этому варианту осуществления блок 26 обработки из фиг. 7 содержит дополнительный параллельный путь 74, чтобы обеспечивать выпрямленный сжатый спектр амплитуды исходного сигнала s. Путь 74 выполняет этапы пути 52, показанного на фиг. 5. Путь 74 содержит выпрямитель 76, который соединен с узкополосным режекторным фильтром 54 DC, чтобы выполнять этап S16. Выпрямитель 76 соединен с каскадом элементов 54', 56', 58', 60' и 62', которые являются идентичными элементам 54, 56, 58, 60 и 62, соответственно, чтобы выполнять этапы S6', S7', S8', S9' и S10'. Элементы 62 и 62' операции взятия корня соединены с элементом 78 определения максимума, выполняющим этап S17. Элемент 78 определения максимума соединен с элементом 70 комбинирования, выполняющим этап S14.

Фиг. 8 показывает блок-схему одного варианта осуществления блока 26 обработки, как показано на фиг. 3, чтобы выполнять способ согласно фиг. 1. В общем, блок 26 обработки также называется "устройство" или " система".

Блок 26 обработки содержит первый блок 80 преобразования, чтобы выполнять этап S1, блок 82 обработки, чтобы выполнять этап S2, второй блок 84 преобразования, чтобы выполнять этап S3, блок 86 комбинирования, чтобы выполнять этап S4, и блок 88 оценки, чтобы выполнять этап S5.

Таким образом, этапы способов 10, 30 и 50 могут выполняться посредством дискретных элементов в блоке 26 обработки, как упомянуто выше. В альтернативном варианте осуществления этапы способов 10, 30 и 50 могут выполняться посредством блока 26 обработки, который может осуществляться посредством интегральной схемы, такой как FPGA или ASIC или подобное, или который может осуществляться посредством программного обеспечения, исполняемого на компьютере или блоке управления.

В то время как изобретение было проиллюстрировано и описано подробно на чертежах и в предшествующем описании, такая иллюстрация и описание должны рассматриваться иллюстративные или примерные и не ограничительные; изобретение не ограничено раскрытыми вариантами осуществления. Другие изменения в раскрытых вариантах осуществления могут пониматься и осуществляться специалистами в данной области техники при использовании заявленного изобретения на практике, из изучения чертежей, раскрытия и прилагаемой формулы изобретения.

В формуле изобретения признак "содержать" не исключает другие элементы или этапы, и употребление единственного числа не исключает множественность. Одиночный элемент или другой блок может выполнять функции нескольких элементов, перечисленных в формуле изобретения. Простой факт, что некоторые меры перечисляются во взаимно разных зависимых пунктах формулы изобретения, не указывает, что комбинация этих мер не может использоваться для преимущества.

Компьютерная программа может храниться/распространяться на подходящем носителе, таком как оптический запоминающий носитель или твердотельный носитель, поставляемом вместе с или как часть другого аппаратного обеспечения, но также может распространяться в других формах, как, например, посредством сети Интернет или других проводных или беспроводных телекоммуникационных систем.

Любые ссылочные позиции в формуле изобретения не должны толковаться как ограничивающие объем.

1. Способ (10; 30; 50) для оценки структуры в сигнале (s), имеющем периодическую или квазипериодическую составляющую, содержащий этапы:
преобразования (S1; S8) сигнала (s) из временной области в частотную область, чтобы получать спектр (S) сигнала (s),
обработки (S2; S9) спектра (S), чтобы получать спектр нулевой фазы (Sm) сигнала (s),
преобразования (S3; S12) спектра нулевой фазы (S m) сигнала (s) во временную область, чтобы получать сигнал корреляции (с),
комбинирования (S4; S14) спектра (S) и сигнала корреляции (с) в комбинированный спектр (b), и
оценки (S5; S15) структуры на основе комбинированного спектра (b).

2. Способ по п. 1, в котором этап преобразования (S1; S8) сигнала (s) из временной области в частотную область содержит преобразование Фурье (S8).

3. Способ по п. 1 или 2, в котором сигнал обрабатывается (S6) посредством узкополосного режекторного фильтра (54) DC.

4. Способ по п. 3, в котором DC фильтрованный сигнал (S f) умножается (S7) на оконную функцию (32).

5. Способ по п. 1, в котором спектр нулевой фазы (S m) - спектр амплитуды (S m) сигнала (s).

6. Способ по п. 5, в котором спектр амплитуды (S m) сигнала (s) сжимается (S10) в сжатый спектр (S c).

7. Способ по п. 1, в котором спектр (S) сигнала (s) подвергается оконной обработке (S11) посредством оконной функции (34).

8. Способ по п. 1, в котором преобразование (S3; S12) спектра нулевой фазы (S m) сигнала (s) во временную область содержит обратное преобразование Фурье (S12).

9. Способ по п. 1, в котором сигнал корреляции (с) ослабляется (S13) посредством оконной функции (36).

10. Способ по п. 1, в котором комбинирование (S4; S14) спектра (S) и сигнала корреляции (с) содержит повторную дискретизацию по меньшей мере одного из спектра (S) или сигнала корреляции (с).

11. Способ по п. 1, в котором оценка (S5; S15) структуры содержит поиск абсолютного максимума комбинированного сигнала (b).

12. Способ по п. 1, в котором сигнал выпрямляется (S16), в частности, посредством функции двухполупериодного выпрямления.

13. Способ по п. 12, в котором спектр нулевой фазы (R m) выпрямленного сигнала (r) сравнивается (S17) со спектром нулевой фазы (S m) невыпрямленного сигнала (s) и в котором максимум этих сигналов комбинируется (S14) с сигналом корреляции (с), чтобы формировать комбинированный сигнал (b).

14. Устройство (26) для оценки структуры в сигнале (s), имеющем периодическую или квазипериодическую составляющую, содержащее:
первое средство (80) преобразования для преобразования сигнала (s) из временной области в частотную область, чтобы получать спектр (S) сигнала (s),
средство (82) обработки для обработки спектра (S), чтобы получать спектр нулевой фазы (S m) сигнала (s),
второе средство (84) преобразования для преобразования спектра (S) сигнала (s) во временную область, чтобы получать сигнал корреляции (с),
средство (86) комбинирования для комбинирования спектра (S) и сигнала корреляции (с) в комбинированный спектр (b), и
средство (88) оценки для оценки структуры на основе комбинированного спектра (b).

15. Носитель информации, содержащий компьютерную программу, причем компьютерная программа содержит средство программного кода для побуждения компьютера выполнять этапы способа согласно одному из пп. 1-13, когда упомянутая компьютерная программа выполняется на компьютере.



 

Похожие патенты:

Изобретение относится к технологиям кодирования/декодирования аудиоинформации. Техническим результатом является обеспечение понижения амплитудных ограничений.

Изобретение относится к средствам помехоустойчивой классификации режимов кодирования речи. Технический результат заключается в повышении эффективности классификации режимов речи для повышения эффективности многорежимного кодирования с переменной скоростью передачи данных.

Изобретение относится к области связи, в частности к обработке звуковых сигналов, и предназначено для повышения качества принимаемого стереофонического звукового FM-сигнала и выбора соответствующей обработки на основании обнаруженного качества.

Изобретения относятся к области цифровой связи и технологиям обработки речи в условиях зашумления. Технический результат заключается в повышении отношения сигнал-шум очищенного речевого сигнала.

Изобретение относится к средствам обработки функции автокорреляции для измерения основного тона речевого сигнала и может быть использовано в области обработки сигналов, в системах распознавания речи.

Изобретение относится к медицине и предназначено для исследования функционального состояния голосовых складок. Техническим результатом является повышение точности диагностики состояния здоровья индивида по параметрам голосового сигнала.

Изобретение относится к системам анализа речи и может быть использовано для определения эмоционального состояния человека по голосу, применительно к задачам криминалистики, медицины, системам контроля и управления доступом и др.

Группа изобретений относится к средствам для анализа временных вариаций аудио сигналов. Технический результат заключается в создании средств, обладающих повышенной надежностью, для получения параметра, описывающего временные изменения сигнальной характеристики.

Изобретение относится к вычислительной технике. Технический результат заключается в повышении эффективности выделения речевого сигнала в условиях наличия помех.

Изобретение относится к средствам оценки качества аудиосигнала для мультимедийной телекоммуникационной службы. Технический результат заключается в повышении точности определения качества аудиосигнала.

Изобретение относится к средствам для получения пространственных параметров на основе акустического входного сигнала. Технический результат заключается в обеспечении возможности получения пространственных параметров для входного аудиосигнала с минимизированными расхождениями с моделью, связанными с изменениями во времени или временной нестабильностью входного аудиосигнала. Пространственный аудио процессор для обеспечения пространственных параметров на основе входного аудио сигнала включает модуль определения сигнальных характеристик и управляемый модуль определения параметров. Модуль определения сигнальных характеристик настроен определять сигнальную характеристику входного аудио сигнала. Управляемый модуль определения параметров для вычисления пространственных параметров входного аудио сигнала в соответствии с формулой вычисления изменяемого пространственного параметра настроен модифицировать формулу вычисления изменяемого пространственного параметра в соответствии с определенной сигнальной характеристикой. 3 н. и 12 з.п. ф-лы, 10 ил.

Изобретение относится к области обнаружения голосовой активности (VAD). Техническим результатом является сокращение возможности отсечения речи в речевых пакетах за счет более конкретного добавления хвостов сигнала. Способ включает в себя создание сигнала, указывающего на первичное решение VAD, и определение необходимости добавления хвостов сигнала, определение необходимости добавления хвостов сигнала выполняется в зависимости от меры краткосрочной активности и меры долгосрочной активности. Затем создается сигнал, указывающий на окончательное решение VAD. 5 н. и 22 з.п. ф-лы, 9 ил.

Изобретение относится к средствам оценки фонового шума звуковых сигналов. Технический результат заключается в повышении точности детектирования в аудиосигнале речи или музыки. Уменьшают текущее оценочное значение фонового шума, когда определено, что сегмент аудиосигнала содержит музыку и текущее оценочное значение фонового шума превышает минимальное значение. Это должно быть выполнено, когда энергетический уровень сегмента аудиосигнала больше порога, превышающего долговременный минимальный энергетический уровень, который определяется по множеству предыдущих сегментов аудиосигнала, или когда энергетический уровень сегмента аудиосигнала меньше порога, превышающего долговременный минимальный энергетический уровень, но в сегменте аудиосигнала не обнаружена пауза. 7 н. и 4 з.п. ф-лы, 9 ил.

Изобретения относятся к медицине. Система для получения характеристик анатомического параметра верхних дыхательных путей пациента посредством анализа спектральных свойств фрагмента речи содержит механический соединитель, содержащий средство для ограничения положения челюстей пациента, средство для записи фрагмента речи и средство обработки для определения анатомического параметра верхних дыхательных путей по записанному фрагменту речи и сравнения записанного фрагмента речи с пороговым значением. Систему применяют в качестве диагностического инструмента для оценки обструктивного апноэ во сне. При этом ограничивают положение челюстей пациента, записывают фрагмент речи, сравнивают записанный фрагмент речи с пороговым значением и определяют упомянутый анатомический параметр верхних дыхательных путей по записанному фрагменту речи и сравнению записанного фрагмента речи с пороговым значением. Достигается повышение точности измерения анатомического параметра верхних дыхательных путей за счет фиксации челюстей в определенном положении и снижения изменчивости произносимых звуков. 3 н. и 13 з.п. ф-лы, 4 ил.

Изобретение относится к средствам для генерирования расширенного по частоте сигнала. Технический результат заключается в уменьшении необходимого количества побочной информации по сравнению с полным параметрическим описанием недостающих частот. Устройство для генерирования сигнала с улучшенным спектром содержит: вычислитель для вычисления значения, описывающего распределение энергии относительно частоты в основном сигнале; и генератор сигнала для генерирования сигнала расширения, содержащего частотный диапазон расширения, не включенный в основной сигнал, из основного сигнала, при этом генератор сигнала конфигурируется для того, чтобы формировать сигнал расширения или основной сигнал так, чтобы спектральная огибающая сигнала расширения или основного сигнала зависела от значения, описывающего распределение энергии относительно частоты в основном сигнале. 6 н. и 11 з.п. ф-лы, 18 ил.

Изобретение относится к средствам для генерирования сигнала с использованием операции ограничения энергии. Технический результат заключается в повышении качества фрикативных звуков в аудиосигнале. Устройство для генерирования сигнала с улучшенным спектром содержит: генератор сигнала для генерирования сигнала расширения из основного сигнала, причем сигнал расширения содержит частотный диапазон расширения, не включенный в основной сигнал, в котором временная часть сигнала расширения содержит сигналы поддиапазонов для множества поддиапазонов; банк фильтров синтеза для генерирования сигнала, расширенного по частоте, с использованием сигнала расширения, при этом генератор сигнала конфигурируется для того, чтобы выполнить ограничение энергии, чтобы обеспечить, чтобы сигнал, расширенный по частоте, полученный банком фильтров синтеза, был таким, чтобы энергия более высокого частотного диапазона была самое большее равной энергии в более низком частотном диапазоне или была больше, чем энергия более высокого частотного диапазона, самое большее на заранее заданный порог. 6 н. и 12 з.п. ф-лы, 18 ил.

Изобретение относится к средствам для кодирования и декодирования аудиосигнала. Технический результат заключается в создании усовершенствованной концепции кодирования/декодирования аудиоданных, позволяющей уменьшить скорость передачи дополнительной информации для схемы направленного декодирования. Декодер для формирования аудиосигнала с улучшенной частотной характеристикой содержит: блок извлечения свойств из базового сигнала; блок извлечения дополнительной информации для выбора, ассоциированной с базовым сигналом; генератор параметров для формирования параметрического представления для оценки спектрального диапазона аудиосигнала с улучшенной частотной характеристикой, не определяемого базовым сигналом, причем генератор параметров выполнен с возможностью обеспечения некоторого количества альтернативных параметрических представлений в ответ на упомянутое свойство. Генератор параметров выполнен с возможностью выбора одного из альтернативных параметрических представлений в ответ на дополнительную информацию для выбора. 6 н. и 11 з.п. ф-лы, 16 ил.

Изобретение относится к области микширования звука, передаваемого в потоковом режиме мобильным устройством. Технический результат заключается в обеспечении приглушения аудиоданных транспортного средства для звуковых указаний от мобильных приложений. Технический результат достигается за счет воспроизведения аудиоданных в транспортном средстве от одного из множества различных источников аудиоданных, приема в транспортном средстве от мобильного вычислительного устройства беспроводного сигнала, представляющего звуковое указание, которое должно быть воспроизведено в транспортном средстве, определения степени приглушения аудиоданных на основе источника аудиоданных, когда вычислительная система транспортного средства воспроизводит аудиоданные в транспортном средстве во время приема беспроводного сигнала от мобильного вычислительного устройства, и приглушения воспроизводимых аудиоданных и воспроизведения звуковых указаний. 3 н. и 17 з.п. ф-лы, 4 ил.

Изобретение относится к области обработки информации. Техническим результатом является расширение арсенала технических средств для обработки информации. Система обработки информации включает в себя: модуль распознавания, выполненный с возможностью распознавания первой цели, расположенной в первом месте, на основе множества первых сигналов, детектируемых множеством первых датчиков, размещенных вокруг конкретного пользователя, расположенного во втором месте; модуль идентификации, выполненный с возможностью идентификации первой цели, распознанной модулем распознавания; модуль оценки, выполненный с возможностью оценивать положение конкретного пользователя на основе первого сигнала, детектируемого одним из множества первых датчиков; и модуль обработки сигналов, выполненный с возможностью: модификации каждого из множества вторых сигналов, полученных из множества вторых датчиков, размещенных вокруг первой цели, на основе параметра акустической информации третьего места, отличного от первого и второго места; и вывода модифицированного множества вторых сигналов из множества исполнительных элементов, размещенных вокруг конкретного пользователя, таким образом, что модифицированное множество вторых сигналов локализуется рядом с оцененным положением конкретного пользователя. 4 н. и 13 з.п. ф-лы, 29 ил.

Изобретение относится к решению относительно наличия/отсутствия вокализации для обработки речи. Технический результат заключается в усовершенствованном и более надежном обнаружении невокализованной/вокализованной речи. Способ обработки речи включает этапы: определение параметра наличия/отсутствия вокализации в текущем кадре речевого сигнала, который является комбинированным параметром, отражающим произведение параметра периодичности и параметра спектрального наклона; определение сглаженного параметра наличия/отсутствия вокализации для включения информации параметра наличия/отсутствия вокализации в предшествующий кадр; вычисление разности между параметром наличия/отсутствия вокализации в текущем кадре и сглаженным параметром и определение, содержит ли текущий кадр невокализованную речь или вокализованную речь, с использованием вычисленной разности в качестве параметра принятия решения. 2 н. и 18 з.п. ф-лы, 15 ил.
Наверх