Способ управления расходом битов и устройство для нормализации качества визуального изображения

Изобретение относится к кодированию видеоинформации. Технический результат заключается в снижении дисперсии пикового отношения уровня сигнала к шуму в основанном на вейвлетах масштабируемом видеокодировании. Способ содержит определение количества битов для каждого из множества блоков кодирования из потока битов, генерируемого посредством кодирования исходной движущейся картинки, чтобы обеспечить однородное качество визуального изображения движущейся картинки относительно ее блоков кодирования, и извлечение потока битов, имеющего это количество битов, посредством отбрасывания части потока битов на основании упомянутого определенного количества битов. 4 н. и 14 з.п. ф-лы, 10 ил., 2 табл.

 

Область техники, к которой относится изобретение

Настоящее изобретение относится к кодированию видеоинформации. Более конкретно настоящее изобретение относится к способу и устройству для управления расходом битов (битрейтом) при помощи информации, доступной для устройства предварительного декодирования, чтобы снизить до минимума дисперсию пикового отношения уровня сигнала к шуму (PSNR) в основанном на вейвлетах масштабируемом видеокодировании, используя устройство предварительного декодирования.

Предшествующий уровень техники

Масштабируемое видеокодирование (обеспечивающее возможность частичного декодирования при различных разрешающих способностях, уровня качества и временных уровнях из единого сжатого потока битов) широко считается перспективной технологией для эффективного представления и передачи сигналов в неоднородных средах. Хотя стандарт масштабируемости качества (FGS) MPEG-4 (Экспертной группы по вопросам движущегося изображения) установлен как стандарт видеокодирования, масштабируемого по отношению сигнал-шум (SNR) и времени, множество схем основанного на вейвлетах масштабируемого видеокодирования уже демонстрировали свой потенциал в плане масштабируемости по SNR, пространству и времени. Детализированная информация относительно FGS MPEG-4 может быть получена из доклада, опубликованного W.Li, "Overview of fine granularity scalability in MPEG-4 video standard", (IEEE Trans. Circuits Syst. Video Technol, том.11, стр.301-317, март 2001 г.).

Фиг.1 представляет блок-схему, иллюстрирующую полную конфигурацию видеокодека, основанного на обычном подходе оптимизации расхода в зависимости от искажения (R-D). Видеокодек 100 включает в себя модуль 130 управления расходом, который выбирает оптимальный шаг квантования или количество оптимальных битов для каждого блока кодирования, кодер 110, который генерирует поток 40 битов, полоса пропускания которого ограничена, и декодер 120, который восстанавливает последовательности 20 изображений из потока 40 битов ограниченной полосы пропускания. В предшествующем уровне техники управление расходом выполняется только в кодере 110.

Фиг.2 представляет блок-схему, иллюстрирующую рабочую конфигурацию основанного на вейвлетах масштабируемого видеокодека согласно предшествующему уровню техники.

Хотя алгоритмы управления расходом в общем улучшают функциональные характеристики R-D, все известные способы используют информацию о погрешности предсказания, которая используется только на стадии кодирования, и это подразумевает, что управление расходом должно быть выполнено в кодере 210. Для большинства прикладных программ, для которых требуются полностью масштабируемые видеокодеры, кодер 210 должен генерировать достаточно большой поток 35 битов для того, чтобы устройство предварительного декодирования или транскодер 220 извлекал надлежащее количество битов 40 из потока битов, принимая во внимание требования к качеству, временные и пространственные требования. Условия для извлечения соответствующей величины потока битов, согласующиеся с требованиями к качеству, временными и пространственными требованиями, упоминаются как условия масштабируемости. Тогда декодер 230 может восстанавливать видеопоследовательность 20 из усеченного потока 40 битов.

Управление расходом должно выполняться вместо кодера в устройстве 220 предварительного декодирования, потому что фактический битрейт определяется в устройстве 220 предварительного декодирования. Были проведены некоторые исследования относительно алгоритмов управления расходом в устройстве 220 предварительного декодирования, и большая часть исследований была сконцентрирована на схеме постоянного расхода битов (CBR). Однако г-н Хсианг (Mr. Hsiang) предлагает схему изменяемого расхода битов (VBR) в его диссертации доктора философии, "Highly scalable subband/wavelet image and video coding" (Rensselaer Polytechnic Institute, Нью-Йорк, январь 2002 г.), которую можно также использовать в устройстве предварительного декодирования (в дальнейшем упоминаемую как "схема Хсианга"). В этой схеме вейвлетные битовые плоскости элементарной волны, используемые в устройстве предварительного декодирования, идентичны по количеству, с целью улучшения функциональных характеристик обычной схемы CBR.

Ниже схема Хсианга будет подробно описана.

В последующем описании передаваемая видеоинформация может быть разбита на множество групп картинок (GOP), где каждая GOP имеет множество кадров. Это может упростить алгоритм выделения расходов, поскольку каждая GOP закодирована отдельно. Таким образом, каждая GOP является независимой от других, однако, каждый из кадров в GOP сильно связан с другими. Если Вт представляет суммарные биты для всей видеопоследовательности, которая состоит из N GOP, проблема выделения расходов может быть сформулирована как

где R(i) - выделенные биты для i-й GOP, a D(i) - абсолютная разность между исходными и декодированными кадрами. Фундаментальный аспект способа VBR заключается в выделении большего количества битов относительно сложным сценам и меньшего количества битов остальным, чтобы достигать лучших функциональных характеристик R-D или качества визуального изображения. Если мы определяем сложность сцены как степень трудности для кодирования данного кадра изображения, количество выделенных битов для GOP, с постоянным количеством используемых вейвлетных битовых плоскостей, является сильно в высокой степени коррелированным с относительной сложностью сцены среди групп GOP. Из этого факта вытекает, что схема Хсианга предлагает, чтобы схема VBR уравнивала количество битовых плоскостей, используемых для всех кадров.

Если b(i, j) - количество закодированных битов для i-й GOP и j-й битовой плоскости, a B(i, k) представляет количество накопленных закодированных битов, использующих k битовых плоскостей, то B(i, k) определяется как

Если количество используемых битовых плоскостей является постоянной величиной К для всех кадров, то B(i, К) дает некоторую статистику сложности сцены для i-ro кадра с общим количеством выделенных битов, А(К), задаваемых формулой

где N - общее количество GOP. Если К* представляет целое число битовых плоскостей, общее количество выделенных битов которых близко к ВТ, окончательные выделенные биты для i-й GOP, R0(i), можно задавать выражением

где

При использовании метода линейной интерполяции может оказаться возможным получить более точную статистику сложности сцены, делая суммарно количество закодированных битов равными ВТ.

Раскрытие сущности изобретения

Техническая проблема

Основанное на вейвлетах масштабируемое видеокодирование по существу использует свойство внедрения, и таким образом, оно является подходящим для использования в алгоритме изменяемого расхода битов (VBR). В этом отношении, хотя схема Хсианга проста и эффективна, необходимо ее дальнейшее усовершенствование, чтобы снизить разброс значений PSNR, поскольку она концентрируется просто на снижении до минимума меры объективных погрешностей. Даже если среднее PSNR является достаточно высоким, в кадрах с низким PSNR могут наблюдаться заметные визуальные артефакты, если дисперсия PSNR высока. Поэтому полезно иметь схему выделения битов, которая снижает до минимума дисперсию PSNR.

Техническое решение

Ввиду вышеизложенного обеспечен способ выделения битов с использованием информации, доступной на стороне устройства предварительного декодирования, чтобы обеспечить возможность стороне декодера иметь оптимальное качество.

Также обеспечен способ выделения изменяемых расходов битов, чтобы снизить до минимума дисперсию PSNR в основанном на вейвлетах масштабируемом видеокодировании.

Согласно аспекту настоящего изобретения обеспечен способ управления расходом битов визуального изображения движущейся картинки, содержащий первый этап определения количества битов для каждого блока кодирования из потока битов, генерируемого посредством кодирования исходной движущейся картинки, чтобы обеспечить однородное качество визуального изображения движущейся картинки относительно ее блоков кодирования; и второй этап извлечения потока битов, имеющего требующееся количество битов, посредством отбрасывания части потока битов на основании упомянутого определенного количества битов.

Согласно другому аспекту настоящего изобретения обеспечено устройство управления расходом битов визуального изображения движущейся картинки, содержащее первое средство для определения количества битов для каждого блока кодирования из потока битов, генерируемого посредством кодирования исходной движущейся картинки, чтобы сделать качество визуального изображения движущейся картинки однородным относительно ее блоков кодирования; и второе средство для извлечения потока битов, имеющего требующееся количество битов, посредством отбрасывания части потока битов на основании упомянутого определенного количества битов.

Согласно еще одному аспекту настоящего изобретения обеспечен машиночитаемый носитель записи, на котором записан код компьютерной программы для обеспечения на компьютере способа согласно настоящему изобретению.

Перечень чертежей

Вышеупомянутые и другие цели, признаки и преимущества настоящего изобретения станут очевидными из последующего подробного описания примерных вариантов осуществления, приведенного в связи с прилагаемыми чертежами, на которых:

фиг.1 - блок-схема, иллюстрирующая полную конфигурацию видеокодека, основанного на подходе оптимизации битрейта в зависимости от искажения;

фиг.2 - блок-схема, иллюстрирующая рабочую конфигурацию основанного на вейвлетах масштабируемого видеокодека согласно предшествующему уровню техники;

фиг.3 - блок-схема, иллюстрирующая рабочую конфигурацию основанного на вейвлетах масштабируемого видеокодека согласно примерному варианту осуществления настоящего изобретения;

фиг.4 - график, иллюстрирующий сравнение D(i)/D и B(i, К*) в закодированной последовательности QCIF (вариант общего формата обмена сжатыми видеоданными с вчетверо уменьшенным разрешением) Сапоа;

фиг.5 - график, иллюстрирующий битрейт, выделенный для каждой GOP в последовательности QCIF Football;

фиг.6 - график, иллюстрирующий среднее PSNR для каждой GOP в последовательности QCIF Football;

фиг.7 и 8 - примеры 92-го кадра последовательности QCIF Foreman, закодированной для VBR-D и VBR-N соответственно; и

фиг.9 и 10 - примеры 106-го кадра последовательности QCIF Foreman, закодированной для VBR-D и VBR-N соответственно.

Вариант осуществления изобретения

В дальнейшем будет подробно описан примерный вариант осуществления настоящего изобретения со ссылкой на прилагаемые чертежи.

Фиг.3 представляет блок-схему, иллюстрирующую рабочую конфигурацию основанного на вейвлетах масштабируемого видеокодека согласно примерному варианту осуществления настоящего изобретения.

Масштабируемый видеокодек 300 включает в себя кодер 310, который кодирует исходную движущуюся картинку 10, чтобы генерировать достаточно большой поток 35 битов; модуль 340 управления расходом, который выделяет оптимальное количество битов для каждого блока кодирования, основываясь на битрейте 30, требуемом потребителем; устройство 320 предварительного декодирования, которое принимает поток 35 битов и извлекает поток 40 битов, имеющий соответствующее количество битов, посредством отбрасывания части принимаемого потока 35 битов на основании оптимального количества битов, выбираемых в модуле 340 управления расходом; и декодер 330, который декодирует последовательности изображений движущейся картинки из извлеченного потока 40 битов, чтобы восстанавливать исходную движущуюся картинку.

В частности, настоящее изобретение сосредоточено на операции, выполняемой в модуле 340 управления расходом. Модуль 340 управления расходом содержит четыре этапа и исполняет этап задания функции расхода битов, доступной для использования в устройстве 320 предварительного декодирования, посредством использования распределения битов и функции искажения с постоянным количеством битовых плоскостей, этап предварительного суммирования расхода битов посредством модифицирования функции расхода битов, чтобы таким образом получать однородное качество визуального изображения, этап аппроксимирования функции искажения с использованием распределения битов, для определения функции искажения, и этап нормализации модифицированной функции расхода битов, чтобы обеспечить общие выделенные расходы битов равными целевому расходу битов. Поскольку оцениваемое качество визуального изображения картинки в общем основано на PSNR, PSNR также используется в настоящем изобретении в качестве критерия для оценки качества. Кроме того, информация о среднем абсолютном распределении (MAD), используемая в известном кодере, заменена распределением битов постоянного количества битовых плоскостей в качестве функции сложности сцены.

Теперь будет описан этап задания функции расхода битов, доступной для использования в устройстве предварительного декодирования, посредством использования распределения битов и функции искажения с постоянным количеством битовых плоскостей. Подобно формуле 6, предположим, что исходная статистика подчиняется распределению Лапласа.

где α - константа.

Если в качестве меры искажения используется другая функция, то для функции искажения расхода имеется решение в аналитическом виде, как получено в формуле 7. D(i) обозначает функцию искажения, указывая различие между исходным изображением и окончательным изображением после разуплотнения.

Функцию R-D можно дополнительно модифицировать, вводя два новых параметра: MAD и нетекстурные служебные данные, формула 8.

В формуле 8 H(i) обозначает биты, используемые для информации заголовка и векторов движения, a M(i) обозначает MAD, вычисленное с использованием остатка, в отношении которого выполнена компенсация движения, для компонента яркости. MAD включено в функцию R-D, чтобы учитывать сложность сцены, поскольку должно использоваться большее количество битов для относительно сложных кадров и меньшее количество битов для других кадров при одном и том же ограничении целевого расхода битов.

Хотя в обычной схеме VBR используется B(i, К*) в качестве выделенных битов, настоящее изобретение использует B(i, К*) для замены M(i), поскольку B(i, К*) в высокой степени коррелировано со сложностью сцены для i-й GOP. Заменяя M(i) на B(i, К*), получим следующее

Для простоты обозначений нетекстурные служебные данные, H(i), в формуле 9 и остальной части текста этого описания не рассматриваются, поскольку это является тривиальной проблемой. В предварительных экспериментах, выполненных изобретателями, было показано, что при выборе оптимального значения α эта замена является приемлемой для многих комбинаций битрейтов, разрешающей способности и последовательностей.

Этап предварительного суммирования расхода битов получает однородное качество визуального изображения посредством модифицирования функции расхода битов, и теперь он будет описан.

Если D является средним значением D(i) для всех GOP, то прибавление ln(D(i)/D) к обеим сторонам формулы 9 дает

где

Поскольку правая сторона формулы 10 представляет собой постоянную величину, из этого следует, что выделение R′(i) битов для i-й GOP приводит к постоянному искажению. Для получения R′(i) следует вычислить R(i) и ln(D(i)/D), как показано в формуле 11. Однако это может быть трудной проблемой, поскольку в устройстве предварительного декодирования фактическое искажение D(i) не может быть определено.

Теперь будет описан этап аппроксимирования функции искажения при помощи распределения битов, чтобы определить функцию искажения.

Для решения вышеупомянутой проблемы начальное выделение R(i) битов сначала устанавливается равным R0(i), как описано выше, и D(i)/D оценивается с помощью некоторых аппроксимаций. В формуле 11 D(i)/D представляет собой отношение относительной величины искажения к среднему искажению. Поскольку относительная величина искажения увеличивается с увеличением сложности сцены, полагается, что D(i)/D может быть представлено в виде функции сложности сцены, B(i, К*), как представлено

где

и r - экспериментальная константа, используемая для компенсирования нелинейности между фактическим искажением и выделенными битами. Фиг.4 показывает график сравнения D(i)/D и B(i, К*)/В в последовательности QCIF Canoa, закодированной при 512 кбит/с со значением r=0,4. Как показано на фиг.4, D(i)/D может быть грубо смоделировано с помощью относительной сложности сцены, B(i, К*)r/В. Кроме того, всесторонние предварительные эксперименты показали, что значение r=0,4 является удовлетворительным почти для всех условий испытаний.

Подставляя формулу 12 в формулу 11, получим

Теперь будет описан этап нормализации модифицированной функции расхода битов с целью обеспечения того, чтобы суммарные выделенные расходы битов были равны целевому расходу битов.

Поскольку R′(i) модифицировано из R(i) без учета ограничения расхода битов, R′(i) должно быть нормализовано, чтобы удовлетворять необходимому условию целевого расхода битов. Простая нормализация дает окончательное уравнение, определенное как

где Rn(i) _ выделенные биты для i-й GOP, которые могут сглаживать искажение.

CBR указывает, что обычная схема для постоянного выделения расходов битов, VBR-D, показывает изменяемое выделение расходов в соответствии со схемой Хсианга, a VBR-N показывает изменяемое выделение расходов в соответствии с настоящим изобретением. Как показано в таблице 1, схема VBR-N явно превосходит по функциональным характеристикам схемы CBR QCIF Foreman и QCIF Canoa до 0,9 и 0,6 дБ соответственно благодаря эффективной реализации схемы VBR-N адаптивного способа выделения битов. Кроме того, все интервалы функциональных характеристик между VBR-D и VBR-N ограничены в пределах приблизительно 0,2 дБ для обеих последовательностей.

Таблица 1
Битрейт (кбит/с)CBRVBR-DVBR-N
Foreman QCIF при 30 Гц
6427,5727,9827,80
12832,3032,9332,71
25636,4037,0536,90
38438,9139,4039,31
51240,7341,2141,17
76843,6343,9743,91
Canoa QCIF при 30 Гц
6423,4323,5923,54
12826,3426,4826,41
25629,2629,4229,40
38431,3931,5331,50
51233,2733,4433,40
76836,3136,4836,46

Таблица 2 показывает стандартное отклонение значений PSNR с использованием CBR, VBR-D и VBR-N. Во-первых, эта таблица выявляет, что схемы VBR-D и VBR-N снижают стандартное отклонение PSNR больше, чем схема CBR. В стандартном отклонении PSNR, получаемого на каждый кадр, VBR-N снижает его на величину от 23 до 50,8% по сравнению с VBR-D, хотя это явно не показано. Поскольку VBR-N использует методику оптимизации, основанную на GOP, процент снижения становится очень большим, в стандартном отклонении PSNR, получаемого каждой GOP, так называемое стандартное отклонение среднего по GOP PSNR. Это демонстрирует, что схема VBR-N более эффективна в создании пологой кривой суммарного PSNR. Что касается таблицы 2, то в ней VBR-N снижает стандартное отклонение среднего по GOP PSNR на 26,1-89,7% по сравнению с VBR-D.

Таблица 2
Битрейт (кбит/с)CBRVBR-DVBR-N1-VBR-N/VBR-D(%)
Foreman QCIF при 30 Гц
641,931,510,7351,7
1282,441,921,0047,7
2562,331,690,4871,3
3842,061,340,2680,9
5121,891,190,2579,4
7681,610,970,3267,5
Canoa QCIF при 30 Гц
641,291,100,8126,1
1281,230,980,5049,1
2561,220,880,2374,0
3841,170,750,0889,7
5121,140,760,1087,4
7681, 120,690,2169,2

Фиг.5 представляет график, иллюстрирующий битрейт, выделенный для каждой GOP в последовательности QCIF Football, a фиг.6 представляет график, иллюстрирующий среднее PSNR для каждой GOP в последовательности QCIF Football. QCIF Football закодирована при среднем битрейте 512 кбит/с. Кроме того, мы иллюстрируем усредненное по GOP PSNR вместо PSNR кадра, чтобы исследовать общую пологость кривой PSNR. На фиг.5 битрейты CBR почти постоянные, а битрейты -D и VBR-N сильно изменяются, поскольку они оптимизированы в соответствии с характеристиками сцены, которые сильно изменяются. С другой стороны, кривая усредненного по GOP PSNR для VBR-N является значительно более пологой, чем кривые для CBR и VBR-D.

Фиг.7, 8, 9 и 10 иллюстрируют несколько примеров кодирования последовательности QCIF Foreman.

Фиг.7 иллюстрирует 92-й кадр (PSNR=38,02), генерируемый VBR-D, а фиг.8 иллюстрирует 92-й кадр (PSNR=39,94), генерируемый VBR-N в той же самой позиции.

Как показано на этих фигурах, VBR-N значительно снижает помехи изображения. Это является естественным результатом, поскольку VBR-N может сглаживать кривую PSNR со слегка меньшим средним PSNR, таким образом, минимальное значение PSNR значительно увеличивается.

Фиг.9 иллюстрирует 106-й кадр (PSNR=44,05), генерируемый VBR-D, а фиг.10 иллюстрирует 106-й кадр (PSNR=44,02), генерируемый VBR-N.

Как показано на этих фигурах, хотя значение PSNR VBR-D выше, чем значение PSNR VBR-N, фактическое качество визуального изображения почти одинаковое, потому что оба значения PSNR являются достаточно высокими, чтобы делать артефакты кодирования незаметными. Это свойство очень полезно для субъективного качества визуального изображения, потому что качеством визуального изображения можно управлять с большим акцентом на восприятие посредством улучшения PSNR кадров низкого качества, принося в жертву PSNR кадров очень хорошего качества.

Промышленная применимость

Согласно настоящему изобретению стандартное отклонение PSNR может быть значительно снижено при поддержании фактически почти среднего PSNR. Это свойство очень полезно для субъективного качества визуального изображения, потому что качеством визуального изображения можно управлять с большим акцентом на восприятие посредством улучшения PSNR кадров низкого качества, принося в жертву PSNR кадров очень хорошего качества.

Согласно настоящему изобретению поскольку используется информация, доступная только на стороне устройства предварительного декодирования, устройство предварительного декодирования не нуждается ни в какой дополнительной информации.

Хотя настоящее изобретение было описано в связи с предпочтительным вариантом осуществления настоящего изобретения, специалистам в данной области техники будет очевидно, что в нем можно делать различные модификации и изменения, не выходя при этом за рамки объема и сущности данного изобретения. Поэтому должно быть понятно, что приведенный выше вариант осуществления является не ограничительным, а иллюстративным во всех аспектах. Объем настоящего изобретения определен скорее прилагаемой формулой изобретения, чем подробным описанием изобретения. Все модификации и изменения, полученные из объема, определяемого формулой изобретения и ее эквивалентами, должны рассматриваться как включенные в объем настоящего изобретения.

1. Способ управления расходом битов визуального изображения движущейся картинки, содержащий

определение количества битов для каждого из множества блоков кодирования из потока битов, генерируемого посредством кодирования исходной движущейся картинки, чтобы обеспечить однородное качество визуального изображения движущейся картинки относительно ее блоков кодирования, и

извлечение потока битов, имеющего это количество битов, посредством отбрасывания части потока битов на основании упомянутого определенного количества битов.

2. Способ по п.1, в котором для измерения качества визуального изображения в качестве опорного уровня используется пиковое отношение сигнала к шуму (PSNR).

3. Способ по п.1, в котором поток битов, генерируемый кодером, соответствует схеме основанного на вейвлетах видеокодирования и модифицируется адаптивно к условию масштабируемости устройством предварительного декодирования.

4. Способ по п.2, в котором сглаживание опорного уровня измерения качества выполняется посредством увеличения количества битов, выделяемых для первого блока кодирования, и уменьшения количества битов, выделяемых для второго блока кодирования, и при этом первый блок кодирования имеет изображение более низкого качества, чем второй блок кодирования.

5. Способ по п.1, в котором определение количества битов включает в себя

задание функции скорости передачи в битах, доступной в устройстве предварительного декодирования, используя распределение битов и функцию искажения с постоянным количеством битовых плоскостей, и

установление расхода битов посредством модифицирования функции расхода битов, чтобы получить однородное качество визуального изображения.

6. Способ по п.5, в котором определение количества битов дополнительно включает в себя первоначальную аппроксимацию функции искажения, с использованием упомянутого распределения битов, для определения функции искажения с помощью информации, используемой в устройстве предварительного декодирования.

7. Способ по п.6, в котором определение количества битов дополнительно включает в себя нормализацию функции расхода битов посредством модифицирования функции расхода битов так, чтобы суммарный выделенный расход битов был равен целевому расходу битов.

8. Устройство управления расходом битов визуального изображения движущейся картинки, содержащее

первое средство для определения количества битов для каждого из множества блоков кодирования из потока битов, генерируемого посредством кодирования исходной движущейся картинки, чтобы сделать качество визуального изображения движущейся картинки однородным относительно ее блоков кодирования, и

второе средство для извлечения потока битов, имеющего это количество битов, посредством отбрасывания части потока битов на основании упомянутого определенного количества битов.

9. Устройство по п.8, в котором поток битов, создаваемый кодером, который соответствует схеме основанного на вейвлетах видеокодирования, модифицируется адаптивно к условию масштабируемости устройством предварительного декодирования.

10. Устройство по п.8, в котором первое средство включает в себя средство для задания функции расхода битов, доступной в устройстве предварительного декодирования, используя распределение битов и функцию искажения с постоянным количеством битовых плоскостей, и установления расхода битов посредством модифицирования функции расхода битов, чтобы получить однородное качество визуального изображения.

11. Устройство по п.10, в котором первое средство дополнительно включает в себя средство для первоначальной аппроксимации функции искажения, с использованием упомянутого распределения битов, для определения функции искажения с помощью информации, используемой в устройстве предварительного декодирования.

12. Устройство по п.10, в котором первое средство дополнительно включает в себя средство для нормализации функции расхода битов посредством модифицирования функции расхода битов так, чтобы суммарный выделенный расход битов равнялся целевому расходу битов.

13. Машиночитаемый носитель записи, на котором записан код компьютерной программы для обеспечения на компьютере способа управления расходом битов визуального изображения движущейся картинки, содержащего

определение количества битов для каждого из множества блоков кодирования из потока битов, генерируемого посредством кодирования исходной движущейся картинки, чтобы обеспечивать однородное качество визуального изображения движущейся картинки относительно ее блоков кодирования, и

извлечение потока битов, имеющего это количество битов, посредством отбрасывания части потока битов на основании упомянутого определенного количества битов.

14. Устройство управления расходом битов визуального изображения движущейся картинки, содержащее

модуль определения, определяющий количество битов для каждого из множества блоков кодирования из потока битов, генерируемого посредством кодирования исходной движущейся картинки, чтобы сделать качество визуального изображения движущейся картинки однородным относительно ее блоков кодирования, и

модуль извлечения, извлекающий поток битов, имеющий это количество битов, посредством отбрасывания части потока битов на основании упомянутого определенного количества битов.

15. Устройство по п.14, в котором поток битов, создаваемый кодером, соответствует схеме основанного на вейвлетах видеокодирования и модифицируется адаптивно к условию масштабируемости устройством предварительного декодирования.

16. Устройство по п.14, в котором модуль определения включает в себя модуль задания, задающий функцию расхода битов, доступную в устройстве предварительного декодирования, используя распределение битов и функцию искажения с постоянным количеством битовых плоскостей, и модуль предварительного суммирования, модифицирующий функцию расхода битов, чтобы получить однородное качество визуального изображения.

17. Устройство по п.16, в котором модуль определения дополнительно включает в себя модуль аппроксимирования, который первоначально аппроксимирует функцию искажения, с использованием упомянутого распределения битов, чтобы определять функцию искажения с помощью информации, используемой в устройстве предварительного декодирования.

18. Устройство по п.16, в котором модуль определения дополнительно включает в себя модуль нормализации, нормализующий функцию расхода битов посредством модифицирования функции расхода битов так, чтобы суммарный выделенный расход битов равнялся целевому расходу битов.



 

Похожие патенты:

Изобретение относится к устройствам и способам для внедрения и обнаружения водяных знаков в информационных сигналах. .

Изобретение относится к способу кодирования последовательностей картинок в битовый поток, в котором параметры заданы в наборе параметров и каждая картинка содержит информацию об одной или нескольких секциях.

Изобретение относится к области цифровой обработки изображений и может быть использовано при передаче изображений по низкоскоростным каналам связи. .

Изобретение относится к способу кодирования и декодирования цифровых данных, переданных методом приоризированной передачи пикселей или хранящихся в памяти. .

Изобретение относится к способу модификации данных во входном кодированном видеосигнале для генерации выходного масштабированного видеосигнала, скомпанованного из основного видеосигнала и набора из, по меньшей мере, одного видеосигнала повышения качества, причем способ содержит, по меньшей мере, этап декодирования ошибки для генерации сигнала декодированных данных из входного кодированного видеосигнала, первый этап повторного кодирования для генерации основного видеосигнала из сигнала промежуточных данных, полученного сложением сигнала с компенсацией движения и сигнала декодированных данных, этап реконструкции для генерации ошибки кодирования основного видеосигнала, этап компенсации движения для генерации сигнала с компенсацией движения на основе ошибки кодирования, второй этап повторного кодирования для генерации видеосигнала повышения качества на основе ошибки кодирования.

Изобретение относится к области сжатия данных видеосигнала и может быть использовано для кодирования и декодирования видеоданных. .

Изобретение относится к области радиотехники и может быть использовано для цифровой обработки видеосигналов, передающих изображение. .

Изобретение относится к области радиотехники и телевидения и может быть использовано при формировании, передаче и приеме видеокадров. .

Изобретение относится к системам передачи видеоданных и связанным с ними способам кодирования/декодирования, а также к системе сжатия видеоданных, использующей встраивание в видеоданные «водяных знаков», в которой должна обнаруживаться любая подделка видеоизображения или части изображения.

Изобретение относится к кодированию изображения и, в частности, к устройству кодирования изображения и способу для повышения коэффициента сжатия видеосигнала посредством предсказания сдвига с использованием согласования поворота

Изобретение относится к области техники обработки изображений и, в частности, к способу кодирования видеоизображения с использованием межуровневой фильтрации

Изобретение относится к системам для имитирования зернистости фотопленки в изображении

Изобретение относится к технологии имитации зерна пленки в изображении

Изобретение относится к технологии сжатия видео и, более конкретно, к фильтру устранения блочности, используемому в кодере/декодере многослойного видео

Изобретение относится к системе для кодирования видеоданных и/или системе для декодирования видеоданных

Изобретение относится к способу имитации зернистости пленки при последующем декодировании закодированных изображений

Изобретение относится к системам обработки изображения, которые можно применять для кодирования изображения на пленке, с использованием кодирования MPEG-4 AVC (или Н.264)

Изобретение относится к способу имитации зернистости пленки в изображении
Наверх