Интерполяция на основе искажений в зависимости от скорости передачи для кодирования видео на основе неперестраиваемого фильтра или адаптивного фильтра

Авторы патента:

Е Янь (US)

КАРЧЕВИЧ Марта (US)

H04N19/587 - Передача изображений, например телевидение (измерения, испытания G01; системы для оригиналов рукописей например, пишущие телеграфные аппараты, которые рассматриваются в подклассе G08; накопление информации, основанное на относительном перемещении носителя записи и преобразователя G11B; кодирование; декодирование или преобразование кодов вообще H03M; радиовещание или регистрация использования радиосети H04H)

Владельцы патента RU 2505938:

КВЭЛКОММ ИНКОРПОРЕЙТЕД (US)

Изобретение относится к технологиям фильтрации, применяемым для того, чтобы формировать прогнозирующие данные, используемые при кодировании и декодировании видео. Техническим результатом является повышение точности прогнозирующих данных, используемых во время дробной интерполяции, и в некоторых случаях улучшение прогнозирующих данных целых блоков пикселов. Указанный технический результат достигается тем, что предложена поддержка фильтра на двенадцать пикселов, который может использоваться для интерполяции, технологии, которые используют симметрию по коэффициентам и симметрию по пикселам, чтобы уменьшать объем данных, необходимых для передачи между кодером и декодером, чтобы конфигурировать поддержку фильтра для интерполяции, и технологии для фильтрации данных в целопикселных местоположениях способом, который является аналогичным субпикселной интерполяции. Другие аспекты касаются технологий для кодирования информации в потоке битов, чтобы передавать тип используемого фильтра и используемые коэффициенты фильтрации, а также описано прогнозирующее кодирование коэффициентов фильтрации. 4 н. и 43 з.п. ф-лы, 29 ил.

Данная заявка испрашивает приоритет предварительной заявки США 61/044020, поданной 10 апреля 2008 года, предварительной заявки США 61/044023, поданной 10 апреля 2008 года, предварительной заявки США 61/044240, поданной 11 апреля 2008 года, и предварительной заявки США 61/057373, поданной 30 мая 2008 года, все содержимое которых включено в настоящий документ посредством ссылки.

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Данное раскрытие сущности относится к кодированию и декодированию цифрового видео, а более конкретно, к технологиям фильтрации, применяемым для того, чтобы формировать прогнозирующие данные, используемые при кодировании и декодировании видео.

УРОВЕНЬ ТЕХНИКИ

Возможности цифрового видео могут быть встроены в широкий диапазон устройств, в том числе в цифровые телевизоры, системы цифровой прямой широковещательной передачи, беспроводные широковещательные системы, персональные цифровые устройства (PDA), дорожные или настольные компьютеры, цифровые камеры, цифровые записывающие устройства, устройства видеоигр, консоли видеоигр, сотовые или спутниковые радиотелефоны и т.п. Цифровые видеоустройства реализуют технологии сжатия видео, такие как описанные в стандартах, заданных посредством MPEG-2, MPEG-4 или ITU-T H.264/MPEG-4, часть 10, усовершенствованное кодирование видео (AVC), чтобы более эффективно передавать и принимать цифровую видеоинформацию. Технологии сжатия видео могут выполнять пространственное прогнозирование и/или временное прогнозирование, чтобы уменьшать или удалять избыточность, внутренне присутствующую в видеопоследовательностях.

Взаимное кодирование на основе блоков является полезной технологией кодирования, которая основана на временном прогнозировании, чтобы уменьшать или удалять временную избыточность между видеоблоками последовательных кодированных единиц видеопоследовательности. Кодированные единицы могут содержать видеокадры, серии последовательных макроблоков видеокадров, группы изображений или другую заданную единицу кодированных видеоблоков. Для взаимного кодирования, видеокодер выполняет оценку движения, чтобы отслеживать перемещение совпадающих видеоблоков между двумя или более смежными кодированными единицами. Оценка движения формирует векторы движения, которые указывают смещение видеоблоков относительно соответствующих прогнозных видеоблоков в одном или более опорных кадров или других кодированных единиц. Компенсация движения использует векторы движения, чтобы формировать прогнозные видеоблоки из одного или более опорных кадров или других кодированных единиц. После компенсации движения остаточные видеоблоки формируются посредством вычитания прогнозных видеоблоков из кодируемых исходных видеоблоков.

Видеокодер также может применять процессы преобразования, квантования и энтропийного кодирования, чтобы дополнительно уменьшать скорость передачи битов, ассоциированную с передачей остаточных блоков. Технологии преобразования могут содержать дискретные косинусные преобразования (DCT) или концептуально аналогичные процессы. Альтернативно, вейвлет-преобразования, целочисленные преобразования или другие типы преобразований могут использоваться. В процессе DCT, в качестве примера, набор пикселных значений преобразуется в коэффициенты преобразования, которые могут представлять энергию пикселных значений в частотном домене. Квантование применяется к коэффициентам преобразования и, в общем, заключает в себе процесс, который уменьшает число битов, ассоциированных с любым данным коэффициентом преобразования. Энтропийное кодирование содержит один или более процессов, которые совместно сжимают последовательность режимов кодирования, информацию движения, шаблоны кодированных блоков и квантованные коэффициенты преобразования. Примеры энтропийного кодирования включают в себя, но не только, контекстно-адаптивное кодирование переменной длины (CAVLC) и контекстно-адаптивное двоичное арифметическое кодирование (CABAC).

Кодированный видеоблок может представляться посредством информации прогнозирования, которая может использоваться, чтобы создавать или идентифицировать прогнозный блок и остаточный блок данных, указывающих разности между кодируемым блоком и прогнозным блоком. Информация прогнозирования может содержать один или более векторов движения, которые используются, чтобы идентифицировать прогнозный блок данных. С учетом векторов движения, декодер может восстанавливать прогнозные блоки, которые использованы, чтобы кодировать остаток. Таким образом, с учетом набора остаточных блоков и набора векторов движения (и, возможно, некоторого дополнительного синтаксиса), декодер может восстанавливать видеокадр, который первоначально кодирован. Взаимное кодирование на основе оценки движения и компенсации движения может достигать очень хорошего сжатия, поскольку последовательные видеокадры или другие типы кодированных единиц зачастую являются в значительной степени аналогичными. Кодированная видеопоследовательность может содержать блоки остаточных данных, векторы движения и, возможно, другие типы синтаксиса.

Разработаны технологии интерполяции, чтобы повышать уровень сжатия, который может достигаться при взаимном внутрикадровом кодировании. В этом случае прогнозирующие данные, сформированные в ходе компенсации движения, которая используется, чтобы кодировать видеоблок, могут быть интерполированы из пикселов видеоблоков видеокадра или другой кодированной единицы, используемой при оценке движения. Интерполяция зачастую выполняется, чтобы формировать прогнозирующие полупикселные значения (в половину пиксела) и прогнозирующие четверть-пикселные значения (в четверть пиксела). Полупикселные и четверть-пикселные значения ассоциированы с субпикселными местоположениями. Дробные векторы движения могут использоваться для того, чтобы идентифицировать видеоблоки при субпикселном разрешении, чтобы фиксировать дробное перемещение в видеопоследовательности, и тем самым предоставлять прогнозные блоки, которые в большей степени аналогичны кодируемым видеоблокам, чем целочисленные видеоблоки.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

В общем, настоящее раскрытие сущности изобретения описывает технологии фильтрации, применяемые посредством кодера и декодера во время стадии прогнозирования процесса кодирования и/или декодирования видео. Описанные технологии фильтрации позволяют повышать точность прогнозирующих данных, используемых во время дробной интерполяции, и в некоторых случаях позволяют улучшать прогнозирующие данные целых блоков пикселов. Предусмотрено несколько аспектов для этого раскрытия, в том числе применимая поддержка фильтра на двенадцать пикселов, который может использоваться для интерполяции, технологии, которые используют симметрию по коэффициентам и симметрию по пикселам, чтобы уменьшать объем данных, необходимых для отправки между кодером и декодером, чтобы конфигурировать поддержку фильтра для интерполяции, и технологии для фильтрации данных в целопикселных местоположениях способом, который является аналогичным субпикселной интерполяции. Другие аспекты этого раскрытия касаются технологий для кодирования информации в потоке битов, чтобы передавать тип используемого фильтра и, возможно, используемые коэффициенты фильтрации. Технологии прогнозирующего кодирования для коэффициентов фильтрации также описываются. Эти и другие аспекты настоящего раскрытия будут очевидны из нижеприведенного описания.

В одном примере, настоящее раскрытие описывает способ, содержащий формирование первых интерполированных прогнозирующих данных для кодирования видеоданных на основе первого интерполяционного фильтра, формирование вторых интерполированных прогнозирующих данных для кодирования видеоданных на основе второго интерполяционного фильтра, выбор между первыми интерполированными прогнозирующими данными и вторыми интерполированными прогнозирующими данными на основе анализа искажения в зависимости от скорости передачи, кодирование видеоданных на основе выбора и кодирование синтаксиса, чтобы указывать выбор. Первый интерполяционный фильтр может содержать неперестраиваемый интерполяционный фильтр, а второй интерполяционный фильтр может содержать адаптивный интерполяционный фильтр, но настоящее раскрытие не ограничено этими примерами.

Дополнительные интерполяционные фильтры также могут применяться, чтобы формировать дополнительные интерполированные прогнозирующие данные, которые также могут рассматриваться при анализе искажения в зависимости от скорости передачи. Другими словами, способ не ограничен формированием только первых и вторых интерполированных прогнозирующих данных на основе двух интерполяционных фильтров, а может применяться, чтобы формировать любое множество интерполированных прогнозирующих данных на основе любого числа интерполяционных фильтров. Важно, что интерполированные прогнозирующие данные анализа искажения в зависимости от скорости передачи используются для того, чтобы идентифицировать то, какой фильтр следует выбирать.

Согласно другому примеру, настоящее раскрытие описывает способ, содержащий формирование множества различных версий прогнозирующих данных для кодирования видеоданных на основе множества различных интерполяционных фильтров, выбор из множества различных версий прогнозирующих данных на основе анализа искажения в зависимости от скорости передачи, кодирование видеоданных на основе выбора и кодирование синтаксиса, чтобы указывать выбор.

В другом примере, настоящее раскрытие описывает устройство, содержащее видеокодер, который формирует множество различных версий прогнозирующих данных для кодирования видеоданных на основе множества различных интерполяционных фильтров, выбирает из множества различных версий прогнозирующих данных на основе анализа искажения в зависимости от скорости передачи, кодирует видеоданные на основе выбора и кодирует синтаксис, чтобы указывать выбор.

В другом примере, настоящее раскрытие описывает устройство, содержащее средство для формирования множества различных версий прогнозирующих данных для кодирования видеоданных на основе множества различных интерполяционных фильтров, средство для выбора из множества различных версий прогнозирующих данных на основе анализа искажения в зависимости от скорости передачи, средство для кодирования видеоданных на основе выбора и средство для кодирования синтаксиса, чтобы указывать выбор.

Технологии, описанные в настоящем раскрытии, могут быть реализованы в аппаратных средствах, программном обеспечении, микропрограммном обеспечении или в любой их комбинации. При реализации в программном обеспечении, программное обеспечение может выполняться в одном или более процессоров, таких как микропроцессор, специализированная интегральная схема (ASIC), программируемая пользователем вентильная матрица (FPGA) или процессор цифровых сигналов (DSP). Программное обеспечение, которое выполняет технологии, может быть первоначально сохранено на машиночитаемом носителе и загружено и приведено в исполнение в процессоре.

Соответственно, настоящее раскрытие также рассматривает машиночитаемый носитель хранения данных, содержащий инструкции, которые, когда выполняются посредством процессора, предписывают процессору формировать множество различных версий прогнозирующих данных для кодирования видеоданных на основе множества различных интерполяционных фильтров, выбирать из множества различных версий прогнозирующих данных на основе анализа искажения в зависимости от скорости передачи, кодировать видеоданные на основе выбора и кодировать синтаксис, чтобы указывать выбор.

Подробности одного или более вариантов осуществления данного раскрытия сущности изложены на прилагаемых чертежах и в нижеприведенном описании. Другие признаки, цели и преимущества технологий, описанных в настоящем раскрытии, будут очевидны из описания и чертежей, а также из формулы изобретения.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фиг.1 является блок-схемой, иллюстрирующей одну примерную систему кодирования и декодирования видео, которая может реализовывать технологии настоящего изобретения.

Фиг.2 является блок-схемой, иллюстрирующей пример видеокодера, который может выполнять технологии фильтрации в соответствии с настоящим изобретением.

Фиг.3 является концептуальной схемой, иллюстрирующей целопикселные позиции, ассоциированные с прогнозирующими данными, и субпикселные позиции, ассоциированные с интерполированными прогнозирующими данными.

Фиг.4 является концептуальной схемой, иллюстрирующей поддержку фильтра на 12 пикселов относительно девяти субпикселных местоположений.

Фиг.5 является концептуальной схемой, иллюстрирующей поддержку горизонтального фильтра на 6 пикселов относительно трех горизонтальных субпикселных местоположений и поддержку вертикального фильтра на 6 пикселов относительно трех вертикальных субпикселных местоположений.

Фиг.6 является концептуальной схемой, иллюстрирующей поддержку фильтра на "пять пикселов на пять пикселов" для фильтрации целопикселного местоположения.

Фиг.8 является концептуальной схемой, иллюстрирующей шесть позиций поддержки горизонтальных линейных пикселов относительно субпиксела, с штриховкой, которая показывает симметрию по коэффициентам.

Фиг.10 является концептуальной схемой, иллюстрирующей шесть позиций поддержки вертикальных линейных пикселов относительно субпиксела, с штриховкой, которая показывает симметрию по коэффициентам.

Фиг.11 является концептуальной схемой, иллюстрирующей шесть позиций поддержки вертикальных линейных пикселов относительно субпиксела, с штриховкой, которая показывает отсутствие симметрии по коэффициентам.

Фиг.12 является концептуальной схемой, иллюстрирующей двенадцать позиций поддержки двумерных пикселов относительно субпиксела, с штриховкой, которая показывает отсутствие симметрии по коэффициентам.

Фиг.13 является концептуальной схемой, иллюстрирующей двенадцать позиций поддержки двумерных пикселов относительно субпиксела, с штриховкой, которая показывает симметрию по коэффициентам.

Фиг.14 является концептуальной схемой, иллюстрирующей двенадцать позиций поддержки двумерных пикселов относительно субпиксела, с штриховкой, которая показывает симметрию по коэффициентам.

Фиг.15 является концептуальной схемой, иллюстрирующей двенадцать позиций поддержки двумерных пикселов относительно субпиксела, с штриховкой, которая показывает симметрию по коэффициентам.

Фиг.16 является блок-схемой, иллюстрирующей пример видеодекодера, который может декодировать видеопоследовательность, кодированнную описанным в данном документе способом.

Фиг.27 и 28 являются концептуальными графиками, иллюстрирующими коэффициенты фильтрации, которые могут кодироваться с прогнозированием.

Фиг.29 является иллюстративным примером матрицы коэффициентов целопикселной фильтрации, для которых технологии прогнозирования могут использоваться для кодирования.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Настоящее раскрытие сущности изобретения описывает технологии фильтрации, применяемые посредством кодера и декодера во время стадии прогнозирования процесса кодирования и/или декодирования видео. Описанные технологии фильтрации позволяют повышать точность прогнозирующих данных, используемых во время дробной интерполяции, и в некоторых случаях позволяют улучшать прогнозирующие данные целых блоков пикселов. Предусмотрено несколько аспектов настоящего раскрытия, в том числе применимая поддержка фильтра на двенадцать пикселов, который может использоваться для интерполяции, технологии, которые используют симметрию по коэффициентам и симметрию по пикселам, чтобы уменьшать объем данных, необходимых для отправки между кодером и декодером, чтобы конфигурировать поддержку фильтра для интерполяции, и технологии для фильтрации данных в целопикселных местоположениях способом, который является аналогичным субпикселной интерполяции. Эти и другие технологии подробно описываются ниже.

Фиг.1 является блок-схемой, иллюстрирующей примерную систему 10 кодирования и декодирования видео, которая может использоваться, чтобы реализовывать одну или более технологий настоящего изобретения. Как показано на Фиг.1, система 10 включает в себя исходное устройство 12, которое передает кодированное видео в целевое устройство 16 через канал 15 связи. Исходное устройство (источник) 12 и целевое устройство (место назначения) 16 могут содержать любое из широкого диапазона устройств. В некоторых случаях, исходное устройство 12 и целевое устройство 16 содержат устройства беспроводной связи, такие как беспроводные переносные телефоны, так называемые сотовые или спутниковые радиотелефоны или любые беспроводные устройства, которые могут передавать видеоинформацию по каналу 15 связи, когда канал 15 связи является беспроводным. Однако технологии настоящего раскрытия, которые касаются фильтрации и формирования прогнозирующих данных во время прогнозирующего кодирования, не ограничены беспроводными приложениями или настройками. Технологии также могут применяться в широком диапазоне других настроек и устройств, в том числе устройств, которые обмениваются данными через физические провода, оптоволокно или другие физические или беспроводные среды. Помимо этого, технологии кодирования или декодирования также могут применяться в автономном устройстве, которое не обязательно обменивается данными с любым другим устройством.

В примере по Фиг.1 исходное устройство 12 может включать в себя видеоисточник 20, видеокодер 22, модулятор/демодулятор (модем) 23 и передающее устройство 24. Целевое устройство 16 может включать в себя приемное устройство 26, модем 27, видеодекодер 28 и дисплейное устройство 30. В соответствии с настоящим раскрытием видеокодер 22 исходного устройства 12 может конфигурироваться, чтобы применять одну или более технологий настоящего раскрытия как часть процесса кодирования видео. Аналогично, видеодекодер 28 целевого устройства 16 может конфигурироваться, чтобы применять одну или более технологий настоящего раскрытия как часть процесса декодирования видео.

Система 10, проиллюстрированная на Фиг.1, приведена только для примера. Различные технологии настоящего раскрытия могут выполняться посредством любого устройства кодирования, которое поддерживает прогнозирующее кодирование на основе блоков, или любого устройства декодирования, которое поддерживает прогнозирующее декодирование на основе блоков. Исходное устройство 12 и целевое устройство 16 являются просто примерами таких устройств кодирования, в которых исходное устройство 12 формирует кодированные видеоданные для передачи в целевое устройство 16. В некоторых случаях устройства 12, 16 могут работать практически симметрично, так что каждое из устройств 12, 16 включает в себя компоненты кодирования и декодирования видео. Следовательно, система 10 может поддерживать одностороннюю и двухстороннюю передачу видео между видеоустройствами 12, 16, к примеру, для потоковой передачи видео, воспроизведения видео, широковещательной передачи видео или видеотелефонии.

Видеоисточник 20 исходного устройства 12 может включать в себя устройство видеозахвата, такое как видеокамера, видеоархив, содержащий ранее захваченное видео, или видеопередачу от поставщика видеосодержимого. В качестве дополнительной альтернативы, видеоисточник 20 может формировать основанные на компьютерной графике данные в качестве исходного видео или комбинацию передаваемого впрямую видео, архивного видео и машино-генерируемого видео. В некоторых случаях, если видеоисточником 20 является видеокамера, исходное устройство 12 и целевое устройство 16 могут формировать так называемые камерофоны или видеофоны. В каждом случае захватываемое, предварительно захваченное или машино-генерируемое видео может быть кодировано посредством видеокодера 22. Кодированная видеоинформация затем может модулироваться посредством модема 23 согласно стандарту связи, к примеру, такому как множественный доступ с кодовым разделением (CDMA) или другой стандарт связи, и передаваться в целевое устройство 16 через передающее устройство 24 и канал 15 связи. Модем 23 может включать в себя различные смесители, фильтры, усилители или другие компоненты, предназначенные для модуляции сигналов. Передающее устройство 24 может включать в себя схемы, разработанные для передачи данных, в том числе усилители, фильтры и одну или более антенн.

Приемное устройство 26 целевого устройства 16 принимает информацию по каналу 15, и модем 27 демодулирует информацию. Аналогично передающему устройству 24, приемное устройство 26 может включать в себя схемы, предназначенные для приема данных, в том числе усилители, фильтры и одну или более антенн. В некоторых случаях передающее устройство 24 и/или приемное устройство 26 может быть включено в один компонент приемо-передающего устройства, который включают в себя как приемную, так и передающую схемы. Модем 27 может включать в себя различные смесители, фильтры, усилители или другие компоненты, предназначенные для демодуляции сигналов. В некоторых случаях, модемы 23 и 27 могут включать в себя компоненты для выполнения как модуляции, так и демодуляции.

Процесс кодирования видео, выполняемый посредством видеокодера 22, может реализовывать одну или более технологий, описанных в данном документе, в ходе компенсации движения. Процесс декодирования видео, выполняемый посредством видеодекодера 28, также может выполнять такие технологии в ходе своей стадии компенсации движения процесса декодирования. Термин "кодер" используется здесь для ссылки на специализированное компьютерное устройство, которое выполняет кодирование видео или декодирование видео. Термин "кодер", в общем, означает любое из видеокодера, видеодекодера или комбинированного кодера/декодера (кодека). Термин "кодирование" означает кодирование или декодирование. Дисплейное устройство 30 отображает декодированные видеоданные пользователю и может содержать любое из множества дисплейных устройств, таких как электронно-лучевая трубка (CRT), жидкокристаллический дисплей (LCD), плазменный дисплей, дисплей на органических светодиодах (OLED) или другой тип дисплейного устройства.

В примере по Фиг.1 канал 15 связи может содержать любую беспроводную и проводную среду связи, такую как радиочастотный (RF) спектр или одна или более физических линий передачи, либо любую комбинацию беспроводных и проводных сред. Канал 15 связи может формировать часть сети с коммутацией пакетов, такой как локальная вычислительная сеть, глобальная вычислительная сеть либо глобальная сеть, такая как Интернет. Канал 15 связи, в общем, представляет любую подходящую среду связи или набор различных сред связи для передачи видеоданных из исходного устройства 12 в целевое устройство 16. Канал 15 связи может включать в себя маршрутизаторы, коммутаторы, базовые станции или любое другое оборудование, которое может применяться для упрощения передачи данных из исходного устройства 12 в целевое устройство 16.

Видеокодер 22 и видеодекодер 28 могут работать согласно стандарту сжатия видео, такому как стандарт ITU-T H.264, альтернативно описанный как MPEG-4, часть 10, усовершенствованное кодирование видео (AVC). Однако технологии настоящего раскрытия не ограничены каким-либо конкретным стандартом кодирования видео. Хотя не показано на Фиг.1, в некоторых аспектах, видеокодер 22 и видеодекодер 28 могут быть интегрированы с аудиокодером и декодером, соответственно, и могут включать в себя соответствующие модули мультиплексора-демультиплексора либо другие аппаратные средства и программное обеспечение, чтобы обрабатывать кодирование как аудио, так и видео в общем потоке данных или в отдельных потоках данных. Модули мультиплексора-демультиплексора могут соответствовать протоколу мультиплексора ITU H.223 или другим протоколам, таким как протокол пользовательских дейтаграмм (UDP).

Видеокодер 22 и видеодекодер 28 могут быть реализованы как один или более микропроцессоров, процессоров цифровых сигналов (DSP), специализированных интегральных схем (ASIC), программируемых пользователем вентильных матриц (FPGA), дискретная логика, программное обеспечение, аппаратные средства, микропрограммное обеспечение или любые их комбинации. Каждый из видеокодера 22 и видеодекодера 28 может быть включен в один или более кодеров или декодеров, любой из которых может быть интегрирован как часть комбинированного кодека, который предоставляет возможности кодирования и декодирования в соответствующем мобильном устройстве, абонентском устройстве, широковещательном устройстве, сервере и т.п.

Видеопоследовательность типично включает в себя серии видеокадров. Видеокодер 22 оперирует с видеоблоками в рамках отдельных видеокадров, чтобы кодировать видеоданные. Видеоблоки могут иметь фиксированный или изменяющийся размер и могут отличаться по размеру согласно заданному стандарту кодирования. Каждый видеокадр включает в себя серии последовательных макроблоков. Каждая серия последовательных макроблоков может включать в себя серии макроблоков, которые могут быть скомпонованы в субблоки. В качестве примера, стандарт ITU-T H.264 поддерживает внутреннее прогнозирование для различных размеров блоков, таких как 16×16, 8×8 или 4×4 для компонентов сигнала яркости и 8×8 для компонентов сигнала цветности, а также взаимное прогнозирование для различных размеров блоков, таких как 16×16, 16×8, 8×16, 8×8, 8×4, 4×8 и 4×4 для компонентов сигнала яркости и соответствующих масштабированных размеров для компонентов сигнала цветности. Видеоблоки могут содержать блоки пикселных данных или блоки коэффициентов преобразования, к примеру, после процесса преобразования, такого как дискретное косинусное преобразование (DCT) или концептуально аналогичный процесс преобразования.

Меньшие видеоблоки могут предоставлять лучшее разрешение и могут быть использованы для местоположений видеокадра, которые включают в себя высокие уровни детализации. В общем, макроблоки и различные субблоки могут считаться видеоблоками. Помимо этого, серия последовательных макроблоков может считаться серией видеоблоков, таких как макроблоки и/или субблоки. Каждая серия последовательных макроблоков может быть независимо декодируемой единицей видеокадра. Альтернативно, сами кадры могут быть декодируемыми единицами, или другие части кадра могут быть заданы как декодируемые единицы. Термин "кодированная единица" означает любую независимо декодируемую единицу видеокадра, такую как весь кадр, серия последовательных макроблоков кадра или другая независимо декодируемая единица, заданная согласно используемым технологиям кодирования.

Чтобы кодировать видеоблоки, видеокодер 22 выполняет внутреннее («интра-») или взаимное («интер-») прогнозирование, чтобы формировать прогнозный блок. Видеокодер 22 вычитает прогнозные блоки из исходных видеоблоков, которые должны кодироваться, чтобы формировать остаточные блоки. Таким образом, остаточные блоки служат признаком разностей между кодируемыми блоками и прогнозными блоками. Видеокодер 22 может выполнять преобразование для остаточных блоков, чтобы формировать блоки коэффициентов преобразования. После технологий внутреннего или взаимного прогнозирующего кодирования и преобразования, видеокодер 22 выполняет квантование. Квантование, в общем, означает процесс, в котором коэффициенты квантуются, чтобы, возможно, уменьшать объем данных, используемый для представления коэффициентов. После квантования, энтропийное кодирование может выполняться согласно технологии энтропийного кодирования, такой как контекстно-адаптивное кодирование переменной длины (CAVLC) или контекстно-адаптивное двоичное арифметическое кодирование (CABAC). Дополнительные сведения по каждому этапу процесса кодирования, выполняемого посредством видеокодера 22, описываются подробнее ниже на Фиг.2.

В целевом устройстве 16 видеодекодер 28 принимает кодированные видеоданные. Видеодекодер 28 энтропийно декодирует принимаемые видеоданные согласно технологии энтропийного кодирования, такой как CAVLC или CABAC, чтобы получать квантованные коэффициенты. Видеодекодер 28 применяет функции обратного квантования (деквантования) и обратного преобразования, чтобы восстанавливать остаточный блок в пикселной области. Видеодекодер 28 также формирует прогнозный блок на основе управляющей информации или синтаксической информации (к примеру, режим кодирования, векторы движения, синтаксис, который задает коэффициенты фильтрации, и т.п.), включенной в кодированные видеоданные. Видеодекодер 28 суммирует прогнозный блок с восстановленным остаточным блоком, чтобы формировать восстановленный видеоблок для отображения. Дополнительные сведения по каждому этапу процесса кодирования, выполняемого посредством видеокодера 22, описываются подробнее ниже на Фиг.16.

Согласно технологиям настоящего раскрытия, видеокодер 22 и видеодекодер 28 могут использовать одну или более технологий интерполяционной фильтрации в ходе компенсации движения. В частности, в соответствии с одним аспектом этого раскрытия сущности, видеокодер 22 и/или видеодекодер 28 может получать блок пикселов, при этом блок пикселов включает в себя целопикселные значения, соответствующие целопикселным позициям в рамках блока пикселов, вычислять субпикселные значения для субпикселных позиций, ассоциированных с блоком пикселов, на основе целопикселных значений, при этом вычисление субпикселных значений содержит применение интерполяционного фильтра, который задает двумерный массив позиций поддержки фильтра, соответствующих набору из двенадцати или более целопикселных позиций, которые окружают субпикселные позиции в радиальной форме, и формировать прогнозный блок на основе, по меньшей мере, некоторых из субпикселных значений. Пример двумерного массива позиций поддержки фильтра, соответствующих набору из двенадцати или более целопикселных позиций, подробнее поясняется ниже.

В соответствии с другим аспектом настоящего раскрытия, видеокодер 22 и/или видеодекодер 28 может использовать аспекты симметрии, чтобы уменьшать объем данных, который должен передаваться между исходным устройством 12 и целевым устройством 16 для обмена коэффициентами фильтрации, используемыми при интерполяции. Видеокодер 22 может определять восемь наборов коэффициентов фильтрации для пятнадцати различных субпикселных местоположений, при этом восемь наборов коэффициентов фильтрации формируются на основе симметрии по коэффициентам и симметрии по пикселам для пятнадцати субпикселных местоположений, и выводить восемь наборов коэффициентов фильтрации в другое устройство как часть кодированного потока битов. Таким образом, восемь наборов, наряду с аспектами симметрии по пикселам и симметрии коэффициентов, могут задавать все коэффициенты фильтрации для всех пятнадцати четвертьпикселных и полупикселных позиций пиксела. Кроме того, симметрия по пикселам может существовать между различными из этих пятнадцати субпикселных местоположений в вертикальной размерности и в горизонтальной размерности, но симметрия по пикселам не может существовать в диагональной размерности, по меньшей мере, для некоторых из субпикселных местоположений пятнадцати наборов. Это отсутствие симметрии по пикселам в диагональной размерности, по меньшей мере, для некоторых из этих пятнадцати местоположений позволяет улучшать интерполяции и повышать качество видео при кодировании и декодировании видео.

Видеодекодер 28 целевого устройства 16 может принимать восемь наборов коэффициентов фильтрации как часть кодированного потока видеобитов, формировать пятнадцать наборов коэффициентов фильтрации, соответствующих пятнадцати различным субпикселным местоположениям, на основе восьми наборов коэффициентов фильтрации, формировать интерполированные прогнозирующие данные для декодирования видео на основе одного из пятнадцати наборов коэффициентов фильтрации, при этом интерполированные прогнозирующие данные соответствуют одному из пятнадцати различных субпикселных местоположений, и декодировать один или более видеоблоков на основе интерполированных прогнозирующих данных.

В соответствии с другим аспектом, видеокодер 22 и/или видеодекодер 28 может использовать аналогичную интерполяционной фильтрацию относительно целопикселных позиций, чтобы формировать регулируемые целопикселные значения. Такая аналогичная интерполяционной фильтрация позволяет улучшать сжатие конкретно во время изменений освещения, выходов из затемнения или затемнений сцены, позволяет удалять шум и упрощать увеличение резкости кадров с изображениями и позволяет помогать улучшать кодирование точного перемещения объекта между последовательными видеокадрами, в частности, когда симметрия не накладывается на коэффициенты фильтрации.

Технологии аналогичной интерполяционной фильтрации видеокодера 22 и/или видеодекодер 28 могут включать в себя получение блоков пикселов, при этом блоки пикселов включают в себя целопикселные значения, соответствующие целопикселным позициям в рамках блоков пикселов, фильтрацию целопикселных значений на основе других целопикселных значений в рамках блока пикселов, чтобы формировать регулируемые целопикселные значения, при этом отрегулированные целопикселные значения соответствуют целопикселным позициям, и формирование прогнозного блока на основе отрегулированных целопикселных значений.

В соответствии с другим аспектом, видеокодер 22 может формировать первые интерполированные прогнозирующие данные для кодирования видеоданных на основе первого интерполяционного фильтра, формировать вторые интерполированные прогнозирующие данные для кодирования видео для видеоданных на основе второго интерполяционного фильтра, выбирать между первыми интерполированными прогнозирующими данными и вторыми интерполированными прогнозирующими данными на основе анализа искажения в зависимости от скорости передачи, кодировать видеоданные на основе выбора и кодировать синтаксис, чтобы указывать выбор. Первый интерполяционный фильтр может содержать неперестраиваемый интерполяционный фильтр, а второй интерполяционный фильтр может содержать адаптивный интерполяционный фильтр, но это раскрытие сущности не обязательно ограничено этими примерами.

Кроме того, дополнительные интерполяционные фильтры также могут применяться, чтобы формировать дополнительные интерполированные прогнозирующие данные, которые также могут рассматриваться при анализе искажения в зависимости от скорости передачи. Другими словами, технологии настоящего раскрытия не ограничены формированием только первых и вторых интерполированных прогнозирующих данных на основе двух интерполяционных фильтров, но могут применяться, чтобы формировать любое множество интерполированных прогнозирующих данных на основе любого числа интерполяционных фильтров. Важно, что интерполированные прогнозирующие данные анализа искажения в зависимости от скорости передачи используются, чтобы идентифицировать то, какой фильтр следует выбирать.

В одном примере, способ может содержать формирование множества различных версий прогнозирующих данных для кодирования видеоданных на основе множества различных интерполяционных фильтров, выбор из множества различных версий прогнозирующих данных на основе анализа искажения в зависимости от скорости передачи, кодирование видеоданных на основе выбора и кодирование синтаксиса, чтобы указывать выбор.

Настоящее раскрытие также рассматривает технологию для кодирования коэффициентов фильтрации. Например, видеокодер 22 может идентифицировать набор коэффициентов фильтрации для интерполяции прогнозирующих данных при кодировании видео, формировать остаточные значения, ассоциированные с набором коэффициентов фильтрации, на основе прогнозирующего кодирования набора коэффициентов фильтрации относительно коэффициентов фильтрации, ассоциированных с неперестраиваемым интерполяционным фильтром, применять квантование к остаточным значениям и выводить квантованные остаточные значения как часть кодированного потока битов.

Видеодекодер 28 может принимать остаточные значения, ассоциированные с набором коэффициентов фильтрации, формировать набор коэффициентов фильтрации с использованием прогнозирующего декодирования на основе набора остаточных значений и коэффициентов фильтрации, ассоциированных с неперестраиваемым интерполяционным фильтром, и применять набор коэффициентов фильтрации, чтобы интерполировать прогнозирующие данные, используемые для прогнозирующего декодирования видеоблоков.

Фиг.2 является блок-схемой, иллюстрирующей пример видеокодера 50, который может выполнять технологии фильтрации в соответствии с настоящим раскрытием. Видеокодер 50 является одним примером специализированного компьютерного видеоустройства, упоминаемого в данном документе как "кодер". Видеокодер 50 может соответствовать видеокодеру 22 устройства 20 или видеокодеру другого устройства. Видеокодер 50 может выполнять внутреннее и взаимное кодирование блоков в рамках видеокадров, хотя компоненты внутреннего кодирования не показаны на Фиг.2 для простоты иллюстрации. Внутреннее кодирование основано на пространственном прогнозировании, чтобы уменьшать или удалять пространственную избыточность видео в данном видеокадре. Взаимное кодирование основано на временном прогнозировании, чтобы уменьшать или удалять временную избыточность видео в смежных кадрах видеопоследовательности. Внутренний режим (I-режим) может упоминаться как пространственный режим сжатия, а взаимные режимы, такие как режим прогнозирования (P-режим) или двунаправленный режим (режим B), могут упоминаться как временные режимы сжатия. Технологии этого раскрытия сущности применяются во время взаимного кодирования, и, следовательно, модули внутреннего кодирования, к примеру, модуль пространственного прогнозирования, не проиллюстрированы на Фиг.2 для простоты и удобства иллюстрации.

Как показано на Фиг.2, видеокодер 50 принимает текущий видеоблок в видеокадре, который должен быть кодирован. В примере по Фиг.2, видеокодер 50 включает в себя модуль 32 прогнозирования, запоминающее устройство 34, сумматор 48, модуль 38 преобразования, модуль 40 квантования и модуль 46 энтропийного кодирования. Для восстановления видеоблока видеокодер 50 также включает в себя модуль 42 обратного квантования, модуль 44 обратного преобразования и сумматор 51. Фильтр удаления блочности (не показан) также может быть включен, чтобы фильтровать границы блоков, чтобы удалять артефакты блочности из восстановленного видео. Если требуется, фильтр удаления блочности типично должен фильтровать вывод сумматора 51.

Модуль 32 прогнозирования может включать в себя модуль 35 оценки движения (ME) и модуль 37 компенсации движения (MC). Фильтр 37 может быть включен в модуль 32 прогнозирования и может активироваться посредством одного или обоих из ME-модуля 35 и MC-модуля 37, чтобы выполнять интерполяционную или аналогичную интерполяционной фильтрацию как часть оценки движения и/или компенсации движения, согласно настоящему раскрытию. Фильтр 37 может фактически представлять множество различных фильтров, чтобы упрощать многочисленные различные типы интерполяционной и аналогичной интерполяционной фильтрации. Таким образом, модуль 32 прогнозирования может включать в себя множество интерполяционных или аналогичных интерполяционным фильтров. В ходе процесса кодирования видеокодер 50 принимает видеоблок, который должен кодироваться (помеченный "видеоблок" на Фиг.2) и модуль 32 прогнозирования выполняет кодирование взаимного прогнозирования, чтобы формировать прогнозный блок (помеченный "прогнозный блок" на Фиг.2). В частности, ME-модуль 35 может выполнять оценку движения, чтобы идентифицировать прогнозный блок в запоминающем устройстве 34, и MC-модуль 37 может выполнять компенсацию движения, чтобы формировать прогнозный блок.

Оценка движения типично считается процессом формирования векторов движения, которые оценивают движение для видеоблоков. Вектор движения, например, может указывать смещение прогнозного блока в рамках прогнозного или опорного кадра (или другой кодированной единицы, к примеру, серии последовательных макроблоков) относительно блока, который должен быть кодирован в рамках текущего кадра (или другой кодированной единицы). Опорный кадр (или часть кадра) может временно находиться до или после видеокадра (или части видеокадра), которому принадлежит текущий видеоблок. Компенсация движения типично считается процессом выборки или формирования прогнозного блока из запоминающего устройства 34 либо, возможно, интерполяции или иного формирования фильтрованных прогнозирующих данных на основе вектора движения, определенного посредством оценки движения.

ME-модуль 35 выбирает соответствующий вектор движения для видеоблока, который должен кодироваться, посредством сравнения видеоблока с видеоблоками одного или более опорных кадров (к примеру, предыдущего и/или последующего кадра). ME-модуль 35 может выполнять оценку движения с дробно-пикселной точностью, иногда называемую дробно-пикселной, частично-пикселной или субпикселной оценкой движения. По сути, термины дробно-пикселная, частично-пикселная или субпикселная оценка движения могут использоваться взаимозаменяемо. При оценке дробно-пикселного движения ME-модуль 35 может выбирать вектор движения, который указывает смещение в местоположение, отличное от целопикселного местоположения. Таким образом, оценка дробно-пикселного движения дает возможность модулю 32 прогнозирования отслеживать движение с более высокой точностью, чем целопикселные местоположения (или полнопикселные), чтобы тем самым формировать более точный прогнозный блок. Оценка дробно-пикселного движения может иметь полупикселную точность, четверть-пикселную точность, точность в одну восьмую пиксела или любую большую точность. ME-модуль 35 может активировать фильтр(ы) 39 для всех требуемых интерполяций в ходе процесса оценки движения.

Чтобы выполнять компенсацию дробно-пикселного движения, MC-модуль 37 может выполнять интерполяцию (иногда называемую интерполяционной фильтрацией), чтобы формировать данные при субпикселном разрешении (упоминаемые в данном документе как субпикселные или дробно-пикселные значения). MC-модуль 37 может активировать фильтр(ы) 39 для этой интерполяции. Модуль 32 прогнозирования может выполнять интерполяцию (или аналогичную интерполяционной фильтрацию целых пикселов) с использованием технологий, описанных в данном документе.

После того, как вектор движения для видеоблока, который должен кодироваться, выбирается посредством ME-модуля 35, MC-модуль 37 формирует прогнозный видеоблок, ассоциированный с этим вектором движения. MC-модуль 37 может выбирать прогнозный блок из запоминающего устройства 34 на основе вектора движения, определенного посредством MC-модуля 35. В случае вектора движения с дробно-пикселной точностью, MC-модуль 37 фильтрует данные из запоминающего устройства 34, чтобы интерполировать такие данные до субпикселного разрешения, к примеру, при вызове фильтра(ов) 39 для этого процесса. В некоторых случаях, технология или режим интерполяционной фильтрации, который использован, чтобы формировать прогнозирующие субпикселные данные, может указываться как один или более элементов синтаксиса интерполяции для модуля 46 энтропийного кодирования для включения в кодированный поток битов. Действительно, некоторые аспекты настоящего раскрытия касаются использования симметрии по пикселам и симметрии по коэффициентам, чтобы уменьшать величину синтаксиса, который должен быть передан.

После того, как модуль 32 прогнозирования формирует прогнозный блок, видеокодер 50 формирует остаточный видеоблок (помеченный "остаточный блок" на Фиг.2) посредством вычитания прогнозного блока из кодируемого исходного видеоблока. Сумматор 48 представляет компонент или компоненты, которые выполняют эту операцию вычитания. Модуль 38 преобразования применяет преобразование, такое как дискретное косинусное преобразование (DCT) или концептуально аналогичное преобразование, к остаточному блоку, формируя видеоблок, содержащий остаточные блочные коэффициенты преобразования. Модуль 38 преобразования, например, может выполнять другие преобразования, заданные посредством стандарта H.264, которые являются концептуально аналогичными DCT. Вейвлет-преобразования, целочисленные преобразования, субполосные преобразования или другие типы преобразований также могут использоваться. В любом случае, модуль 38 преобразования применяет преобразование к остаточному блоку, формируя блок остаточных коэффициентов преобразования. Преобразование может преобразовывать остаточную информацию из пикселной области в частотную область.

Модуль 40 квантования квантует остаточные коэффициенты преобразования, чтобы дополнительно уменьшать скорость передачи битов. Процесс квантования может уменьшать битовую глубину, ассоциированную с некоторыми или всеми коэффициентами. После квантования, модуль 46 энтропийного кодирования энтропийно кодирует квантованные коэффициенты преобразования. Например, модуль 46 энтропийного кодирования может выполнять CAVLC, CABAC или другую технологию энтропийного кодирования.

Модуль 46 энтропийного кодирования также может кодировать один или более элементов синтаксиса прогнозирования, полученных из модуля 32 прогнозирования или другого компонента видеокодера 50. Один или более элементов синтаксиса прогнозирования могут включать в себя режим кодирования, один или более векторов движения, технологию интерполяции, которая использована для того, чтобы формировать субпикселные данные, набор или поднабор коэффициентов фильтрации или другую информацию, ассоциированную с формированием прогнозного блока. Модуль 41 прогнозирования коэффициентов и квантования может прогнозирующе кодировать и квантовать синтаксис прогнозирования, к примеру, коэффициенты фильтрации, согласно некоторым аспектам этого раскрытия сущности. После энтропийного кодирования посредством модуля 46 энтропийного кодирования, кодированное видео и элементы синтаксиса могут быть переданы в другое устройство или заархивированы для последующей передачи или извлечения.

Модуль 42 обратного квантования и модуль 44 обратного преобразования применяют обратное квантование и обратное преобразование, соответственно, чтобы восстанавливать остаточный блок в пикселной области, к примеру, для последующего использования в качестве опорного блока. Восстановленный остаточный блок (помеченный "восстановленный остаточный блок" на Фиг.2) может представлять восстановленную версию остаточного блока, предоставленного в модуль 38 преобразования. Восстановленный остаточный блок может отличаться от остаточного блока, сформированного посредством сумматора 48, вследствие потери детализации, вызываемой посредством операций квантования и обратного квантования. Сумматор 51 прибавляет восстановленный остаточный блок к блоку прогнозирования с компенсацией движения, сформированному посредством модуля 32 прогнозирования, чтобы формировать восстановленный видеоблок для хранения в запоминающем устройстве 34. Восстановленный видеоблок может использоваться посредством модуля 32 прогнозирования в качестве опорного блока, который может использоваться для того, чтобы затем кодировать блок в последующем видеокадре или последующей кодированной единице.

Как описано выше, модуль 32 прогнозирования может выполнять оценку движения с дробно-пикселной точностью (или субпикселной). Когда модуль 32 прогнозирования использует оценку дробно-пикселного движения, модуль 32 прогнозирования может формировать данные при субпикселном разрешении (к примеру, субпикселные или дробно-пикселные значения) с помощью операций интерполяции, описанных в этом раскрытии сущности. Другими словами, операции интерполяции используются, чтобы вычислять значения в позициях между целопикселными позициями. Субпикселные позиции, расположенные на половине расстояния между целопикселными позициями, могут упоминаться как полупикселные позиции (в половину пиксела), субпикселные позиции, расположенные на половине расстояния между целопикселной позицией и полупикселной позицией, могут упоминаться как четверть-пикселные позиции (в одну четвертую пиксела), субпикселные позиции, расположенные на половине расстояния между целопикселной позицией (или полупикселной позицией) и четверть-пикселной позицией, упоминаются как позиции в одну восьмую пиксела (одну восьмую) и т.п.

Фиг.3 является концептуальной схемой, иллюстрирующей целопикселные позиции (или полный пиксел), ассоциированные с прогнозирующими данными, и субпикселные позиции (или дробный пиксел), ассоциированные с интерполированными прогнозирующими данными. В концептуальной иллюстрации по Фиг.3, различные прямоугольники представляют пикселные и субпикселные местоположения позиции в пиксел и субпиксел в рамках кадра или блока кадра. Заглавные буквы (в прямоугольниках со сплошными линиями) представляют целопикселные местоположения, при этом строчные буквы (в прямоугольниках с пунктирными линиями) представляют субпикселные местоположения. В частности, местоположения пикселов A1-A6, B1-B6, C1-C6, D1-D6, E1-E6 и F1-F6 представляют матрицу 6×6 целопикселных местоположений в рамках кадра, серии последовательных макроблоков или другой кодированной единицы. Субпикселные местоположения "a"-"o" представляют пятнадцать субпикселных местоположений, ассоциированных с целым пикселом C3, к примеру, между целопикселными местоположениями C3, C4, D3 и D4. Аналогичные субпикселные местоположения могут существовать для каждого целопикселного местоположения. Субпикселные местоположения "a"-"o" представляют каждое полупикселное и четверть-пикселное местоположение пиксела, ассоциированное с целым пикселом C3.

Целопикселные местоположения могут быть ассоциированы с элементом физического датчика, таким как фотодиод, когда видеоданные первоначально сформированы. Фотодиод может измерять силу света в источнике света в местоположении датчика и ассоциировать значение силы света пиксела с целопикселным местоположением. С другой стороны, каждое целопикселное местоположение может иметь ассоциированный набор из пятнадцати субпикселных местоположений (или, возможно, больше). Число субпикселных местоположений, ассоциированных с целопикселными местоположениями, может зависеть от требуемой точности. В примере, проиллюстрированном на Фиг.3, требуемая точность составляет четверть-пикселную точность, когда каждое из целопикселных местоположений соответствует пятнадцати различным субпикселным позициям. Большее или меньшее число субпикселных позиций может быть ассоциировано с каждым целопикселным местоположением на основе требуемой точности. Для полупикселной точности, например, каждое целопикселное местоположение может соответствовать трем субпикселным позициям. В качестве другого примера, каждое из целопикселных местоположений может соответствовать шестидесяти трем субпикселным позициям для точности в одну восьмую пиксела. Каждое местоположение пиксела может задавать одно или более пикселных значений, к примеру, одно или более значений сигнала яркости и сигнала цветности.

Y может представлять сигнал яркости, а Cb и Cr могут представлять два различных значения сигнала цветности трехмерного цветового пространства YCbCr. Каждое местоположение пиксела может фактически задавать три пикселных значения для трехмерного цветового пространства. Однако технологии настоящего раскрытия могут упоминаться как прогнозирование относительно одной размерности для простоты. В степени, в которой технологии описываются относительно пикселных значений в одной размерности, аналогичные технологии могут быть расширены на другие размерности.

В примере по Фиг.3 субпикселные местоположения, ассоциированные с целым пикселом "C3", проиллюстрированы для четверть-пикселной точности. Пятнадцать субпикселных позиций, ассоциированных с пикселом C3, помечаются как "a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k", "l", "m", "n" и "o". Большинство других дробных местоположений, ассоциированных с другими целопикселными местоположениями, не показано для простоты (кроме используемых для того, чтобы формировать одно или более 15 различных дробных местоположений, ассоциированных с местоположением пиксела C3, как подробнее описано ниже). Субпикселные местоположения "b", "h" и "j" могут упоминаться как полупикселные местоположения, а субпикселные местоположения "a", "c", "d", "e", "f", "g", "i", "k", "l", "m" и "o" могу упоминаться как четверть-пикселные местоположения.

Модуль 32 прогнозирования видеокодера 40 может определять пикселные значения для субпикселных местоположений "a"-"o" с использованием интерполяционной фильтрации посредством MC-модуля 37. Согласно стандарту ITU-T H.264, например, модуль 32 прогнозирования может определять пикселные значения для полупикселных местоположений с использованием 6-отводного интерполяционного фильтра, такого как фильтр Винера. В случае стандарта H.264 коэффициенты фильтрации для 6-отводного интерполяционного фильтра типично составляют [1, -5, 20, 20, -5, 1], хотя могут использоваться другие коэффициенты. Модуль 32 прогнозирования может применять интерполяционный фильтр сначала в горизонтальном направлении, а затем в вертикальном направлении, или наоборот. Для полупикселных позиций "b" и "h", каждый отвод может соответствовать целопикселной позиции в горизонтальном и вертикальном направлении, соответственно. В частности, для полупикселной позиции "b", отводы 6-отводного фильтра соответствуют C1, C2, C3, C4, C5 и C6. Аналогично, для полупикселной позиции "h", отводы 6-отводного фильтра соответствуют A3, B3, C3, D3, E3 и F3. Например, пикселные значения для субпикселных позиций "b" и "h" могут вычисляться с использованием уравнений (1) и (2):

b=((C1-5C2+20C3+20C4-5C5+C6)+16)/32	(1)
h=((A3-5B3+20C3+20D3-5E3+F3)+16)/32	(2)

Для полупикселной позиции "j", отводы 6-отводного фильтра соответствуют сами себе для интерполяции горизонтально между позициями C1-C6 и D1-D6 или вертикально между позициями A3-F3 и A4-F4. Полупикселное местоположение "j" может вычисляться с 6-отводным фильтром, который использует ранее интерполированные пикселные значения полупикселных позиций, к примеру, в соответствии с одним из уравнений (3) или (4):

j=((aa-5bb+20b+20hh-5ii+jj)+16)/32	(3)
j=((cc-5dd+20h+20ee-5ff+gg)+16)/32	(4)

где (как проиллюстрировано на Фиг.3) aa соответствует интерполяции между A3, и A4, bb соответствует интерполяции между B3 и B4, b соответствует интерполяции между C3 и C4, hh соответствует интерполяции между D3 и D4, ii соответствует интерполяции между E3 и E4, и jj соответствует интерполяции между F3 и F4. В уравнении 4, cc соответствует интерполяции между C1 и D1, dd соответствует интерполяции между C2 и D2, h соответствует интерполяции между C3 и D3, ee соответствует интерполяции между C4 и D4, ff соответствует интерполяции между C5 и D5, и gg соответствует интерполяции между C6 и D6.

Согласно стандарту H.264, модуль 32 прогнозирования может определять пикселные значения в четверть-пикселных местоположениях "a", "c", "d", "e", "f", "g", "i", "k", "l", "m", "n" и "o" с использованием билинейного интерполяционного фильтра и пикселных значений окружающих целопикселных и полупикселных местоположений. Например, модуль 32 прогнозирования может определять пикселное значение, ассоциированное с субпикселной позицией "a", с помощью пикселных значений C3 и "b", определять пикселное значение, ассоциированное с субпикселной позицией "c", с помощью пикселных значений "b" и C4, и т.п.

Фактический фильтр, который применяется MC-модулем 37, чтобы формировать интерполированные данные в субпикселных местоположениях, может иметь широкий спектр реализаций. В качестве одного примера, модуль 32 прогнозирования может использовать адаптивную интерполяционную фильтрацию (AIF), как описано ниже, чтобы задавать интерполированные значения. Комитет ITU-T SG16/Q.6/VCEG (экспертная группа в области кодирования видео) исследует технологии кодирования, которые предлагают более высокую эффективность кодирования, чем H.264 и, в частности, AIF. AIF предлагает большое усиление при кодировании по сравнению с интерполяционной фильтрацией, используемой в стандарте H.264, в частности, для видеопоследовательностей с высоким разрешением (к примеру, 720i/p или 1080i/p). В AIF интерполяционный фильтр для каждой субпикселной позиции аналитически вычисляется для каждого видеокадра посредством минимизации энергии ошибок прогнозирования. Это помогает учитывать наложение спектров, ошибки квантования и оценки движения, шум камеры или другой артефакт, содержащийся в исходных и опорных видеокадрах. Аналитически извлеченные коэффициенты адаптивной фильтрации для каждого кадра затем прогнозируются, квантуются, кодируются и отправляются в потоке видеобитов. Некоторые из технологий настоящего раскрытия могут работать в рамках схемы AIF, а также многих других схем интерполяции.

Предусмотрено множество различных типов схем AIF согласно аспектам настоящего раскрытия. Например, первая схема - двумерный неразделимый AIF (NS-AIF), вторая - разделимый AIF (S-AIF) и третья - AIF с направленными фильтрами (D-AIF). Хотя каждая из этих схем AIF использует различные технологии интерполяции и поддержку, все три схемы AIF могут использовать аналогичные аналитические процессы, чтобы извлекать коэффициенты фильтрации, что поясняется ниже с помощью неразделимого AIF в качестве примера.

Предположим, что двумерный неразделимый фильтр 6×6 имеет коэффициенты , где i, j=0,..., 5, а SP представляет одну из 15 субпикселных позиций ("a"-"o"), показанных на Фиг.3. Следует отметить, что 6 из 15 субпикселных позиций, т.е. "a", "b", "c", "d", "h" и "l", являются одномерными (1D) субпикселными позициями, и модуль 32 прогнозирования может использовать 6-отводный интерполяционный фильтр, чтобы интерполировать такие данные. Субпикселные позиции "a", "b", "c", "d", "h" и "l" являются одномерными в том смысле, что они находятся в горизонтальной или вертикальной строке между двумя целопикселными позициями. Кроме того, допустим, что прогнозирующие пикселы в целопикселных позициях (A1-F6 на Фиг.3) в опорном кадре принимают пикселные значения P _i,j, где i, j = 0…5. Таким образом, A1 принимает значение Р _0,0, …, A6 принимает значение Р _5,0, …, F1 принимает значение Р _5,0, …, и F6 принимает значение Р _5,5. Затем, интерполированное значение p ^SP в субпикселной позиции SP, SP∈{a,…,0}, может вычисляться посредством модуля 32 прогнозирования с использованием следующего уравнения:

Пусть S _x,y является пикселным значением в текущем видеокадре в позиции (x, y).

где (mvx, mvy) - это вектор движения, (mvx,mvy) - это целочисленный компонент вектора движения, и FO - это смещение фильтра. Значение является соответствующей позицией пиксела в опорных кадрах. Например, в случае 6-отводного фильтра, FO=6/2-1=2. Для каждой субпикселной позиции SP энергия (e ^SP)2 ошибок прогнозирования между фактическим пикселным значением в текущем кадре и интерполированным значением может накапливаться посредством модуля 32 прогнозирования для всех пикселов, которые имеют точность вектора движения, соответствующую субпикселной позиции SP. Энергия ошибок прогнозирования может вычисляться посредством модуля 32 прогнозирования с использованием следующего уравнения:

Для каждой из субпикселных позиций a-o MC-модуль 37 может устанавливать отдельную систему уравнений посредством вычисления производной (e ^SP)2 относительно коэффициентов фильтрации . Число уравнений в этом случае равно числу коэффициентов фильтрации, используемых для текущей субпикселной позиции SP. Для каждой двумерной (двумерной) субпикселной позиции "e", "f", "g", "i", "j", "k", "m", "n" и "o", модуль 32 прогнозирования может использовать 6×6-отводный двумерный интерполяционный фильтр. Субпикселные позиции "e", "f", "g", "i", "j", "k", "m", "n" и o" являются двумерными в том смысле, что они не находятся в вертикальной строке или горизонтальной строке между двумя целопикселными позициями. В этом случае, система из тридцати шести уравнений с тридцатью шестью неизвестными может разрешаться посредством MC-модуля 37. Оставшиеся одномерные субпикселные позиции "a", "b", "c", "d", "h", и "l" могут требовать только одномерного интерполяционного фильтра (к примеру, одномерного 6-отводного фильтра). В случае одномерного 6-отводного фильтра система из шести уравнений может разрешаться посредством MC-модуля 37.

Фильтр(ы) 39 может представлять один фильтр или набор из множества различных фильтров, которые могут использоваться посредством MC-модуля 37 для того, чтобы формировать прогнозирующие данные.

Таким образом, примерный процесс извлечения и применения AIF-фильтров может иметь следующие этапы, которые могут выполняться посредством модуля 32 прогнозирования:

1. Оценка векторов (mvx, mvy) движения для каждого видеоблока, который должен кодироваться. Во время оценки движения может применяться неперестраиваемый интерполяционный фильтр (к примеру, интерполяционный процесс H.264/AVC).

2. С использованием этих векторов движения, накопление энергии ошибок прогнозирования для каждой субпикселной позиции SP по текущему видеокадру. Затем вычисление коэффициентов адаптивной фильтрации для каждой субпикселной позиции SP независимо посредством минимизации энергии ошибок прогнозирования, как указано в двух вышеприведенных уравнениях энергии прогнозирования.

3. Оценка новых векторов движения. В ходе процесса оценки движения могут применяться адаптивные интерполяционные фильтры, вычисленные на этапе 2. С помощью адаптивных интерполяционных фильтров ошибки оценки движения, вызываемые посредством наложения спектров, шума камеры и т.д., уменьшаются, и достигается лучшее прогнозирование движения.

Различные схемы AIF могут использовать аналитический процесс, идентичный процессу, определенному выше. Отличия между различными схемами, главным образом, заключаются в числе используемых уникальных коэффициентов фильтрации, являются ли интерполяционные фильтры разделимыми или неразделимыми, и в используемой поддержке фильтра (т.е. в целопикселных позициях, используемых, чтобы интерполировать, по меньшей мере, часть субпикселных позиций). В каждой из этих схем определенные ограничения по симметрии для AIF-фильтров могут быть наложены, чтобы сокращать число коэффициентов фильтрации, которое должно кодироваться и передаваться в потоке видеобитов.

Для NS-AIF, например, MC-модуль 37 модуля 32 прогнозирования может интерполировать одномерные субпикселные позиции "a", "b", "c", "d", "h" и "l" с использованием одномерного 6-отводного интерполяционного фильтра (также называемого 6-позиционным фильтром, поскольку каждый отвод соответствует целопикселной позиции), что требует шести коэффициентов. Шесть коэффициентов 6-позиционных фильтров, используемых для того, чтобы интерполировать одномерный субпиксел, соответствуют одной из целопикселных позиций, проиллюстрированных на Фиг.3. Например, для субпикселных позиций "a", "b" и "c", шестью целопикселными позициями, соответствующими коэффициентам, являются C1, C2, C3, C4, C5 и C6 и для субпикселных позиций "d", "h" и "l", шестью целопикселными позициями, соответствующими коэффициентам, являются A3, B3, C3, D3, E3 и F3. Эти целопикселные позиции представляют "поддержку фильтра" для интерполяционного фильтра.

Модуль 32 прогнозирования может интерполировать двумерные субпикселные позиции "e", "f", "g", "i", "j", "k", "m", "n" и o" с использованием двумерного интерполяционного фильтра 6×6, который требует тридцати шести коэффициентов фильтрации. Тридцать шесть коэффициентов двумерного интерполяционного фильтра 6×6, использованные для того, чтобы интерполировать двумерный субпиксел, соответствуют целопикселным позициям A1-A6, B1-B6, C1-C6, D1-D6, E1-E6 и F1-F6. Эти целопикселные позиции представляют "поддержку фильтра" для интерполяционного фильтра. Если дополнительное ограничение не накладывается, к примеру, отсутствует симметрия по коэффициентам или пикселам, видеокодер 50 может кодировать и передавать девять наборов из тридцати шести коэффициентов для двумерных субпикселных позиций и шесть наборов из шести коэффициентов для одномерных субпикселных позиций, всего 360 коэффициентов. Кодирование и передача этого числа коэффициентов в потоке видеобитов может приводить к затратному дополнительному числу битов. Высокое дополнительное число битов может, в свою очередь, увеличивать скорость передачи битов для данного уровня искажения, что нежелательно.

Для уменьшения дополнительного числа битов, ассоциированного с передачей коэффициентов фильтрации, определенные ограничения по симметрии могут быть введены для интерполяционных фильтров, чтобы сократить число уникальных коэффициентов фильтрации, передаваемых в декодер 28. Два типа симметрии, т.е. симметрия по пикселам и симметрия по коэффициентам, могут быть наложены по отдельности или в комбинации. Симметрия по пикселам принудительно активирует идентичный набор коэффициентов фильтрации (и зеркальные, перевернутые и/или повернутые версии набора) для различных субпикселных позиций. Симметрия по пикселам также может упоминаться как симметрия по субпикселам, когда такая симметрия по пикселам применяется относительно коэффициентов фильтрации, ассоциированных с двумя или более субпикселными местоположениями. Симметрия по коэффициентам, с другой стороны, принудительно активирует данный интерполяционный фильтр, чтобы быть симметричным в определенном направлении (к примеру, горизонтальном направлении, вертикальном направлении или и в том, и в другом) для различных позиций поддержки фильтра относительно других позиций поддержки фильтра для данных субпикселных значений, которые должны быть интерполированы.

Симметрия по пикселам может использоваться в NS-AIF. Снова ссылаясь на Фиг.3, пусть является набором коэффициентов фильтрации для субпикселной позиции "a", в таком случае набором коэффициентов фильтрации для субпикселной позиции "c" является , т.е. идентичный коэффициент в обратном порядке или горизонтально перевернутый. Таким образом, значение P ^a прогнозирующего пиксела в субпикселной позиции "a" и значение p ^c прогнозирующего пиксела в субпикселной позиции "c" могут вычисляться с использованием (8) и (9), соответственно.

Субпикселные позиции "d" и "l" могут быть интерполированы с использованием набора коэффициентов интерполяционной фильтрации, идентичного набору коэффициентов субпикселных позиций "a" и "c", соответственно. По сути, субпикселные позиции "a" и "c" могут иметь симметрию по пикселам относительно субпикселных позиций "d" и "l".

Один аспект настоящего раскрытия состоит в том, чтобы фактически удалять симметрию по пикселам между субпикселными позициями "a" и "c" относительно субпикселных позиций "d" и "l". Помимо этого симметрия по пикселам может исключаться для субпикселной позиции "f" относительно субпикселной позиции "i". Помимо этого, симметрия по пикселам может исключаться для субпикселной позиции "k" относительно субпикселной позиции "n". В таких случаях диагональная корреляция может быть низкой, делая недейственным или неэффективным наложение диагональной симметрии в этих случаях.

В качестве другого примера, пусть является набором двумерных коэффициентов фильтрации 6×6 для субпикселной позиции "e". В таком случае набором коэффициентов фильтрации для позиции "g" является (горизонтально перевернутая версия). Аналогично, набором коэффициентов фильтрации для субпикселной позиции "m" является (вертикально перевернутая версия), а набором коэффициентов фильтрации для субпикселной позиции "o" является (сначала горизонтально перевернут, а затем вертикально перевернут). По сути, субпикселные позиции "e", "g", "m" и "o" имеют симметрию по пикселам. Симметрия между субпикселными позициями "b" и "h" и между позициями "f", "i", "k" и n" накладывается аналогичным способом, как в примерах, приведенных выше. При таком ограничении по симметрии по пикселам, остается только пять групп уникальных наборов фильтров, первый набор коэффициентов фильтрации для группы субпикселов "a", "c", "d" и "l", второй набор коэффициентов фильтрации для группы субпикселов "b" и "h", третий набор коэффициентов фильтрации для группы субпикселов "e", "g", "m" и "o", четвертый набор коэффициентов фильтрации для группы "f", "i", "k" и n", и пятый набор коэффициентов фильтрации для группы субпикселов "j".

Кроме того, NS-AIF может накладывать ограничение по симметрии по коэффициентам на некоторые из этих наборов фильтров по отдельности или в комбинации с симметрией по субпикселам, описанной выше. В некоторых случаях, диагональная симметрия по коэффициентам может преднамеренно исключаться, к примеру, при исключении всех ограничений по диагональной симметрии по коэффициентам. В одном случае, симметрия по коэффициентам не накладывается на фильтр для первой группы субпикселных позиций, которая включает в себя субпикселные местоположения "a", "c", "d" и "l". Тем не менее, вторая группа субпикселных позиций, которая включает в себя коэффициент "b" и "h", может иметь симметрию по коэффициентам в соответствии с уравнением (10).

Аналогично, коэффициенты для интерполяционных фильтров для третьей, четвертой и пятой группы субпикселных позиций, которые включают в себя субпикселные позиции "e", "f" и j", соответственно, могут иметь симметрию по коэффициентам, как задано в уравнениях (11), (12) и (13), соответственно.

При таких ограничениях по симметрии по пикселам и симметрии по коэффициентам, описанных выше, число уникальных коэффициентов фильтрации может сокращаться с 360 (нет ограничения по симметрии) до 6(a)+3(b)+21(e)+18(f)+6(j)=54 коэффициентов, т.е. 6 коэффициентов для группы, включающей в себя субпикселную позицию "a", 3 коэффициента для группы, включающей в себя субпикселную позицию "b", 21 коэффициент для группы, включающей в себя субпикселную позицию "e", 18 коэффициентов для группы, включающей в себя субпикселную позицию "f", и 6 коэффициентов для группы, включающей в себя субпикселную позицию "j". Таким образом, в NS-AIF видеокодер 22 может кодировать и передавать пятьдесят четыре коэффициента вместо 360, как в случае отсутствия ограничений по симметрии. Как описано выше, эти пятьдесят четыре коэффициента могут аналитически разрешаться на основе вышеприведенного уравнения (7). Видеокодер 50 затем может прогнозировать, квантовать, кодировать (к примеру, с помощью экспоненциального кода Голомба со знаком) и отправлять коэффициенты в потоке битов. Дополнительные сведения относительно прогнозирующего кодирования коэффициентов фильтрации подробнее поясняются ниже. Модуль 41 прогнозирования коэффициентов и квантования может использоваться для прогнозирующего кодирования и квантования коэффициентов фильтрации в соответствии с этим раскрытием сущности.

В другой схеме AIF, т.е. S-AIF, модуль 32 прогнозирования может использовать разделимые интерполяционные фильтры в горизонтальном направлении и в вертикальном направлении вместо неразделимых интерполяционных фильтров, используемых в NS-AIF. Для одномерных субпикселных позиций, модуль 32 прогнозирования (к примеру, MC-модуль 37 модуля 32 прогнозирования) применяет только горизонтальные направленные фильтры или только вертикальные направленные фильтры в зависимости от субпикселного местоположения. В одном примере, горизонтальные направленные фильтры и вертикальные направленные фильтры содержат 6-позиционные (или 6-отводные) фильтры. Модуль 32 прогнозирования применяет горизонтальные направленные фильтры для субпикселных позиций "a", "b" и "c" с целопикселными позициями C1, C2, C3, C4, C5 и C6 (см. Фиг.3) в качестве поддержки фильтра и применяет вертикальные направленные фильтры для субпикселных позиций "d", "h" и "l" с целопикселными позициями A3, B3, C3, D3, E3 и F3 (см. Фиг.3) в качестве поддержки фильтра. Для оставшихся субпикселных позиций, т.е. двумерных субпикселных позиций, модуль 32 прогнозирования сначала применяет горизонтальную фильтрацию, после чего выполняется вертикальная фильтрация, или вертикальную фильтрацию, после чего выполняется горизонтальная фильтрация. С другой стороны, коэффициенты фильтрации, используемые для разделимых горизонтальных и вертикальных фильтров, могут вычисляться в соответствии с вышеприведенным уравнением (7). Без симметрии S-AIF может сокращать число коэффициентов, которые должны кодироваться и отправляться, до 144 коэффициентов с 360 коэффициентов, как имеет место в случае NS-AIF без симметрии.

S-AIF дополнительно может накладывать одно или более ограничений по симметрии, по меньшей мере, для некоторых из интерполяционных фильтров. В отличие от симметрии по субпикселам NS-AIF, при S-AIF наборы фильтров, используемые для субпикселных позиций "a" и "c", не являются симметричными, т.е. горизонтально перевернутыми версиями друг друга. Вместо этого коэффициенты наборов фильтров, используемых для субпикселных позиций "a" и "c", извлекаются независимо друг от друга как и , соответственно. Для каждой субпикселной позиции, которая имеет вертикальное перемещение, симметрия по субпикселам является аналогичной NS-AIF. Таким образом, коэффициенты для субпикселных позиций "d" и "l", коэффициенты для субпикселных позиций "e" и "m", коэффициенты для субпикселных позиций "f" и "n", и коэффициенты для субпикселных позиций "g" и "o" являются вертикально перевернутыми версиями друг друга, соответственно. Например, если коэффициенты вертикального фильтра для субпикселной позиции "d" - это , то коэффициенты вертикального фильтра для субпикселной позиции "l" - это . Таким образом, симметрия по субпикселам, используемая только в S-AIF, имеет вертикальную симметрию по субпикселам в одной размерности. S-AIF, тем не менее, не имеет горизонтальной симметрии по субпикселам. Симметрия по субпикселам в S-AIF может сокращать число коэффициентов, которые должны кодироваться и отправляться, со 144 коэффициентов до 102 коэффициентов.

S-AIF, аналогично NS-AIF, также может использовать симметрию по коэффициентам, чтобы дополнительно сокращать число коэффициентов, которые должны кодироваться и отправляться посредством видеокодера 50. Симметрия по коэффициентам, используемая в S-AIF, может быть идентичной симметрии в NS-AIF за исключением того, что в S-AIF предусмотрены только одномерные (горизонтальные или вертикальные) 6-отводные фильтры. Другими словами, отсутствуют двумерные фильтры 6x6. В S-AIF, для каждой субпикселной позиции SP, SP∈{b,h,I,j,k}, коэффициенты фильтрации могут иметь симметрию, как указано в уравнении (14).

Следовательно, как при симметрии по субпикселам, так и при симметрии по коэффициентам, S-AIF-фильтры могут иметь одиннадцать наборов уникальных одномерных 6-отводных фильтров, пять из которых являются симметричными фильтрами, каждый из которых имеет три уникальных коэффициента. Оставшиеся шесть фильтров могут иметь по шесть уникальных коэффициентов. В этом случае, видеокодер 22 может квантовать, прогнозировать, кодировать и отправлять всего пятьдесят один уникальный коэффициент фильтрации в потоке видеобитов.

В другой схеме AIF, D-AIF, модуль 32 прогнозирования использует направленные фильтры для двумерных субпикселных позиций "e", "f", "g", "i", "j", "k", "m", "n" и "o". Направленные фильтры могут содержать шестиотводные фильтры, и коэффициенты могут иметь симметрию так, что только поднабор коэффициентов должен передаваться. Как описано в данном документе, поддержка фильтра означает позиции пиксела от опорного кадра, который используется при интерполяции субпикселной позиции. MC-модуль 37 может вычислять субпикселные позиции "e" и "o" с помощью 6-позиционного (или 6-отводного) диагонального интерполяционного фильтра, который имеет целопикселные позиции A1, B2, C3, D4, E5 и F6 в качестве поддержки фильтра. Модуль 32 прогнозирования может вычислять субпикселные позиции "g" и "m" с помощью 6-позиционного диагонального интерполяционного фильтра, который имеет целопикселные позиции A6, B5, C4, D3, E2 и F1 в качестве поддержки фильтра. Модуль 32 прогнозирования может вычислять субпикселные позиции "f", "i", "j", "k" и "n" с помощью 12-позиционного диагонального интерполяционного фильтра, который имеет целопикселные позиции A1, B2, C3, D4, E5, F6, A6, B5, C4, D3, E2 и F1 в качестве поддержки фильтра.

D-AIF может использовать симметрию по субпикселам и коэффициентам, идентичную симметрии по субпикселам и коэффициентам, описанной выше относительно NS-AIF. С точки зрения симметрии по субпикселам предусмотрено пять уникальных наборов коэффициентов фильтрации для интерполяции пятнадцать субпикселных позиций, причем субпикселные позиции "a", "c", "d" и "l" совместно используют идентичные коэффициенты фильтрации (к примеру, зеркальные, перевернутые и/или повернутые версии), субпикселные позиции "e", "g", "m" и "o" совместно используют идентичные коэффициенты фильтрации (к примеру, зеркальные, перевернутые и/или повернутые версии), субпикселные позиции "b" и "h" совместно используют идентичные коэффициенты фильтрации (где "b" является горизонтальным фильтром, а "h" является вертикальным фильтром), субпикселные позиции "f", "i", "k" и n" совместно используют идентичные коэффициенты фильтрации (к примеру, зеркальные, перевернутые и/или повернутые версии), а субпикселная позиция "j" имеет собственный набор коэффициентов фильтрации.

С точки зрения симметрии по коэффициентам коэффициенты фильтрации для первой группы субпикселов, включающей в себя "a", "c", "d" и "l", используют одномерный 6-позиционный фильтр, имеющий шесть уникальных коэффициентов (т.е. первая группа является несимметричной), коэффициенты фильтрации для второй группы субпикселов "b" и "h" используют одномерный 6-позиционный фильтр, имеющий три уникальных коэффициента (т.е. b является симметричным), и третий набор коэффициентов фильтрации для группы субпикселов "e", "g", "m" и "o" использует направленный 6-позиционный фильтр, имеющий шесть уникальных коэффициентов. Четвертый набор коэффициентов фильтрации для группы "f", "i", "k" и n" использует 12-отводный фильтр, имеющий 6 уникальных коэффициентов, и пятый набор коэффициентов фильтрации для группы "j", имеющий три уникальных коэффициента. Общее число уникальных коэффициентов в схеме D-AIF составляет 6(a)+3(b)+6(e)+6(f)+3(j)=24 коэффициента. Эти коэффициенты фильтрации могут прогнозироваться, квантоваться, кодироваться и отправляться в потоке видеобитов.

MC-модуль 37 модуля 32 прогнозирования может использовать одну или более технологий интерполяции, описанных в данном документе, чтобы повышать точность интерполяции субпикселных позиций и/или сокращать число коэффициентов интерполяционной фильтрации, которое должно быть кодировано и передано. Ниже подробнее описана применимая поддержка фильтра на двенадцать пикселов с радиальной формой, которая может использоваться для интерполяции, технологии, которые используют симметрию по коэффициентам и симметрию по пикселам, чтобы уменьшать объем данных, необходимых для отправки между кодером и декодером, чтобы конфигурировать поддержку фильтра для интерполяции, технологии для удаления некоторых аспектов симметрии относительно традиционных технологий и технологий для фильтрации данных в целопикселных местоположениях способом, который является аналогичным субпикселной интерполяции. Технологии смещения также описываются. Помимо этого, технологии для выбора между интерполяционными фильтрами и технологии для прогнозирующего кодирования коэффициентов фильтрации также описываются.

Фиг.4 является концептуальной схемой, иллюстрирующей поддержку фильтра на двенадцать пикселов относительно девяти субпикселных местоположений. В соответствии с этим раскрытием сущности, MC-модуль 37 может вычислять субпикселные значения для субпикселных позиций "e", "f", "g", "i", "j", "k", "m", "n" и o" на основе штрихованных целопикселных значений. В этом случае, вычисление субпикселных значений содержит применение интерполяционного фильтра, который задает двумерный массив позиций поддержки фильтра, соответствующих набору в двенадцать (или, возможно, больше) целопикселных позиций, которые окружают субпикселные позиции, как проиллюстрировано на Фиг.4. Позиции поддержки фильтра показаны с штриховкой и заглавными буквенными обозначениями, и субпикселные позиции показаны как прямоугольники с пунктирными линиями и строчными буквенными обозначениями. MC-модуль 37 может интерполировать пикселы таким образом для каждого пиксела видеоблока и может формировать прогнозный блок на основе интерполированного субпикселного значения. Поддержка 12-позиционного фильтра имеет радиальную форму и имеет аналогичную частотную характеристику, как поддержка 36-позиционного фильтра, используемая в NS-AIF, но с гораздо меньшей сложностью интерполяции.

Из Фиг.3 следует, что субпикселные значения могут содержать пятнадцать четверть-пикселных и полупикселных значений. Интерполяционный фильтр, который задает двумерный массив позиций поддержки фильтра, применяется, чтобы задавать девять из пятнадцати четверть-пикселных и полупикселных значений, как показано на Фиг.4.

Набор из двенадцати или более целопикселных позиций, которые окружают субпикселные позиции, показан с штриховкой на Фиг.4 и может включать в себя четыре целопикселные позиции C3, C4, D3 и D4, окружающие девять четверть-пикселных и полупикселных значений, и восемь целопикселных позиций B3, B4, C2, C5, D2, D5, E3 и E4, окружающих четыре целопикселные позиции. Каждая из позиций поддержки фильтра в двумерном массиве позиций поддержки фильтра, показанных на Фиг.4, находится в пределах двух целопикселных позиций относительно субпикселных позиций. Такая фильтрация может являться частью компенсации движения в ходе процесса кодирования видео посредством видеокодера 50 (Фиг.2) или в ходе процесса декодирования видео посредством видеодекодера 60 (Фиг.16). В ходе процесса кодирования видео модуль 32 прогнозирования направляет множество наборов значений коэффициентов в модуль 46 энтропийного кодирования как часть элементов синтаксиса прогнозирования. Как показано на Фиг.4, набор из двенадцати или более целопикселных позиций, которые окружают субпикселные позиции, имеет радиальную форму и может содержать набор пространственно ближайших целопикселных позиций к девяти четверть-пикселным и полупикселным значениям, заданным посредством интерполяционного фильтра (к примеру, фильтра(ов) 39 на Фиг.2).

Модуль 46 энтропийного кодирования может кодировать наборы значений коэффициентов и выводить значения коэффициентов интерполяционного фильтра как часть кодированного потока битов, который затем может быть передан в другое устройство. Каждый из множества наборов значений коэффициентов, заданных относительно каждого различного субпикселного местоположения, показанного на Фиг.4, может задавать различные взвешивания для двенадцати или более целопикселных позиций. Симметрия по пикселам может существовать таким образом, что M наборов значений коэффициентов задают N различных взвешиваний для двенадцати или более целопикселных позиций, при этом M и N - это положительные целые числа, и N превышает M. Другими словами, симметрия по пикселам может позволять некоторым из местоположений пикселов основываться на зеркальных, инвертированных или повернутых взвешиваниях других местоположений пикселов так, что коэффициенты не должны кодироваться для местоположений, которые имеют симметрию по пикселам с другими субпикселными местоположениями.

Фиг.5 является концептуальной схемой, иллюстрирующей поддержку горизонтального фильтра на шесть пикселов относительно трех горизонтальных субпикселных местоположений и поддержку вертикального фильтра на шесть пикселов относительно трех вертикальных субпикселных местоположений. Местоположения поддержки фильтра заштрихованы, с заглавными буквенными обозначениями, а субпикселные местоположения являются не заштрихованы, со строчными буквенными обозначениями и пунктирными линиями. MC-модуль 37 может вычислять субпикселные значения для местоположений "a", "b" и "c" посредством применения линейного интерполяционного фильтра, который задает одномерную матрицу позиций поддержки фильтра C1-C6. MC-модуль 37 также может вычислять субпикселные значения для местоположений "d", "h" и "l" посредством применения линейного интерполяционного фильтра, который задает одномерную матрицу позиций поддержки фильтра A3-F3. Таким образом, линейные интерполяционные фильтры могут использоваться для шести из пятнадцати четверть-пикселных и полупикселных значений, показанных на Фиг.3.

Фиг.6 является концептуальной схемой, иллюстрирующей поддержку фильтра на "пять пикселов по пять пикселов" для фильтрации целопикселного местоположения. В этом случае аналогичная интерполяционной фильтрация может применяться относительно целопикселных местоположений, чтобы формировать регулируемые целопикселные значения. На Фиг.6, например, целопикселное значение в позиции C3 может быть фильтровано на основе матрицы пикселов 5×5 A1-A5, B1-B5, C1-C5, D1-D5 и E1-E5. Другие поддержки фильтра могут быть заданы для целочисленной фильтрации. В этом случае, если ME-модуль 35 идентифицирует блок целых пикселов, MC-модуль 37 может фильтровать каждый пиксел на основе матрицы пикселов 5×5, показанной на Фиг.6 (или другой поддержки фильтра), чтобы формировать фильтрованные целопикселные значения. Таким образом, аналогичная интерполяционной фильтрация может применяться к целым пикселам, которая позволяет улучшать кодирование в моменты времени изменений освещения или выходов из затемнения или затемнений сцены. Помимо этого, целочисленная фильтрация позволяет удалять шум и упрощать увеличение резкости кадров с изображениями и позволяет помогать улучшать кодирование точного перемещения объекта между последовательными видеокадрами, в частности, когда симметрия не накладывается на коэффициенты фильтрации. Целопикселная фильтрация также может быть чрезвычайно полезной для повышения качества и/или сжатия для видеопоследовательностей, которые имеют изменения фокуса.

Таким образом, видеокодер 22 и/или видеодекодер 28 может использовать аналогичную интерполяционной фильтрацию относительно целопикселных позиций, чтобы формировать регулируемые целопикселные значения. Видеокодер 22 или видеодекодер 28 может, например, получать блоки пикселов, при этом блоки пикселов включают в себя целопикселные значения, соответствующие целопикселным позициям в рамках блока пикселов. Видеокодер 22 или видеодекодер 28 может фильтровать целопикселные значения на основе других целопикселных значений в рамках блоков пикселов, чтобы формировать регулируемые целопикселные значения, при этом отрегулированные целопикселные значения соответствуют целопикселным позициям, и формировать прогнозный блок на основе отрегулированных целопикселных значений. Прогнозный блок затем может использоваться для того, чтобы кодировать или декодировать видеоблок, в зависимости от того, выполняется процесс во время кодирования или декодирования.

Если технология выполняется в ходе процесса кодирования, видеокодер 22 может формировать остаточный видеоблок как разность между текущим кодируемым видеоблоком и прогнозным блоком. Видеокодер 22 также может кодировать один набор коэффициентов фильтрации в расчете на кодированную единицу для целочисленной фильтрации или, возможно, кодировать два или более наборов коэффициентов фильтрации в расчете на кодированную единицу для целочисленной фильтрации в различных местоположениях в рамках кодированной единицы. В примере по Фиг.6, поддержки фильтра для целочисленной фильтрации могут задавать двумерный фильтр, к примеру, фильтр 5×5 со смещением. Кроме того, симметрия по коэффициентам может существовать, по меньшей мере, между некоторыми коэффициентами, используемыми для фильтрации, так что требуется только поднабор из 25 различных коэффициентов, чтобы определять все 25 коэффициентов для фильтра. Множество других размеров и форм фильтра могут использоваться в соответствии с целопикселной фильтрацией.

Если целопикселная фильтрация выполняется в ходе процесса декодирования, технология может содержать формирование восстановленного видеоблока как суммы остаточного видеоблока, ассоциированного с текущим декодируемым видеоблоком, и прогнозного блока. В этом случае устройство декодирования (к примеру, целевое устройство 16) может принимать один набор коэффициентов фильтрации в расчете на кодированную единицу для целочисленной фильтрации или может принимать два или более наборов коэффициентов фильтрации в расчете на кодированную единицу для целочисленной фильтрации в различных местоположениях в рамках кодированной единицы. Каждая кодированная единица может иметь один или более наборов коэффициентов целопикселной фильтрации, а также наборов коэффициентов субпикселной фильтрации, к примеру, восемь наборов, которые могут использоваться для того, чтобы формировать все пятнадцать наборов для четверть-пикселных и полупикселных позиций.

С другой стороны, аналогичная интерполяционной фильтрация целопикселных значений позволяет улучшать сжатие конкретно во время изменений освещения, выходов из затемнения или затемнений сцены, позволяет удалять шум и упрощать увеличение резкости кадров с изображениями и позволяет помогать улучшать кодирование точного перемещения объекта между последовательными видеокадрами, в частности, когда симметрия не накладывается на коэффициенты фильтрации. Кроме того, также обнаружено, что целопикселная фильтрация является чрезвычайно полезной, к примеру, для того чтобы улучшать сжатие в видеопоследовательностях, которые имеют изменения фокуса.

Традиционно, аналогичная интерполяционной фильтрация не выполняется для целопикселных позиций в AIF. Вместо этого соответствующая целопикселная позиция в опорном кадре используется просто "как есть". Однако в соответствии с настоящим раскрытием, фильтр может использоваться для целопикселных местоположений способом, который является аналогичным интерполяциям. Интерполяционная фильтрация для целопикселных позиций технически является ошибочным названием, поскольку пикселные значения целопикселных позиций уже существуют. Таким образом, фильтрация целопикселных позиций упоминается в данном документе как аналогичная интерполяционной фильтрация и может рассматриваться как простая фильтрация целопикселных значений, чтобы формировать новые отрегулированные пикселные значения.

В отличие от интерполяционной фильтрации для субпикселных позиций, где цель состоит в получении несуществующих значений в опорном кадре, пикселы в целочисленных позициях в опорном кадре уже существуют. При этом применение фильтрации к целопикселным позициям в опорном кадре предлагает ряд преимуществ. Например, когда целопикселные позиции содержат смещение, фильтрация целопикселных позиций может обеспечивать лучшую фиксацию изменений освещения между кадрами. Дополнительно, фильтрация для целопикселных позиций позволяет целопикселным позициям фиксировать спецэффекты, такие как выход из затемнения и затемнение. Фильтрация для целопикселных позиций также позволяет удалять определенные шумы при передаче сигналов (к примеру, шум камеры) и/или выполнять увеличение резкости, если требуется. Кроме того, если симметрия для целопикселного фильтра не накладывается, целопикселный фильтр может помогать фиксировать точное перемещение объекта, такое как перемещение объекта, которое не является кратным четверти пиксела. В завершение, целопикселная фильтрация также может применяться для улучшения сжатия видеопоследовательностей, когда происходят изменения фокуса.

В некоторых случаях интерполяционная фильтрация целопикселных позиций может зависеть от векторов движения. Другими словами, MC-модуль 37 модуля 32 прогнозирования может адаптивно применять интерполяционную фильтрацию на основе вектора движения, идентифицированного посредством ME-модуля 35. Например, интерполяционная фильтрация целопикселных позиций может выполняться, когда вектор движения указывает на целопикселную позицию. Интерполяционная фильтрация может приводить к отрегулированному пикселному значению для целопикселной позиции. Когда вектор движения указывает на субпикселную позицию, фильтрация целопикселных позиций не выполняется относительно целопикселных значений, но фильтрация может использоваться для интерполяции субпикселных значений. Таким образом, целопикселная фильтрация может считаться адаптивной на основе векторов движения.

Для целопикселных позиций интерполяционный фильтр 5×5 в форме уравнения (15) может извлекаться с использованием аналитического процесса, идентичного процессу, используемому для извлечения фильтров субпикселной позиции.

где p^FP - это фильтрованное целопикселное значение, P_i,j - это целопикселное значение в позиции (i, j), h^FP _i,j - это коэффициент для позиции (i, j), и o^FP -это смещение фильтра. В некоторых случаях, интерполяционный фильтр для целопикселных позиций может не иметь смещения фильтра (т.е. o^FP=0). В других случаях, смещение фильтра o^FP может использовать любое число технологий.

Различные смещения могут быть заданы для каждой субпикселной позиции, к примеру, пятнадцать различных смещений могут быть заданы для каждой субпикселной позиции, показанной на Фиг.3. Другое смещение может быть задано для целых пикселов, что дает общее число смещений в шестнадцать. Находящаяся одновременно на рассмотрении и переуступленная заявка № ________, на имя Karczewicz и др., озаглавленная "OFFSETS AT SUB-PIXEL RESOLUTION", номер дела поверенного 081399U2, поданная в один день с настоящей заявкой и включенная в настоящий документ посредством ссылки, предоставляет множество дополнительных сведений относительно использования многих смещений для различного пиксела и субпикселных местоположений.

Для сокращения числа коэффициентов фильтрации, которые должны передаваться, симметрия по коэффициентам, как в уравнении (16), может быть наложена на целопикселный фильтр.

Другие формы симметрии по коэффициентам также могут использоваться. То, накладывается или нет симметрия по коэффициентам, может определяться кодером и сигнализироваться декодеру. Если симметрия, как в (16), используется для целопикселного фильтра, то 9 коэффициентов фильтрации и 1 смещение, возможно, должны передаваться в декодер.

Кодирование смещений может выполняться посредством кодирования сначала целочисленного смещения и последующего кодирования каждого дробного смещения. В этом случае целочисленное смещение и дробные смещения кодируются по-разному. Целочисленное смещение может кодироваться с помощью экспоненциального кода Голомба со знаком. В зависимости от величины целочисленного смещения, дробные смещения могут квантоваться отлично от целочисленного смещения. Например, более приблизительные уровни квантования могут применяться для дробных смещений, когда целочисленное смещение имеет большую величину. После квантования дробные смещения могут кодироваться с использованием кодов фиксированной длины. В качестве примера, следующий псевдокод может иллюстрировать, как данное дробное смещение может кодироваться с использованием различных кодов фиксированной длины, заданных на основе значения целочисленного смещения.

Пусть offsetI является целочисленным смещением

Пусть offsetF является дробным смещением

Пусть offsetFbits является числом битов, используемым, чтобы квантовать offsetF

Пусть abs(a) является абсолютным значением a

if(abs(offsetI)=0)

offsetFbits=5

else if(abs(offsetI)<3)

offsetFbits=4

else if(abs(offsetI)<7)

offsetFbits=2

else

offsetFbits=0

В этом случае, видеокодер 50 может использовать модуль 41 прогнозирования коэффициентов и квантования, который для каждого из значений смещения назначает первое число битов целочисленной части данного значения смещения и назначает второе число битов дробной части данного значения смещения, при этом первое и второе число битов определяются на основе величины целочисленной части. В этом случае квантованные версии значений смещения могут отправляться из модуля 32 прогнозирования как элементы синтаксиса прогнозирования после выполнения квантования значений смещения согласно вышеприведенному псевдокоду. В любом случае видеокодер 50 может кодировать первое число битов отлично от второго числа битов.

Фиг.7 является концептуальной схемой, иллюстрирующей четыре целопикселные позиции и пятнадцать субпикселных позиций с штриховкой, чтобы группировать позиции пиксела, которые могут использовать симметрию по пикселам для коэффициентов фильтрации в соответствии с этим раскрытием сущности. В частности, Фиг.7 иллюстрирует субпикселные позиции "a"-"o", соответствующие целопикселные позиции C3. Позиции в целочисленный субпиксел, показанные на Фиг.7, соответствуют позициям по Фиг.4 и 5. Таким образом, субпикселные местоположения "e", "f", "g", "i", "j", "k", "m", "n" и o" могут иметь значения, определенные посредством поддержки в двенадцать пикселов, как показано на Фиг.4, при этом субпикселные местоположения "a", "b" и "c" и субпикселные местоположения "d", "h" и "l" могут иметь значения, определенные посредством поддержек горизонтальных и линейных пикселов, показанные на Фиг.5.

В этом сценарии симметрия по пикселам может быть наложена так, что коэффициенты фильтрации для местоположения пиксела "a" являются симметричными относительно коэффициентов фильтрации для местоположения пиксела "c". Аналогично, симметрия по пикселам может быть наложена так, что коэффициенты фильтрации для местоположения пиксела "d" являются симметричными относительно коэффициентов фильтрации для местоположения пиксела "l". Симметрия по пикселам может быть наложена так, что коэффициенты фильтрации для местоположения пиксела "e" являются симметричными относительно коэффициентов фильтрации для местоположений пикселов "g", "m" и "o" и симметрия по пикселам может быть наложена так, что коэффициенты фильтрации для местоположения пиксела "i" являются симметричными относительно коэффициентов фильтрации для местоположений пикселов "k", и симметрия по пикселам может быть наложена так, что коэффициенты фильтрации для местоположения пиксела "f" являются симметричными относительно коэффициентов фильтрации для местоположений пикселов "n". Следовательно, только восемь наборов значений коэффициентов, возможно, должны передаваться как часть потока видеобитов, чтобы предоставлять возможность декодеру формировать полные наборы значений коэффициентов для всех пятнадцати местоположений пикселов. Кроме того, для любого данного набора коэффициентов, симметрия по коэффициентам может давать возможность отправки только поднабора значений коэффициентов, и декодер может формировать полный набор значений коэффициентов для данного местоположения пиксела на основе поднабора и симметрии по коэффициентам.

Один аспект настоящего раскрытия состоит в том, чтобы фактически удалять всю симметрию по пикселам между субпикселными позициями "a" и "c" относительно субпикселных позиций "d" и "l". Помимо этого, симметрия по пикселам может исключаться для субпикселной позиции "f" относительно субпикселной позиции "i". Помимо этого, симметрия по пикселам может исключаться для субпикселной позиции "k" относительно субпикселной позиции "n". В таких случаях диагональная корреляция может быть низкой, делая недейственным или неэффективным то, чтобы накладывать диагональную симметрию. Таким образом, восемь наборов коэффициентов, используемых, чтобы формировать все пятнадцать наборов коэффициентов, могут быть большим набором, чем в некоторых традиционных технологиях, когда симметрия исключается в диагональной размерности для некоторых из местоположений пикселов. В некоторых случаях, диагональная симметрия по пикселам и диагональная симметрия по коэффициентам могут исключаться или не допускаться, чтобы предоставлять возможность дисперсии в вертикальных размерностях.

Снова ссылаясь на Фиг.1, видеокодер 22 может определять восемь наборов коэффициентов фильтрации и использовать восемь наборов коэффициентов фильтрации, чтобы формировать все пятнадцать наборов коэффициентов фильтрации, соответствующих пятнадцати различным субпикселным местоположениям, на основе симметрии по коэффициентам и симметрии по пикселам, и выводить восемь наборов коэффициентов фильтрации как часть кодированного потока битов. Восемь наборов коэффициентов фильтрации могут выводиться для каждой кодированной единицы кодированного потока битов, или, возможно, несколько случаев восьми наборов коэффициентов фильтрации могут выводиться для различных областей кодированной единицы.

Пятнадцать наборов соответствуют каждому субпикселному четверть-пикселному и полупикселному местоположению, показанному на Фиг.3, и восемь наборов, симметрия по коэффициентам и симметрия по пикселам определяют поддержки фильтра для каждого субпикселного четверть-пикселного и полупикселного местоположения. Видеодекодер 28 целевого устройства 16 могут принимать восемь наборов коэффициентов фильтрации как часть кодированного потока видеобитов, формировать пятнадцать наборов коэффициентов фильтрации, соответствующих пятнадцати различным субпикселным местоположениям, на основе восьми наборов коэффициентов фильтрации, формировать интерполированные прогнозирующие данные для декодирования видео на основе одного из пятнадцати наборов коэффициентов фильтрации, при этом интерполированные прогнозирующие данные соответствуют одному из пятнадцати различных субпикселных местоположений, и декодировать один или более видеоблоков на основе интерполированных прогнозирующих данных.

По меньшей мере, некоторые из восьми наборов коэффициентов фильтрации могут иметь симметрию по коэффициентам так, что данный набор с симметрией по коэффициентам содержит поднабор коэффициентов фильтрации, ассоциированных с поддержкой фильтра для данного субпикселного местоположения, ассоциированного с данным набором. Таким образом, видеодекодер 28 может формировать пятнадцать наборов коэффициентов фильтрации, по меньшей мере, частично на основе симметрии по пикселам между двумя или более различных субпикселных местоположений. Кроме того, видеодекодер 28 может формировать пятнадцать наборов коэффициентов фильтрации, по меньшей мере, частично на основе симметрии по пикселам между двумя или более различных субпикселных местоположений и, по меньшей мере, частично на основе симметрии по коэффициентам, заданной для данного набора так, что данный набор с симметрией по коэффициентам содержит поднабор коэффициентов фильтрации, ассоциированных с поддержкой фильтра для данного субпикселного местоположения, ассоциированного с данным набором.

С другой стороны, пятнадцать наборов могут соответствовать каждому четверть-пикселному и полупикселному субпикселному местоположению. Симметрия по пикселам может существовать между различными пятнадцатью наборов коэффициентов фильтрации в вертикальной размерности и в горизонтальной размерности, но симметрия по пикселам не существует в диагональной размерности, по меньшей мере, для некоторых из пятнадцати наборов коэффициентов фильтрации. Как подробнее поясняется ниже, два из восьми наборов могут задавать три из пятнадцати наборов для поддержки горизонтального фильтра, два из восьми наборов могут задавать три из пятнадцати наборов для поддержки вертикального фильтра, и четыре из восьми наборов могут задавать девять из пятнадцати наборов для двумерной поддержки фильтра. Двумерная поддержка может содержать применимую поддержку 12-позиционного фильтра, окружающего девять субпикселных позиций в радиальной форме.

В частности, интерполированные прогнозирующие данные могут содержать пятнадцать четверть-пикселных и полупикселных значений, к примеру, показанные на Фиг.7, при этом интерполяционный фильтр определяет двумерный массив из двенадцати позиций поддержки фильтра, к примеру, показанный на Фиг.4, которые применяются для определения девяти из пятнадцати четверть-пикселных и полупикселных значений, и, например, также показанный на Фиг.4. Формирование интерполированных прогнозирующих данных дополнительно может содержать применение линейных интерполяционных фильтров, которые задают одномерные матрицы позиций поддержки фильтра для шести из пятнадцати четверть-пикселных и полупикселных значений, к примеру, как показано на Фиг.5.

Горизонтальная симметрия и отсутствие диагональной симметрии может наблюдаться относительно субпикселных позиций "a" и "c" или относительно субпикселных позиций "i" и "k". В этом случае, позиции в целочисленный субпиксел "a" и "c" являются симметричными вдоль горизонтальной оси X, но симметрия не существует вдоль диагональной оси для этих пикселов так, что субпикселные местоположения "d" и "l" не являются симметричными относительно субпикселных позиций "a" и "c", соответственно. Аналогично, субпикселные позиции "i" и "k" являются симметричными вдоль горизонтальной оси X, но симметрия не существует вдоль диагональной оси для этих пикселов, так что субпикселные местоположения "f" и "n" не являются симметричными относительно субпикселных позиций "i" и "k", соответственно.

Симметрия по пикселам означает, что первый набор коэффициентов относительно первой субпикселной позиции является симметричным относительно второго набора коэффициентов относительно второй субпикселной позиции. Например, местоположение пиксела "a" имеет симметрию по пикселам относительно местоположения пиксела "c", и местоположение пиксела "d" имеет симметрию по пикселам относительно местоположения пиксела "l". Местоположение пиксела "f" имеет симметрию по пикселам относительно местоположения пиксела "n", и местоположение пиксела "i" имеет симметрию по пикселам относительно местоположения пиксела "k". Местоположение пиксела "e" имеет симметрию по пикселам относительно местоположений пикселов "g", "m" и "o". Штриховка, показанная на Фиг.7, демонстрирует эту симметрию по пикселам, к примеру, с общей штриховкой, соответствующей местоположениям пикселов, которые являются симметричными относительно других местоположений пикселов. В этом случае, коэффициенты для восьми местоположений пикселов (вместе с аспектами симметрии по пикселам) могут задавать коэффициенты для всех пятнадцати местоположений пикселов. Помимо этого, в рамках данного набора коэффициентов, может существовать симметрия по коэффициентам, так что только поднабор коэффициентов в этом наборе коэффициентов должен передаваться с потоком битов.

Видеокодер 22 может формировать кодированные видеоданные на основе интерполированных прогнозирующих данных, при этом интерполированные прогнозирующие данные содержат пятнадцать четверть-пикселных и полупикселных значений, причем интерполяционный фильтр задает двумерный массив из двенадцати позиций поддержки фильтра, которые применяются, чтобы задавать девять из пятнадцати четверть-пикселных и полупикселных значений. Формирование кодированных видеоданных на основе интерполированных прогнозирующих данных дополнительно может содержать применение линейных интерполяционных фильтров, которые задают одномерные матрицы позиций поддержки фильтра для шести из пятнадцати четверть-пикселных и полупикселных значений.

Фиг.8 является концептуальной схемой, иллюстрирующей шесть позиций C1-C6 поддержки горизонтальных линейных пикселов относительно субпикселной позиции "b" с штриховкой, которая показывает симметрию по коэффициентам. В этом случае симметрия по коэффициентам означает, что только три коэффициента фильтрации требуются для C1, C2 и C3, чтобы задавать полный набор коэффициентов для позиций C1-C6 поддержки фильтра. C1 является симметричным с C6, C2 является симметричным с C5, а C3 является симметричным с C4. Таким образом, только три коэффициента должны передаваться как часть кодированного потока видеобитов, чтобы задавать набор из шести коэффициентов, требуемых для интерполяции субпикселной позиции "b".

Фиг.9 является концептуальной схемой, иллюстрирующей шесть позиций поддержки горизонтальных линейных пикселов относительно субпиксела, с штриховкой, которая показывает отсутствие симметрии по коэффициентам. Таким образом, все шесть коэффициентов требуются для определения набора коэффициентов для поддержки фильтра относительно субпикселной позиции "a". Однако, как указано выше, симметрия по пикселам означает, что эти идентичные коэффициенты относительно субпикселной позиции "a" также могут использоваться, чтобы извлекать поддержку фильтра для субпикселной позиции "c" (см. Фиг.7). Таким образом, только шесть коэффициентов должны передаваться как часть кодированного потока видеобитов, чтобы задавать два различных набора из шести коэффициентов, требуемых для интерполяции субпикселной позиции "a" и "c".

Фиг.10 является концептуальной схемой, иллюстрирующей шесть позиций поддержки вертикальных линейных пикселов A3, B3, C3, D3, E3 и F3 относительно субпиксела "h", с штриховкой, которая показывает симметрию по коэффициентам. В этом случае симметрия по коэффициентам означает, что только три коэффициента фильтрации требуются для A3, B3 и C3, чтобы определять полный набор коэффициентов для позиций поддержки фильтра A3, B3, C3, D3, E3 и F3. A3 является симметричным с F3, B3 является симметричным с E3, а C3 является симметричным с D3. Таким образом, только три коэффициента должны передаваться как часть кодированного потока видеобитов, чтобы определять набор из шести коэффициентов, требуемых для интерполяции субпикселной позиции "h".

Таким образом, все шесть коэффициентов требуются, чтобы задавать набор коэффициентов для поддержки фильтра относительно субпикселной позиции "d". Однако как указано выше, симметрия по пикселам означает, что эти идентичные коэффициенты относительно субпикселной позиции "d" также могут использоваться, чтобы извлекать поддержку фильтра для субпикселной позиции "l" (см. Фиг.7). Таким образом, только шесть коэффициентов должны передаваться как часть кодированного потока видеобитов, чтобы задавать два различных набора из шести коэффициентов, требуемых для интерполяции субпикселной позиции "d" и "l".

Фиг.12 является концептуальной схемой, иллюстрирующей двенадцать позиций поддержки двумерных пикселов (при этом целопикселные позиции показаны с заглавными буквенными обозначениями и штриховкой) относительно субпикселной позиции "e". Штриховка показывает отсутствие симметрии по коэффициентам. Таким образом, все двенадцать коэффициентов требуются, чтобы задавать набор коэффициентов для поддержки фильтра относительно субпикселной позиции "e". Однако как указано выше, симметрия по пикселам означает, что эти идентичные коэффициенты относительно субпикселной позиции "e" также могут использоваться для извлечения поддержки фильтра для субпикселных позиций "g", "m" и "o" (см. Фиг.7). Следовательно, 12 коэффициентов определяют субпикселную позицию поддержки фильтра "e", и эти идентичные коэффициенты могут использоваться, чтобы извлекать набор коэффициентов для субпикселных позиций "g", "m" и "o".

Фиг.13 является концептуальной схемой, иллюстрирующей двенадцать позиций поддержки двумерных пикселов (при этом целопикселные позиции показаны с заглавными буквенными обозначениями) относительно субпиксела "i", с штриховкой, которая показывает симметрию по коэффициентам. В этом случае симметрия по коэффициентам означает, что коэффициенты фильтрации для позиций поддержки фильтра B3, B4, C2, C3, C4 и C5 могут использоваться, чтобы задавать коэффициенты фильтрации для позиций поддержки фильтра E3, E4, D2, D3, D4 и D5. B3 является симметричным с E3, B4 является симметричным с E4, C2 является симметричным с D2, C3 является симметричным с D3, C4 является симметричным с D4, и C5 является симметричным с D5. Таким образом, только шесть коэффициентов должны передаваться как часть кодированного потока видеобитов, чтобы определять набор из двенадцати коэффициентов, требуемых для интерполяции субпикселной позиции "i". Кроме того, как указано выше, субпикселная позиция "i" может иметь симметрию по пикселам относительно субпикселной позиции "k". Следовательно, идентичный поднабор из шести коэффициентов может определять полные наборы из двенадцати коэффициентов фильтрации для субпикселных позиций "i" и "k".

Фиг.14 является концептуальной схемой, иллюстрирующей двенадцать позиций поддержки двумерных пикселов (при этом целопикселные позиции показаны с заглавными буквенными обозначениями) относительно субпиксела "f", с штриховкой, которая показывает симметрию по коэффициентам. В этом случае, симметрия по коэффициентам означает, что коэффициенты фильтрации для позиций поддержки фильтра C2, D2, B3, C3, D3 и E3 могут использоваться для определения коэффициентов фильтрации для позиций поддержки фильтра C5, D5, B4, C4, D4 и E4. C2 является симметричным с C5, D2 является симметричным с D5, B3 является симметричным с B4, C3 является симметричным с C4, D3 является симметричным с D4, и E3 является симметричным с E4. Таким образом, только шесть коэффициентов должны передаваться как часть кодированного потока видеобитов, чтобы определять набор из двенадцати коэффициентов, требуемых для интерполяции субпикселной позиции "f". Кроме того, как указано выше, субпикселная позиция "f" может иметь симметрию по пикселам относительно субпикселной позиции "n". Следовательно, идентичный поднабор из шести коэффициентов может определять полные наборы из двенадцати коэффициентов фильтрации для субпикселных позиций "f" и "n".

Фиг.15 является концептуальной схемой, иллюстрирующей двенадцать позиций поддержки двумерных пикселов (при этом целопикселные позиции показаны с заглавными буквенными обозначениями) относительно субпиксела "j", с штриховкой, которая показывает симметрию по коэффициентам. В этом случае, симметрия по коэффициентам означает, что только три коэффициента фильтрации требуются для B3, C2 и C3, чтобы определять полный набор из двенадцати коэффициентов для позиций поддержки фильтра B3, B4, C2, C3, C4, C5, D2, D3, D4, D5, E3 и E4. C3 является симметричным с C4, D3 и D4, C2 является симметричным с D2, C5 и E4, и B3 являются симметричными с B4, E3 и D5. Таким образом, только три коэффициента должны передаваться как часть кодированного потока видеобитов, чтобы определять набор из двенадцати коэффициентов, требуемых для интерполяции субпикселной позиции "j".

Фиг.16 является блок-схемой, иллюстрирующей пример видеодекодера, который может декодировать видеопоследовательность, которая кодирована описанным в данном документе способом. Видеодекодер 60 является одним примером специализированного компьютерного видеоустройства, упоминаемого в данном документе как "кодер". Видеодекодер 60 включает в себя модуль 52 энтропийного декодирования, который энтропийно декодирует принимаемый поток битов, чтобы формировать квантованные коэффициенты и элементы синтаксиса прогнозирования. Элементы синтаксиса прогнозирования могут включать в себя режим кодирования, один или более векторов движения, информацию, идентифицирующую технологию интерполяции, используемую для того, чтобы формировать субпикселные данные, коэффициенты для использования в интерполяционной фильтрации и/или другую информацию, ассоциированную с формированием прогнозного блока.

Элементы синтаксиса прогнозирования, к примеру, коэффициенты направляются в модуль 55 прогнозирования. Если прогнозирование используется, чтобы кодировать коэффициенты относительно коэффициентов неперестраиваемого фильтра или относительно друг друга, модуль 53 прогнозирования коэффициентов и обратного квантования может декодировать элементы синтаксиса, чтобы задавать фактические коэффициенты. Кроме того, если квантование применяется к любому синтаксису прогнозирования, модуль 53 прогнозирования коэффициентов и обратного квантования также может удалять такое квантование. Коэффициенты фильтрации, например, могут кодироваться с прогнозированием и квантоваться согласно настоящему раскрытию, и в этом случае модуль 53 прогнозирования коэффициентов и обратного квантования может использоваться посредством видеодекодера 60, чтобы декодировать с прогнозированием и деквантовать такие коэффициенты.

Модуль 55 прогнозирования может формировать прогнозирующие данные на основе элементов синтаксиса прогнозирования и одного или более ранее декодированных блоков, которые сохраняются в запоминающем устройстве 62, способом, аналогичным подробно описанному выше относительно модуля 32 прогнозирования видеокодера 50. В частности, модуль 55 прогнозирования может выполнять одну или более технологий интерполяционной фильтрации настоящего раскрытия в ходе компенсации движения, чтобы формировать прогнозный блок с конкретной точностью, к примеру, с четверть-пикселной точностью. По сути, одна или более технологий настоящего раскрытия могут использоваться посредством видеодекодера 60 при формировании прогнозного блока. Модуль 55 прогнозирования может включать в себя модуль компенсации движения, который содержит фильтры, используемые для технологий интерполяционной и аналогичной интерполяционной фильтрации настоящего раскрытия. Компонент компенсации движения не показан на Фиг.16 для простоты и удобства иллюстрации.

Модуль 56 обратного квантования обратно квантует, т.е. деквантует квантованные блочные коэффициенты. Процесс обратного квантования может быть процессом, заданным для декодирования H.264. Модуль 58 обратного преобразования применяет обратное преобразование, к примеру, обратное DCT или концептуально аналогичный процесс обратного преобразования, к коэффициентам преобразования, чтобы формировать остаточные блоки в пикселном домене. Сумматор 64 суммирует остаточный блок с соответствующим прогнозным блоком, сформированным посредством модуля 55 прогнозирования, чтобы формировать восстановленную версию исходного блока, кодированного посредством видеокодера 50. Если требуется, фильтр удаления блочности также может применяться, чтобы фильтровать декодированные блоки, чтобы удалять артефакты блочности. Декодированные видеоблоки затем сохраняются в модуле 62 хранения опорных кадров, который предоставляет опорные блоки для последующей компенсации движения и также формирует декодированное видео, чтобы возбуждать дисплейное устройство (такое как устройство 28 по Фиг.1).

Технологии NS-AIF могут вычислять пикселные значения для двумерных субпикселных позиций с использованием интерполяционного фильтра, имеющего поддержку 36-позиционного фильтра (т.е. поддержку двумерного фильтра 6×6). S-AIF использует разделимые целопикселные позиции в качестве поддержки фильтра для интерполяционной фильтрации сначала в горизонтальном направлении, а не в вертикальной размерности. D-AIF использует менее сложный интерполяционный фильтр для вычисления двумерных субпикселных позиций, чем NS-AIF. В D-AIF двумерные субпикселные позиции вычисляются с использованием интерполяционного фильтра, имеющего либо поддержку 6-позиционного фильтра, либо поддержку 12-позиционного диагонального фильтра.

Один недостаток использования поддержки диагонального фильтра, как в D-AIF, состоит в том, что целопикселные позиции, используемые при фильтрации, находятся на значительном расстоянии от текущей позиции, которая должна интерполироваться. По мере того расстояние между текущей позицией, которая должна быть интерполирована, и позициями пикселов, используемыми в качестве поддержки фильтра, увеличивается, пространственная корреляция пикселов понижается. По сути, поддержка диагонального фильтра, используемая в D-AIF, является менее подходящей для формирования точного прогнозирования.

Чтобы обеспечивать лучшее прогнозирование с помощью пикселов с более высокой корреляцией с позицией, которая должна интерполироваться (т.е. позиций пиксела, которые находятся ближе или на меньшем расстоянии от позиции, которая должна интерполироваться), при одновременном поддержании неизменной низкой сложности, предлагаемой посредством D-AIF, поддержка 12-позиционного фильтра, показанная на Фиг.4, может использоваться для интерполяции. Целопикселные позиции, используемые в поддержке 12-позиционного фильтра, описанной в настоящем раскрытии, включают в себя четыре целопикселные позиции, окружающие субпикселные позиции, т.е. целопикселные позиции C3, C4, D3 и D4, которые могут упоминаться как "угловые" целопикселные позиции, поскольку они находятся около углов двумерных субпикселных позиций. В дополнение к угловым целопикселным позициям одна или более целопикселных позиций, непосредственно смежных с угловыми целопикселными позициями, также могут использоваться в поддержке фильтра. Целопикселные позиции, непосредственно смежные с угловыми целопикселными позициями, могут включать в себя целопикселные позиции непосредственно выше (вверх или на север) или непосредственно ниже (вниз или на юг) угловых целопикселных позиций, а также целопикселные позиции непосредственно влево (или на запад) или непосредственно вправо (или на восток) угловых целопикселных позиций. В примере, проиллюстрированном на Фиг.4, поддержка 12-позиционного фильтра может включать в себя целопикселные местоположения B3, B4, C2, C3, C4, C5, D2, D3, D4, D5, E3 и E4. Все эти целопикселные позиции находятся в пределах двух целопикселных позиций субпиксела, который должен интерполироваться.

Однако поддержка фильтра в соответствии с технологиями настоящего раскрытия может включать в себя дополнительные целопикселные местоположения. Например, поддержка фильтра может включать в себя целопикселные местоположения, которые находятся в пределах трех целопикселных позиций субпикселной позиции, которая должна интерполироваться, которые формируют радиальную форму.

Даже четверть-пикселные позиции или более точное разрешение могут быть интерполированы на основе целопикселных позиций, расположенных в пределах, по меньшей мере, двух целопикселных позиций. Таким образом, технологии поддержки фильтра настоящего раскрытия обеспечивают лучшее прогнозирование интерполяции с использованием целых пикселов с более высокой корреляцией с позицией, которая должна быть интерполирована, при одновременном поддержании неизменной низкой сложности, предлагаемой посредством D-AIF.

Как описано выше, симметрия по субпикселам может принудительно активировать идентичный набор коэффициентов фильтрации (и зеркальные, инвертированные и/или повернутые версии набора) для группы из одной или более субпикселных позиций. Аналитический процесс, к примеру, такой как процесс в уравнении (5), может использоваться, чтобы извлекать коэффициенты интерполяционной фильтрации для всех субпикселных позиций, к примеру, пятнадцати субпикселных позиций в случае четверть-пикселной точности. Анализ корреляции для пятнадцати наборов коэффициентов интерполяционной фильтрации раскрывает относительно сильную корреляцию между коэффициентами фильтрации субпикселных позиций (как одномерных, так и двумерных субпикселных позиций) в одной размерности (к примеру, вертикальной или горизонтальной размерности). Наоборот, корреляция между коэффициентами фильтрации субпикселных позиций в различных диагональных направлениях может быть заметно более слабой.

Например, может быть высокая корреляция между коэффициентами фильтрации для субпикселных позиций "a" и "c", которые находятся в горизонтальной размерности. В качестве другого примера, может быть высокая корреляция между коэффициентами фильтрации для субпикселных позиций "d" и "l", которые находятся в вертикальной размерности. Однако может иметься небольшая (если вообще имеется) корреляция между коэффициентами фильтрации для субпикселных позиций "a", которые находятся в горизонтальной размерности, и субпикселной позиции "d", которая находится в вертикальной размерности. На основе этих наблюдений корреляций, симметрия по субпикселам может быть разработана так, что симметрия по субпикселам для коэффициентов фильтрации субпикселных позиций в диагональных размерностях не накладывается. Это приводит к восьми наборам коэффициентов, как описано в данном документе, что может составлять большее число наборов, чем требуется для некоторых традиционных процессов. Посредством исключения диагональной симметрии по пикселам для некоторых местоположений пикселов, как описано в данном документе, кодирование и сжатие видео могут улучшаться.

С другой стороны, Фиг.7 показывает позиции пиксела с одинаковыми штриховками, которые принадлежат группе субпикселных позиций, которые имеют симметрию по субпикселам. В частности, субпикселные позиции "a" и "c" формируют первую группу, имеющую симметрию по субпикселам, субпикселные позиции "d" и "l" формируют вторую группу, имеющую симметрию по субпикселам, субпикселные позиции "e", "g", "m" и "o" формируют третью группу, имеющую симметрию по субпикселам, субпикселные позиции "f" и "n" формируют четвертую группу, имеющую симметрию по субпикселам, и субпикселные позиции "i" и "k" формируют пятую группу, имеющую симметрию по субпикселам. Субпикселные позиции "b", "h" и "j" не имеют симметрии по субпикселам с другими субпикселными позициями. По сути, субпикселные позиции "b", "h" и "j" могут рассматриваться как принадлежащие собственным группам; шестой, седьмой и восьмой группе, соответственно. Каждая группа коэффициентов (которая может быть поднаборами вследствие симметрии по коэффициентам) может передаваться один раз в расчете на кодированную единицу или, возможно, многократно в расчете на кодированную единицу, если различные типы фильтрации задаются для различных областей или признаков кодированной единицы. Коэффициенты для аналогичной интерполяционной целопикселной фильтрации также могут отправляться один раз или несколько раз в расчете на кодированную единицу.

В NS-AIF и D-AIF симметрия по субпикселам существует между субпикселными позициями в одной размерности, к примеру, между двумя субпикселными позициями в вертикальной размерности или двумя субпикселными позициями в горизонтальной размерности. В некоторой традиционной NS-AIF и D-AIF, симметрия также существует по диагонали между субпикселными позициями в различных размерностях. Например, симметрия по субпикселам существует между субпикселной позицией "a" в вертикальной размерности и субпикселной позицией "d" в горизонтальном направлении в некоторой традиционной NS-AIF и D-AIF. С симметрией по субпикселам в горизонтальной, вертикальной и диагональной размерностях только пять уникальных наборов коэффициентов интерполяционной фильтрации могут использоваться для четверть-пикселной точности.

Для некоторых типов S-AIF, с другой стороны, симметрия по субпикселам существует между субпикселными позициями в вертикальном направлении (или размерности), но не между субпикселными позициями в горизонтальной размерности. Другими словами, симметрия по субпикселам не всегда существует для субпикселных позиций в одной размерности. Симметрии по субпикселам также не существует в диагональных размерностях. Симметрия некоторых схем S-AIF, таким образом, требует большего числа наборов коэффициентов интерполяции. В частности, для четверть-пикселной точности, некоторые схемы S-AIF требуют одиннадцати уникальных наборов коэффициентов интерполяции.

Схема симметрии по субпикселам, описанная и проиллюстрированная на Фиг.7, может приводить к более точному прогнозированию, чем симметрия по субпикселам, описанная выше для некоторых типов NS-AIF и D-AIF. В частности, схема симметрии по субпикселам по Фиг.7 налагает симметрию по субпикселам в одной размерности (к примеру, в горизонтальном направлении или вертикальном направлении), но не налагает симметрию по субпикселам одновременно в обеих размерностях (к примеру, по диагонали).

Посредством невыполнения наложения симметрии по субпикселам для субпикселных позиций по диагонали, слабая корреляция между коэффициентами интерполяционной фильтрации и субпикселными позициями в различных размерностях не интегрируется в интерполяцию. Хотя большее число наборов коэффициентов интерполяции может требоваться (к примеру, восемь вместо пяти), результирующие интерполированные прогнозирующие данные могут быть более точными. Диагональная симметрия по коэффициентам также может не допускаться или исключаться аналогичным способом.

Модуль 32 прогнозирования также может накладывать симметрию по коэффициентам, как описано выше. В частности, симметрия по коэффициентам накладывается для коэффициентов фильтрации в одной размерности (к примеру, в горизонтальном или вертикальном направлении), но не для обеих размерностей диагональным способом. Например, коэффициенты фильтрации для субпикселной позиции "e" не задаются принудительно как горизонтально симметричные как в схеме NS-AIF, описанной выше и представленной в уравнении (11). Симметрия по коэффициентам обобщается ниже в уравнениях (17)-(21).

Следует отметить, что для субпикселных позиций "f", "i" и "j", некоторые коэффициенты фильтрации, т.е. , равны нулю в случаях, в которых 12-позиционный фильтр, описанный подробно относительно Фиг.4, может использоваться. По сути, симметрия по субпикселам и коэффициентам, описанная в этом раскрытии сущности, может использоваться вместе или отдельно от технологий поддержки фильтра. При использовании вместе с поддержкой 12-позиционного фильтра, описанной на Фиг.4, предусмотрено 6(a)+3(b)+6(d)+3(h)+12(e)+6(f)+6(i)+3(j)=45 уникальных коэффициентов для этих субпикселных позиций, которые должны отправляться в декодер, т.е. 6 коэффициентов для группы, включающей в себя субпикселную позицию "a", 3 коэффициента для группы, включающей в себя субпикселную позицию "b", 6 коэффициентов для группы, включающей в себя субпикселную позицию "d", 3 коэффициента для группы, включающей в себя субпикселную позицию "h", 12 коэффициентов для группы, включающей в себя субпикселную позицию "e", 6 коэффициентов для группы, включающей в себя субпикселную позицию "f", 6 коэффициентов для группы, включающей в себя субпикселную позицию "i", и 3 коэффициента для группы, включающей в себя субпикселную позицию "j".

Фиг.17 является блок-схемой последовательности операций, иллюстрирующей примерную работу видеокодера, который использует поддержку фильтра на двенадцать пикселов в соответствии с настоящим раскрытием. Технология по Фиг.17 описывается с точки зрения видеокодера 50 по Фиг.2, хотя другие устройства могут выполнять аналогичные технологии. Как показано, на Фиг.17, MC-модуль 37 модуля 32 прогнозирования получает блок пикселов из запоминающего устройства 34, которые включают в себя целопикселные значения, соответствующие целопикселным позициям (171). Фильтр(ы) 39 вычисляет субпикселные значения на основе поддержки фильтра, которая содержит двенадцать или более позиций, которые окружают субпикселные позиции (172). Как подробнее поясняется выше, поддержка 12-позиционного фильтра может использоваться для того, чтобы формировать девять из пятнадцати возможных субпикселных интерполяций, при этом линейная горизонтальная и линейная вертикальная фильтрация может использоваться для того, чтобы формировать шесть из пятнадцати возможных субпикселных интерполяций.

MC-модуль 37 затем формирует прогнозный блок на основе вычисленных субпикселных значений (173). В частности, MC-модуль 37 может формировать и выводить интерполированный прогнозный блок, содержащий интерполированные субпикселные значения. Сумматор 48 затем может кодировать текущий видеоблок на основе интерполированного прогнозного блока (174), к примеру, посредством вычитания интерполированного прогнозного блока из кодируемого видеоблока, чтобы формировать остаточный блок. Остаточный блок затем может быть преобразован и квантован посредством модуля 38 преобразования и модуля 40 квантования, соответственно. После энтропийного кодирования посредством модуля 46 энтропийного кодирования, видеокодер 50 может выводить кодированный поток видеобитов и информацию фильтра (175). Информация фильтра, как описано в данном документе, может содержать восемь наборов коэффициентов, используемых для формирования всех пятнадцати наборов коэффициентов для пятнадцати субпикселных позиций. Информация фильтра может выводиться один раз в расчете на кодированную единицу или, возможно, несколько раз в расчете на кодированную единицу, если различные области кодированной единицы используют различные типы субпикселной интерполяции.

Фиг.18 является блок-схемой последовательности операций, иллюстрирующей примерную работу видеодекодера, который использует поддержку фильтра на двенадцать пикселов в соответствии с настоящим раскрытием. Таким образом, процесс по Фиг.18 может рассматриваться процессом взаимно-обратного декодирования для процесса кодирования по Фиг.17. Фиг.18 описывается с точки зрения видеодекодера 60 по Фиг.16, хотя другие устройства могут выполнять аналогичные технологии. Как показано на Фиг.18, видеодекодер 60 принимает кодированные видеоблоки и информацию фильтра (181). Модуль 52 энтропийного декодирования может энтропийно декодировать эту принимаемую информацию. Модуль 55 прогнозирования выполняет интерполяционную компенсацию движения согласно технологиям настоящего раскрытия. В частности, модуль 55 прогнозирования получает блок пикселов из запоминающего устройства 62, которые включают в себя целопикселные значения, соответствующие целопикселным позициям (182). Модуль 55 прогнозирования может использовать принимаемые векторы движения, чтобы определять то, как выполнять интерполяцию. На основе векторов движения, модуль 55 прогнозирования может вычислять субпиксел на основе поддержки фильтра, которая содержит двенадцать или более позиций, которые окружают субпикселные позиции (183). Таким образом, модуль 55 прогнозирования использует интерполяцию для того, чтобы формировать прогнозный блок (184). Прогнозный блок может использоваться для того, чтобы декодировать остаточный видеоблок посредством вызова сумматора 64, чтобы прибавлять прогнозный блок к остаточному блоку (185). Различные аспекты интерполяции, описанные в данном документе, в том числе использование поддержки 12-позиционного фильтра, которая окружает субпикселные позиции в радиальной форме, позволяет улучшать кодирование видео посредством предоставления интерполированных данных лучшего качества, чем традиционные технологии.

Фиг.19 является блок-схемой последовательности операций, иллюстрирующей примерную работу видеокодера, который использует симметрию по коэффициентам и симметрию по пикселам в соответствии с настоящим раскрытием. Технология по Фиг.19 описывается с точки зрения видеокодера 50 по Фиг.2, хотя другие устройства могут выполнять аналогичные технологии. Как показано, на Фиг.19, модуль 32 прогнозирования видеокодера 50 задает восемь наборов коэффициентов фильтрации для пятнадцати субпикселных позиций на основе симметрии по коэффициентам и симметрии по пикселам, как описано в данном документе (201). В частности, модуль 32 прогнозирования может использовать симметрию по пикселам, чтобы уменьшать наборы коэффициентов с пятнадцати до восьми, и дополнительно может уменьшать число коэффициентов для некоторых или всех восьми наборов на основе симметрии по коэффициентам между коэффициентами данных наборов. Модуль 32 прогнозирования затем может кодировать видеоданные с использованием интерполяционных фильтров (таких как фильтр(ы) 39) и восьми наборов коэффициентов фильтрации (202). Видеокодер 50 может выводить кодированные видеоданные и восемь наборов коэффициентов фильтрации (203). Восемь наборов коэффициентов, которые кодируются и выводятся в потоке битов, могут отправляться с каждой кодированной единицей (к примеру, с каждым кадром или серией последовательных макроблоков) так, что устройству декодирования могут сообщаться коэффициенты фильтрации, которые следует использовать для интерполяции. Альтернативно, различные группы из восьми наборов коэффициентов могут кодироваться и отправляться с каждой кодированной единицей, чтобы предоставлять различные типы интерполяций в различных местоположениях в рамках кодированной единицы.

Фиг.20 является блок-схемой последовательности операций, иллюстрирующей примерную работу видеодекодера, который использует симметрию по коэффициентам и симметрию по пикселам в соответствии с настоящим раскрытием. В этом случае, модуль 55 прогнозирования видеодекодера 60 принимает восемь наборов коэффициентов фильтрации (191) и формирует пятнадцать наборов коэффициентов фильтрации на основе восьми наборов, симметрии по коэффициентам и симметрии по пикселам. Модуль 60 прогнозирования затем может программировать свои интерполяционные фильтры и применять такие интерполяционные фильтры, чтобы надлежащим образом формировать интерполированные прогнозирующие данные (193). Видеодекодер 60 затем может декодировать видеоблоки на основе прогнозирующих данных (194), к примеру, при вызове сумматора 64, чтобы прибавлять корректные прогнозирующие данные, интерполированные посредством модуля 55 прогнозирования, к остаточному блоку, который должен быть декодирован.

Фиг.21 является блок-схемой последовательности операций, иллюстрирующей примерную работу видеокодера, который использует фильтрацию целопикселных местоположений, чтобы формировать регулируемые целопикселные значения в соответствии с настоящим раскрытием. Она поясняется выше как аналогичная интерполяционной фильтрация, поскольку она является аналогичной интерполяциям, но не формирует значения в целочисленный субпиксел. Наоборот, этот процесс формирует новые целочисленные значения, которые фильтруются на основе исходного целочисленного значения и других целочисленных значений, которые окружают исходное целочисленное значение.

Фиг.21 описывается с точки зрения видеокодера 50 по Фиг.2, хотя другие устройства могут выполнять аналогичные технологии. Как показано, на Фиг.21, MC-модуль 37 модуля 32 прогнозирования получает блок пикселов из запоминающего устройства 34, которые включают в себя целопикселные значения, соответствующие целопикселным местоположениям (211). Фильтр(ы) 39 модуля 32 прогнозирования фильтрует целопикселные значения на основе других целопикселных значений блока пикселов, чтобы формировать регулируемые целопикселные значения (212). Модуль 32 прогнозирования формирует прогнозный блок на основе отрегулированных целопикселных значений (213), и видеокодер 50 кодирует видеоблок на основе прогнозного блока (214), к примеру, при вызове сумматора 48, чтобы вычитать прогнозный блок из кодируемого видеоблока, чтобы формировать остаточный блок. После преобразования и квантования остаточного блока посредством модуля 38 преобразования, модуля 40 квантования и после энтропийного кодирования посредством модуля 46 энтропийного кодирования, видеокодер 50 выводит кодированный видеоблок и информацию фильтра (215). Как в случае субпикселной интерполяции, аналогичная интерполяционной фильтрация относительно целопикселных местоположений может заключать в себе вывод и передачу информации фильтра один раз в расчете на кодированную единицу или, возможно, несколько раз в расчете на кодированную единицу, если различные области кодированной единицы используют различные типы целочисленной аналогичной интерполяционной фильтрации.

Фиг.22 является блок-схемой последовательности операций, иллюстрирующей примерную работу видеодекодера, который использует фильтрацию целопикселных местоположений, чтобы формировать регулируемые целопикселные значения в соответствии с настоящим раскрытием. Модуль 55 прогнозирования видеодекодера 60 принимает кодированные видеоблоки, а также принимает информацию фильтра (к примеру, один раз в расчете на кодированную единицу) (221). Модуль 55 прогнозирования получает блок пикселов из запоминающего устройства 62, которые включают в себя целопикселные значения, соответствующие целопикселным позициям (222). Модуль 55 прогнозирования активирует фильтр (не показан) как часть компенсации движения, чтобы фильтровать целопикселные значения на основе других целопикселных значений блока пикселов, чтобы формировать регулируемые целопикселные значения (223). Модуль 55 прогнозирования формирует прогнозный блок на основе отрегулированных целопикселных значений (224). Видеодекодер 60 затем может декодировать видеоблоки на основе прогнозного блока, к примеру, при вызове сумматора 64, чтобы прибавлять прогнозный блок, интерполированный посредством модуля 55 прогнозирования, к остаточному видеоблоку, который должен быть декодирован (225).

Фиг.23 является блок-схемой последовательности операций, иллюстрирующей технологию для интерполяции на основе искажения в зависимости от скорости передачи для кодирования видео на основе двух наборов вариантов фильтров. В этом случае, MC-модуль 37 модуля 32 прогнозирования может формировать два или более различных наборов прогнозирующих данных, один набор на основе первого набора вариантов интерполяционных фильтров и другой набор на основе второго набора вариантов интерполяционных фильтров. MC-модуль 37 затем может использовать основанный на искажении в зависимости от скорости передачи анализ, чтобы выбирать то, какой интерполяционный фильтр дает наилучшие результаты с точки зрения скорости и искажения. Таким образом, MC-модуль 37 не только рассматривает то, какой набор прогнозирующих данных дает наилучшие результаты (т.е. наименьшее искажение), но также учитывает тот факт, что один набор вариантов фильтров может требовать меньшего дополнительного числа битов, чтобы передавать коэффициенты фильтрации в декодер.

Как показано на Фиг.23, MC-модуль 37 модуля 32 прогнозирования формирует первые интерполированные прогнозирующие данные для кодирования видеоданных на основе первого интерполяционного фильтра (231). Первый интерполяционный фильтр, в одном примере, содержит неперестраиваемый интерполяционный фильтр, соответствующий фильтру, заданному посредством конкретного стандарта кодирования видео, такому как фильтр, который соответствует интерполяционному фильтру ITU-T H.264. Для дополнительной точности, в некоторых случаях неперестраиваемый интерполяционный фильтр может соответствовать интерполяционному фильтру ITU-T H.264 без промежуточного округления полупикселных значений, которые используются для того, чтобы формировать четверть-пикселные значения. В этом случае, неперестраиваемый интерполяционный фильтр может формировать полупикселные значения и может округлять в большую сторону такие значения в целях интерполяции до полупикселного разрешения. Тем не менее, в степени, в которой такие полупикселные значения также должны использоваться для интерполяции до четвертьпикселного разрешения, MC-модуль 37 может сохранять неокругленные версии полупикселных значений и использовать неокругленные версии полупикселных значений для интерполяции до четверть-пикселного разрешения. Находящаяся одновременно на рассмотрении и переуступленная заявка № ________, на имя Karczewicz и др., озаглавленная "ADVANCED INTERPOLATION TECHNIQUES FOR MOTION COMPENSATION IN VIDEO CODING", номер дела поверенного 081399U1, которая подана в один день с настоящей заявкой и которая включена в настоящий документ посредством ссылки, предоставляет множество дополнительных сведений относительно интерполяционной фильтрации без промежуточного округления полупикселных значений, которые используются, чтобы формировать четверть-пикселные значения.

Затем MC-модуль 37 модуля 32 прогнозирования формирует вторые интерполированные прогнозирующие данные для кодирования видео для видеоданных на основе второго интерполяционного фильтра (232). В одном примере второй интерполяционный фильтр может содержать адаптивный интерполяционный фильтр. В этом случае, согласовано адаптивной интерполяции, MC-модуль 37 может задавать коэффициенты фильтрации, которые должны использоваться. В частности, MC-модуль 37 может выполнять адаптивный интерполяционный процесс, в котором MC-модуль 37 начинает с предварительно установленных коэффициентов фильтрации, формирует предварительные прогнозирующие данные и затем регулирует коэффициенты фильтрации в адаптивном процессе так, что такие коэффициенты фильтрации задают более желательные прогнозирующие данные.

После того как MC-модуль 37 модуля 32 прогнозирования формирует как первые, так и вторые интерполированные прогнозирующие данные, MC-модуль 37 может выбирать между первыми интерполированными прогнозирующими данными и вторыми интерполированными прогнозирующими данными на основе анализа искажения в зависимости от скорости передачи (233). Таким образом, MC-модуль 37 не только рассматривает то, какой набор прогнозирующих данных дает наилучшие результаты (т.е. наименьшее искажение), но MC-модуль 37 также принимает во внимание различные объемы данных (т.е. различные скорости передачи битов), которые должны требоваться для первого интерполяционного фильтра относительно второго интерполяционного фильтра. А именно, если неперестраиваемый интерполяционный фильтр используется (к примеру, в качестве первого интерполяционного фильтра), видеокодер 50 не должен кодировать коэффициенты фильтрации в потоке битов, тогда как если адаптивный интерполяционный фильтр используется (к примеру, в качестве второго интерполяционного фильтра), видеокодер 50 должен кодировать коэффициенты фильтрации. Соответственно, анализ искажения в зависимости от скорости передачи может определять то, какой набор прогнозирующих данных дает наилучшие результаты (т.е. наименьшая функция затрат на искажение в зависимости от скорости передачи), посредством учета того факта, что использование неперестраиваемого интерполяционного фильтра не требует дополнительных битов, чтобы передавать коэффициенты фильтрации в декодер.

Более конкретно, выбор между первыми интерполированными прогнозирующими данными и вторыми интерполированными прогнозирующими данными на основе анализа искажения в зависимости от скорости передачи (233) может содержать вычисление первой функции затрат на искажение в зависимости от скорости передачи, ассоциированной с видеоданными, если видеоданные кодируются через первые интерполированные прогнозирующие данные, вычисление второй функции затрат на искажение в зависимости от скорости передачи, ассоциированной с видеоданными, если видеоданные кодируются через вторые интерполированные прогнозирующие данные, и выбор между первыми интерполированными прогнозирующими данными и вторыми интерполированными прогнозирующими данными на основе первой и второй функций затрат на искажение в зависимости от скорости передачи.

Функция затрат на искажение в зависимости от скорости передачи, ассоциированная с видеоданными, если видеоданные кодируются через первые интерполированные прогнозирующие данные, может содержать первый разностный показатель, к примеру, среднеквадратическую ошибку (MSE) пикселных значений или сумму абсолютной разности (SAD) пикселных значений или сумму квадрата разности (SSD) пикселных значений, указывающий разность между видеоданными и первыми интерполированными прогнозирующими данными, плюс первое значение, которое определяет количественно затраты, ассоциированные с кодированием коэффициентов фильтрации. В этом случае, если первый интерполяционный фильтр является неперестраиваемым интерполяционным фильтром, первое значение, которое определяет количественно затраты, может быть задано как нуль. Аналогично, вторая функция затрат на искажение в зависимости от скорости передачи может содержать второй разностный показатель, указывающий разности между видеоданными и вторыми интерполированными прогнозирующими данными (MSE, SAD или SSD), плюс второе значение, которое определяет количественно затраты, ассоциированные с кодированием коэффициентов фильтрации. В случае если второй интерполяционный фильтр является адаптивным интерполяционным фильтром, второе значение, которое определяет количественно затраты, ассоциированные с кодированием коэффициентов фильтрации, может содержать число битов (r), требуемое для того, чтобы кодировать коэффициенты адаптивной интерполяционной фильтрации, или, возможно, это число (r), умноженное на множитель Лагранжа (λ).

После выбора между первыми интерполированными прогнозирующими данными и вторыми интерполированными прогнозирующими данными на основе анализа искажения в зависимости от скорости передачи (233), MC-модуль 37 модуля 32 прогнозирования кодирует видеоданные на основе выбора (234) и кодирует синтаксис, чтобы указывать выбор (235). Синтаксис может содержать однобитовый флаг или многобитовый флаг, который задает то, должен первый интерполяционный фильтр или второй интерполяционный фильтр использоваться посредством декодера. Процесс по Фиг.23 может повторяться для каждого из множества субпикселных местоположений для каждой кодированной единицы видеопоследовательности, чтобы указывать, должен первый интерполяционный фильтр или второй интерполяционный фильтр использоваться посредством декодера для каждого из множества субпикселных местоположений. Субпикселные местоположения могут содержать пятнадцать возможных субпикселных местоположений согласно интерполяции до четвертьпикселного разрешения или могут содержать другое число субпикселных местоположений. Процесс по Фиг.23 также может повторяться для целопикселного местоположения для каждой кодированной единицы видеопоследовательности, чтобы указывать, должен первый интерполяционный фильтр или второй интерполяционный фильтр использоваться посредством декодера для целопикселного местоположения.

После того как видеокодер 50 (Фиг.2) кодирует видеоданные на основе выбора (234) и кодирует синтаксис, чтобы указывать выбор (235), модем 23 и передающее устройство 24 (Фиг.1) может модулировать и передавать кодированные видеоданные и синтаксис в целевое устройство 17. В случае если первый интерполяционный фильтр является неперестраиваемым, а второй интерполяционный фильтр является адаптивным, передающее устройство 24 может передавать коэффициенты фильтрации, когда синтаксис указывает, что вторые интерполированные прогнозирующие данные использованы, чтобы формировать кодированные видеоданные, но может не передавать коэффициенты фильтрации, когда синтаксис указывает, что первые интерполированные прогнозирующие данные использованы, чтобы формировать кодированные видеоданные. Таким образом, когда первый интерполяционный фильтр является неперестраиваемым, а второй интерполяционный фильтр является адаптивным, коэффициенты фильтрации отправляются только в том случае, если синтаксис указывает, что адаптивная интерполяционная фильтрация использована, и решение, использовать или нет адаптивную интерполяционную фильтрацию, рассматривает не только качество прогнозирующего видео, но также и скорость передачи битов, на которую влияет присутствие коэффициентов фильтрации в передаваемом потоке битов. В других примерах, тем не менее, первый и второй интерполяционные фильтры могут быть неперестраиваемыми или могут быть адаптивными.

Технологии этого раскрытия сущности могут применяться во многих сценариях, в том числе в сценариях, когда предусмотрено более двух наборов фильтров, выбранных посредством кодера. Другими словами, дополнительные интерполяционные фильтры также могут применяться, чтобы формировать дополнительные интерполированные прогнозирующие данные, которые также могут рассматриваться при анализе искажения в зависимости от скорости передачи. Другими словами, способ не ограничен формированием только первых и вторых интерполированных прогнозирующих данных на основе двух интерполяционных фильтров, но может применяться, чтобы формировать любое множество интерполированных прогнозирующих данных на основе любого числа интерполяционных фильтров. Важно, что интерполированные прогнозирующие данные анализа искажения в зависимости от скорости передачи используются для того, чтобы идентифицировать то, какой фильтр следует выбирать. В одном примере, способ, выполняемый посредством видеокодера 50, может содержать формирование множества различных версий прогнозирующих данных для кодирования видеоданных на основе множества различных интерполяционных фильтров, выбор из множества различных версий прогнозирующих данных на основе анализа искажения в зависимости от скорости передачи, кодирование видеоданных на основе выбора и кодирование синтаксиса, чтобы указывать выбор.

В дополнение к выбору интерполяционного фильтра на основе анализа искажения в зависимости от скорости передачи и формированию синтаксиса, чтобы указывать выбор, MC-модуль 37 модуля 32 прогнозирования также может осуществлять аналогичный анализ искажения в зависимости от скорости передачи относительно целопикселной фильтрации, которая поясняется подробнее выше. В частности, MC-модуль 37 модуля 32 прогнозирования может формировать два или более различных наборов прогнозирующих данных для целопикселных местоположений, к примеру, один с целопикселной фильтрацией и один без целопикселной фильтрации, и может осуществлять анализ искажения в зависимости от скорости передачи относительно этих двух различных наборов, чтобы определять то, требуется или нет целопикселная фильтрация. Соответственно, MC-модуль 37 модуля 32 прогнозирования может формировать другой элемент синтаксиса на основе анализа искажения в зависимости от скорости передачи, ассоциированного с двумя различными наборами целочисленных прогнозирующих данных, чтобы указывать, должна или нет целопикселная фильтрация применяться для кодированной единицы, при этом первый набор целочисленных прогнозирующих данных не фильтруется, а второй набор целочисленных прогнозирующих данных фильтруется. Таким образом, решение, осуществлять или нет целопикселную фильтрацию, может быть основано не только на качестве кодирования видео, но также и на возможном дополнительном числе битов, ассоциированном с целопикселной фильтрацией, в частности, когда целопикселная фильтрация должна заключать в себе кодирование и отправку коэффициентов целопикселной фильтрации, используемых для того, чтобы выполнять такую целопикселную фильтрацию. Целочисленная фильтрация также может рассматривать N целочисленных фильтров (к примеру, где N - это любое положительное и множественное целое число). Согласно использованию N целочисленных фильтров, вышеприведенный пример должен соответствовать случаю, где N равно двум, и один из фильтров не применяет фильтрации.

Каждый раз, когда коэффициенты интерполяционной фильтрации фактически кодируются и отправляются из исходного устройства 12 в целевое устройство 16, это раскрытие сущности также рассматривает технологии для кодирования таких коэффициентов интерполяционной фильтрации. Описанное кодирование для коэффициентов фильтрации позволяет улучшать сжатие данных. В частности, это раскрытие сущности рассматривает технологии прогнозирования для коэффициентов фильтрации, к примеру, относительно коэффициентов неперестраиваемой фильтрации. Помимо этого, это раскрытие сущности рассматривает технологии прогнозирования для второго набора коэффициентов фильтрации относительно первого набора коэффициентов фильтрации. Таким образом, несовершенная симметрия между различными коэффициентами фильтрации может быть использована для того, чтобы предоставлять возможность сжатия данных. В дополнение к использованию таких технологий прогнозирования для коэффициентов интерполяционной фильтрации, это раскрытие сущности также предусматривает полезные технологии квантования и энтропийного кодирования коэффициентов интерполяционной фильтрации на основе префиксного и суффиксного кодирования. Следующее пояснение предоставляет дополнительные сведения этих аспектов данного раскрытия сущности.

Фиг.24 является блок-схемой последовательности операций, иллюстрирующей технологию для кодирования коэффициентов фильтрации с использованием прогнозирующего кодирования. В этом случае, коэффициенты фильтрации, используемые посредством видеокодера 50, могут быть прогнозирующе кодированы относительно коэффициентов фильтрации неперестраиваемого фильтра, что дополнительно позволяет улучшать сжатие данных, когда коэффициенты фильтрации отправляются как часть кодированного потока битов.

Как показано на Фиг.24, MC-модуль 37 модуля 32 прогнозирования набор коэффициентов фильтрации для интерполяции прогнозирующих данных при кодировании видео (241). Например, MC-модуль 37 может идентифицировать набор коэффициентов фильтрации посредством выполнения процесса адаптивной интерполяционной фильтрации. В этом случае, MC-модуль 37 может определять набор коэффициентов фильтрации через процесс адаптивной интерполяционной фильтрации и формировать прогнозирующие данные на основе коэффициентов фильтрации, идентифицированных в процессе адаптивной интерполяционной фильтрации. При адаптивной интерполяционной фильтрации, как подробнее поясняется в данном документе, MC-модуль 37 может осуществлять двухпроходный подход, в котором прогнозирующие данные формируются на основе неперестраиваемого фильтра, и затем коэффициенты фильтрации регулируются так, что прогнозирующие данные задаются таким образом, чтобы быть в большей степени аналогичными кодируемым видеоданным. Отрегулированные коэффициенты фильтрации в таком случае задают коэффициенты фильтрации, которые используются и кодируются в поток битов.

Чтобы кодировать коэффициенты фильтрации так, что такие коэффициенты фильтрации могут передаваться как часть потока битов, модуль 41 прогнозирования коэффициентов и квантования может формировать остаточные значения, ассоциированные с набором коэффициентов фильтрации, на основе прогнозирующего кодирования набора коэффициентов фильтрации относительно коэффициентов фильтрации, ассоциированных с неперестраиваемым интерполяционным фильтром (242). В частности, модуль 41 прогнозирования коэффициентов и квантования может вычитать коэффициенты фильтрации, определенные в процессе адаптивной интерполяционной фильтрации, из соответствующих коэффициентов фильтрации, ассоциированных с неперестраиваемым фильтром, таким как интерполяционный фильтр ITU-T H.264 или интерполяционный фильтр ITU-T H.264 без промежуточного округления полупикселных значений. Посредством кодирования и передачи остаточных значений, вместо передачи фактических коэффициентов фильтрации, объем данных, передаваемый в потоке битов, может уменьшаться. В этом случае, декодер может программироваться, чтобы знать способ, которым кодируются коэффициенты фильтрации.

Видеокодер 50 может активировать модуль 41 прогнозирования коэффициентов и квантования, чтобы прогнозировать и квантовать остаточные коэффициенты, и модуль 46 энтропийного кодирования может энтропийно кодировать квантованные остатки (243). Видеокодер 50 затем может выводить остаточные значения как часть кодированного потока битов (244). Квантование остаточных значений, ассоциированных с коэффициентами фильтрации, может заключать в себе квантование остаточных значений, в котором, по меньшей мере, некоторым из остаточных значений, ассоциированных с различными коэффициентами фильтрации, назначаются различные уровни квантования. Таким образом, модуль 41 прогнозирования коэффициентов и квантования может назначать большее квантование большим остаточным коэффициентам и может назначать меньшее квантование более точным остаточным коэффициентам, чтобы достигать желательного равновесия квантования и точности. Когда большее квантование используется, больший объем данных исключается, но большее сжатие может достигаться. Модуль 46 энтропийного кодирования может энтропийно кодировать остаточные значения посредством назначения префиксного кода, назначения суффиксного кода и назначения значения знака для остаточных значений после квантования остаточных значений. Видеокодер 50 затем может выводить остаточные значения как часть кодированного потока битов (244).

Фиг.27 является концептуальным графиком, иллюстрирующим некоторые иллюстративные коэффициенты фильтрации, которые могут прогнозирующе кодироваться. В этом случае, коэффициенты фильтрации O₁, O₂, O₃ и O₄ могут задавать коэффициенты фильтрации, ассоциированные с неперестраиваемым интерполяционным фильтром. Коэффициенты фильтрации X₁, X₂, X₃ и X₄ могут задавать требуемые коэффициенты фильтрации, которые могут быть в достаточной степени аналогичными коэффициентам фильтрации неперестраиваемого интерполяционного фильтра. Соответственно, коэффициенты фильтрации X₁, X₂, X₃ и X₄ могут быть прогнозированы на основе коэффициентов фильтрации O₁, O₂, O₃ и O₄, соответственно. В частности, первый остаток может формироваться как разность между X₁ и O₁. Аналогично, второй остаток может формироваться как разность между X₂ и O₂, третий остаток может формироваться как разность между X₃ и O₃, и четвертый остаток может формироваться как разность между X₄ и O₄. Остатки могут содержать меньший объем данных, чем исходные коэффициенты фильтрации, тем самым, способствуя сжатию данных.

В некоторых случаях, набор коэффициентов фильтрации содержит первый набор коэффициентов фильтрации, которые задают только часть полного набора коэффициентов фильтрации, ассоциированных с адаптивным интерполяционным фильтром, при этом второй набор коэффициентов фильтрации может быть определен посредством декодера на основе первого набора коэффициентов фильтрации и симметрии по коэффициентам. Например, коэффициенты фильтрации X₁ и X₂ могут кодироваться с прогнозированием на основе O₁ и O₂, соответственно. В этом случае, тем не менее, X₃ и X₄ могут быть симметричными с X₁ и X₂, и декодер может программироваться, чтобы знать, что такая симметрия накладывается. Соответственно, с помощью симметрии коэффициенты X₃ и X₄ в этом простом примере могут исключаться из потока битов и могут вычисляться в декодере на основе известной симметрии по коэффициентам после того, как коэффициенты X₁ и X₂ декодированы с прогнозированием.

Фиг.25 является другой блок-схемой последовательности операций, иллюстрирующей технологию для кодирования коэффициентов фильтрации с использованием прогнозирующего кодирования. В этом случае, тем не менее, используются два различных типа прогнозирования. Как показано на Фиг.25, MC-модуль 37 модуля 32 прогнозирования идентифицирует набор коэффициентов фильтрации для интерполяции прогнозирующих данных при кодировании видео (251). Как в случае процесса по Фиг.24, на Фиг.25 MC-модуль 37 может идентифицировать набор коэффициентов фильтрации посредством выполнения процесса адаптивной интерполяционной фильтрации. В этом случае, MC-модуль 37 может определять набор коэффициентов фильтрации через процесс адаптивной интерполяционной фильтрации и формировать прогнозирующие данные на основе коэффициентов фильтрации, идентифицированных в процессе адаптивной интерполяционной фильтрации. При адаптивной интерполяционной фильтрации MC-модуль 37 может осуществлять двухпроходный подход, в котором прогнозирующие данные формируются на основе неперестраиваемого фильтра, и затем коэффициенты фильтрации регулируются так, что прогнозирующие данные задаются таким образом, чтобы быть в большей степени аналогичными кодируемым видеоданным. Отрегулированные коэффициенты фильтрации в таком случае задают коэффициенты фильтрации, которые используются и кодируются в поток битов.

Чтобы кодировать коэффициенты фильтрации так, чтобы такие коэффициенты фильтрации могли передаваться как часть потока битов, модуль 41 прогнозирования коэффициентов и квантования может формировать первый набор остаточных значений, ассоциированных с первым набором коэффициентов фильтрации, на основе прогнозирующего кодирования относительно коэффициентов фильтрации, ассоциированных с неперестраиваемым интерполяционным фильтром (252). В частности, модуль 41 прогнозирования коэффициентов и квантования может вычитать первый набор коэффициентов фильтрации из соответствующих коэффициентов фильтрации, ассоциированных с неперестраиваемым фильтром, таким как интерполяционный фильтр ITU-T H.264 или интерполяционный фильтр ITU-T H.264 без промежуточного округления полупикселных значений. Затем, модуль 41 прогнозирования коэффициентов и квантования может формировать второй набор остаточных значений, ассоциированных со вторым набором коэффициентов фильтрации, на основе прогнозирующего кодирования относительно первого набора коэффициентов фильтрации (253). В частности, модуль 41 прогнозирования коэффициентов и квантования может вычитать второй набор коэффициентов фильтрации из зеркальных или повернутых значений первого набора коэффициентов. Таким образом, первый набор коэффициентов кодируется с прогнозированием на основе коэффициентов неперестраиваемого фильтра, и второй набор коэффициентов кодируются с прогнозированием на основе первого набора коэффициентов. Посредством формирования остаточных значений вместо использования фактических коэффициентов фильтрации, объем данных, передаваемый в потоке битов, может уменьшаться. Кроме того, посредством использования неперестраиваемого фильтра для того, чтобы прогнозировать первый набор коэффициентов, и последующего использования первого набора коэффициентов, чтобы прогнозировать второй набор коэффициентов, дополнительное сжатие данных может достигаться относительно прогнозирования, которое основано только на неперестраиваемом фильтре.

Как в случае процесса по Фиг.24, на Фиг.25 видеокодер 50 может активировать модуль 41 прогнозирования коэффициентов и квантования, чтобы прогнозирующе кодировать и квантовать остаточные коэффициенты, и модуль 46 энтропийного кодирования может энтропийно кодировать квантованные остатки (254). Видеокодер 50 затем может выводить остаточные значения как часть кодированного потока битов (254). С другой стороны, квантование остаточных значений, ассоциированных с коэффициентами фильтрации, может заключать в себе квантование остаточных значений, в котором, по меньшей мере, некоторым из остаточных значений, ассоциированных с различными коэффициентами фильтрации, назначаются различные уровни квантования. Таким образом, модуль 41 прогнозирования коэффициентов и квантования может назначать большее квантование большим остаточным коэффициентам и может назначать меньшее квантование более точным остаточным коэффициентам, чтобы достигать желательного равновесия квантования и точности. Модуль 46 энтропийного кодирования может энтропийно кодировать остаточные значения посредством назначения префиксного кода, назначения суффиксного кода и назначения значения знака для остаточных значений после квантования остаточных значений. Видеокодер 50 затем может выводить остаточные значения как часть кодированного потока битов (255).

Фиг.28 является концептуальным графиком, иллюстрирующим некоторые иллюстративные коэффициенты фильтрации, которые могут кодироваться с прогнозированием согласно процессу по Фиг.25. В этом случае, коэффициенты фильтрации O₁ и O₂ могут задавать коэффициенты фильтрации, ассоциированные с неперестраиваемым интерполяционным фильтром. Коэффициенты фильтрации X₁ и X₂ могут задавать первый набор требуемых коэффициентов фильтрации, которые могут быть в достаточной степени аналогичными коэффициентам фильтрации неперестраиваемого интерполяционного фильтра. Соответственно, коэффициенты фильтрации X₁ и X₂ могут быть прогнозированы на основе коэффициентов фильтрации O₁ и O₂, соответственно. В частности, первый остаток может формироваться как разность между X₁ и O₁, и второй остаток может формироваться как разность между X₂ и O₂. Остатки могут содержать меньший объем данных, чем исходные коэффициенты фильтрации, тем самым, способствуя сжатию данных. Остатки затем квантуются посредством модуля 41 прогнозирования коэффициентов и квантования и энтропийно кодируются посредством модуля 46 энтропийного кодирования. и могут упоминаться как модифицированные коэффициенты фильтрации, которые формируются посредством прибавления деквантованных остатков к коэффициентам прогнозной фильтрации O₁ и O₂.

Затем, второй набор коэффициентов фильтрации Z₁ и Z₂может кодироваться с прогнозированием на основе первого набора коэффициентов X₁ и X₂, к примеру, конкретно из коэффициентов и , которые задаются на основе коэффициентов X₁ и X₂. В частности, третий остаток может формироваться как разность между Z₁ и , а четвертый остаток может формироваться как разность между Z₂ и . и могут быть в большей степени аналогичными Z₁ и Z₂, чем O₁ и O₂, следовательно, посредством использования и для того, чтобы кодировать с прогнозированием Z₁ и Z₂, дополнительному сжатию данных можно способствовать.

Фиг.26 является блок-схемой последовательности операций, иллюстрирующей технологию для декодирования коэффициентов фильтрации с использованием прогнозирующего кодирования. Фиг.26 описывается с точки зрения видеодекодера 60 по Фиг.16. Как показано, видеодекодер 60 принимает остаточные значения, ассоциированные с набором коэффициентов фильтрации (261). Видеодекодер 60 может энтропийно декодировать остаточные значения через модуль 52 энтропийного декодирования и может активировать модуль 53 прогнозирования коэффициентов и обратного квантования, чтобы деквантовать остаточные значения (262), которые затем отправляются в модуль 55 прогнозирования. Модуль 56 прогнозирования формирует набор коэффициентов фильтрации с использованием прогнозирующего декодирования остаточных значений (263).

В частности, модуль 56 прогнозирования может формировать полный набор коэффициентов фильтрации на основе остаточных значений и коэффициентов фильтрации, ассоциированных с неперестраиваемым интерполяционным фильтром, к примеру, как концептуально проиллюстрировано на Фиг.27 и разрешено выше в контексте кодирования. В некоторых случаях, первый набор коэффициентов фильтрации может быть сформирован на основе остаточных значений и коэффициентов фильтрации, ассоциированных с неперестраиваемым интерполяционным фильтром, и второй набор коэффициентов фильтрации может быть сформирован на основе симметрии. В других случаях, первый набор коэффициентов фильтрации может быть сформирован на основе остаточных значений и коэффициентов фильтрации, ассоциированных с неперестраиваемым интерполяционным фильтром, и второй набор коэффициентов фильтрации может быть сформирован на основе дополнительных остаточных значений и первого набора коэффициентов фильтрации, к примеру, как концептуально проиллюстрировано на Фиг.28 и разрешено выше в контексте кодирования. В любом случае, модуль 56 прогнозирования видеодекодера 60 применяет набор коэффициентов фильтрации, чтобы интерполировать прогнозирующие данные, используемые для прогнозирующего декодирования видеоблоков (264). В частности, модуль 56 прогнозирования фильтрует данные, чтобы формировать интерполированные прогнозирующие данные с использованием декодированных с прогнозированием коэффициентов фильтрации так, что видеоблоки могут декодироваться на основе таких интерполированных прогнозирующих данных.

С другой стороны, набор декодированных с прогнозированием коэффициентов фильтрации может содержать первый набор коэффициентов фильтрации, которые задают только часть полного набора коэффициентов фильтрации, ассоциированных с адаптивным интерполяционным фильтром. В этом случае, модуль 53 прогнозирования коэффициентов и обратного квантования видеодекодера 60 может формировать второй набор коэффициентов фильтрации на основе первого набора коэффициентов фильтрации и симметрии по коэффициентам и применять первый и второй наборы коэффициентов фильтрации, чтобы интерполировать прогнозирующие данные.

В другом случае набор декодированных с прогнозированием коэффициентов фильтрации может содержать первый набор коэффициентов фильтрации, которые задают только часть полного набора коэффициентов фильтрации, ассоциированных с адаптивным интерполяционным фильтром. В этом случае, видеодекодер 60 может принимать дополнительные остаточные значения, ассоциированные с полным набором коэффициентов фильтрации. Модуль 53 прогнозирования коэффициентов и обратного квантования может формировать второй набор коэффициентов фильтрации с использованием прогнозирующего декодирования на основе дополнительных остаточных значений и первого набора коэффициентов фильтрации, и модуль 55 прогнозирования может применять первый и второй наборы коэффициентов фильтрации, чтобы интерполировать прогнозирующие данные.

В некоторых случаях, неперестраиваемые интерполяционные фильтры на основе фильтров H.264/AVC могут использоваться для того, чтобы прогнозировать одномерные фильтры (которые могут включать в себя фильтры для субпикселных позиций a, b, d, h, показанных на Фиг.8, 9, 10 и 11). Для двумерных фильтров, которые включают в себя фильтры для субпикселных позиций e, f, i и j, показанных на Фиг.12, 13, 14 и 15, одна из следующих схем прогнозирования может использоваться:

1. Задание прогнозирования равным нулю (отсутствует прогнозирование), .

2. Использование прогнозирования на основе неперестраиваемого фильтра, такого как средний фильтр, собранный для обучающего набора, т.е. , где - это (i,j)-тый коэффициент фильтрации в среднем фильтре для субпикселной позиции SP.

3. Использование возможной симметрии в коэффициентах и использование уже кодированных коэффициентов, чтобы прогнозировать оставшиеся коэффициенты.

Для одномерных фильтров также может применяться любой из этих трех способов прогнозирования.

Для прогнозирования Фиг.29 предоставляет пример матрицы коэффициентов целопикселной фильтрации, для которых технологии прогнозирования могут использоваться для кодирования. В этом примере, можно предположить, что симметрия не накладывается на целопикселный фильтр. Коэффициенты (h0,0), (h0,1), (h1,0), (h1,1), (h2,0), (h2,1) (h0,2), (h1,2) и (h2,2) могут квантоваться и кодироваться сначала. Затем, уже кодированные верхние левые коэффициенты (h0,0), (h0,1), (h1,0), (h1,1) и (h2,0) могут использоваться для того, чтобы прогнозировать правые верхние коэффициенты (h0,3), (h1,3), (h2,3), (h0,4), (h1,4) и (h2,4). Затем, после того как верхняя половина коэффициентов фильтрации (h0,0), (h0,1), (h0,2), (h0,3) (h0,4), (h1,0), (h1,1), (h1,2), (h1,3) и (h1,4) квантована и кодирована, они дополнительно могут использоваться для того, чтобы прогнозировать нижнюю половину коэффициентов фильтрации (h3,0), (h3,1), (h3,2), (h3,3), (h3,4), (h4,0), (h4,1), (h4,2), (h4,3) и (h4,4). Прогнозирование других коэффициентов фильтрации может выполняться аналогичным способом. Например, для фильтра субпикселной позиции "e" (см. Фиг.12), который может иметь определенную симметрию по диагонали, правые верхние коэффициенты могут сначала квантоваться и кодироваться и затем использоваться для того, чтобы прогнозировать левые нижние коэффициенты.

В любом случае, после прогнозирования коэффициентов (к примеру, посредством модуля 41 прогнозирования коэффициентов и квантования модуля 32 прогнозирования) ошибки прогнозирования квантуются (к примеру, посредством модуля 41 прогнозирования коэффициентов и квантования). Как описано выше, так называемое "неравномерное квантование" может использоваться. В этом случае, точность квантования, применяемого посредством модуля 41 прогнозирования коэффициентов и квантования, может зависеть от местоположения коэффициента. Выяснено, что для коэффициентов с меньшей величиной (которые типично являются коэффициентами на большем расстоянии от центра фильтра), лучшая точность может быть желательной. Напротив, для коэффициентов с большей величиной (которые типично являются коэффициентами на меньшем расстоянии до центра фильтра), меньшая точность является более желательной.

Следующие матрицы, Q ^1D , Q ^2D , Q ^FP, могут использоваться посредством модуля 41 прогнозирования коэффициентов и квантования, чтобы указывать точность квантования для коэффициентов в одномерных фильтрах, двумерных фильтрах и целопикселном фильтре, соответственно. Следует отметить, что числа битов, указанные в матрицах, могут включать в себя 1 бит, чтобы кодировать знак соответствующих коэффициентов.

Модуль 41 прогнозирования коэффициентов и квантования может кодировать ошибки прогнозирования квантованных коэффициентов, т.е. остатки коэффициентов, на основе простой схемы префиксного кодирования. Во-первых, динамический диапазон величины ошибки прогнозирования разделяется на N элементов разрешения, например, N=6. Если динамический диапазон величины составляет [0, …, 2^g-1-1], где q - это точность квантования для данной позиции коэффициента (к примеру, указываемая в матрицах выше), то каждый элемент разрешения n, n=0, …, N-1 может охватывать следующие диапазоны:

В этом случае, элемент разрешения b, b=0..., N-1, которому принадлежит входная величина m, может кодироваться с использованием унарного префиксного кода (который принимает b+1 битов). Затем, остаток величины, m-b _start, может кодироваться с использованием суффиксного кода фиксированной длины в (g-N+b-1) битов. В завершение, знак ошибки прогнозирования кодируется с использованием 1 бита.

Например, для среднего коэффициента в одномерном фильтре, точность в 9 битов может использоваться посредством модуля 41 прогнозирования коэффициентов и квантования, чтобы квантовать ошибку прогнозирования, т.е. g=9, из которых 8 битов могут использоваться для того, чтобы квантовать абсолютную величину ошибки. Если абсолютная величина ошибки равна 97, то она находится в рамках 4-ого элемента разрешения, т.е. b=4. Следовательно, унарный префиксный код "11110" может быть кодирован, чтобы указывать 4-ый элемент разрешения, и остаток m-b _start=97-64=33 может быть кодирован с использованием суффиксного кода фиксированной длины в (g-N+b-1)=(9-6+4-1)=6 битов. В завершение, бит "0" может быть кодирован, чтобы указывать положительный знак.

Технологии настоящего раскрытия могут быть реализованы в широком спектре устройств или приборов, в том числе в беспроводном переносном телефоне и интегральной схеме (IC) или наборе IC (т.е. наборе микросхем). Все описанные компоненты, модули или узлы предусмотрены для того, чтобы подчеркивать функциональные аспекты, и не обязательно требуют реализации посредством различных аппаратных модулей.

Технологии, описанные в данном документе, могут быть реализованы в аппаратных средствах, программном обеспечении, микропрограммном обеспечении или в любой их комбинации. При реализации в аппаратных средствах, любые признаки, описанные как модули, узлы или компоненты, могут быть реализованы совместно в интегрированном логическом устройстве или отдельно как дискретные, но взаимодействующие логические устройства. При реализации в программном обеспечении, технологии могут быть реализованы, по меньшей мере, частично посредством машиночитаемого носителя, содержащего инструкции, которые, когда выполняются в процессоре, осуществляют один или более способов, описанных выше, Машиночитаемый носитель может содержать машиночитаемый носитель хранения данных и может являться частью компьютерного программного продукта, который может включать в себя упаковку. Машиночитаемые носители хранения данных могут содержать оперативное запоминающее устройство (RAM), такое как синхронное динамическое оперативное запоминающее устройство (SDRAM), постоянное запоминающее устройство (ROM), энергонезависимое оперативное запоминающее устройство (NVRAM), электрически стираемое программируемое постоянное запоминающее устройство (EEPROM), флэш-память, магнитные или оптические носители хранения данных и т.п. Дополнительно или альтернативно, технологии могут быть реализованы, по меньшей мере, частично посредством машиночитаемой среды связи, которая переносит или передает код в форме инструкций или структур данных, и к которой можно осуществлять доступ, считывать или выполнять посредством компьютера.

Код может выполняться посредством одного или более процессоров, например, одного или более процессоров цифровых сигналов (DSP), микропроцессоров общего назначения, специализированных интегральных схем (ASIC), программируемых пользователем вентильных матриц (FPGA) или других эквивалентных интегральных или дискретных логических схем. Соответственно, термин "процессор" при использовании в данном документе может означать любую вышеуказанную структуру или другую структуру, подходящую для реализации технологий, описанных в данном документе. Помимо этого, в некоторых аспектах функциональность, описанная в данном документе, может быть предоставлена в рамках специализированных программных модулей или аппаратных модулей, конфигурированных для кодирования или декодирования либо встроенных в комбинированный видеокодек. Кроме того, технологии могут быть полностью реализованы в одной или более схем или логических элементов.

Описаны различные аспекты раскрытия сущности изобретения. Эти и другие аспекты находятся в рамках объема прилагаемой формулы изобретения.

1. Способ видеокодирования, содержащий этапы, на которых:
формируют множество различных версий прогнозирующих данных для кодирования видеоданных на основе множества различных интерполяционных фильтров;
выбирают из множества различных версий прогнозирующих данных на основе анализа искажения в зависимости от скорости передачи;
кодируют видеоданные на основе выбора; и
кодируют синтаксис, чтобы указывать выбор, причем отдельный элемент синтаксиса определяется для каждого из множества субпикселных местоположений.

2. Способ по п.1, в котором формирование и выбор содержат этапы, на которых:
формируют первые интерполированные прогнозирующие данные для кодирования видеоданных на основе первого интерполяционного фильтра;
формируют вторые интерполированные прогнозирующие данные для кодирования видеоданных на основе второго интерполяционного фильтра; и
выбирают между первыми интерполированными прогнозирующими данными и вторыми интерполированными прогнозирующими данными на основе анализа искажения в зависимости от скорости передачи.

3. Способ по п.2, в котором первый интерполяционный фильтр соответствует неперестраиваемому интерполяционному фильтру.

4. Способ по п.3, в котором первый интерполяционный фильтр выполнен без промежуточного округления дробно-пикселных значений, которые используются, чтобы формировать другие дробно-пикселные значения.

5. Способ по п.2, в котором первый интерполяционный фильтр соответствует неперестраиваемому интерполяционному фильтру, а второй интерполяционный фильтр соответствует адаптивному интерполяционному фильтру.

6. Способ по п.2, в котором синтаксис содержит флаг, который определяет, должен ли первый интерполяционный фильтр или второй интерполяционный фильтр использоваться декодером.

7. Способ по п.2, в котором отдельный элемент синтаксиса определен для каждого из множества субпикселных местоположений для кодированной единицы, чтобы указывать, должен ли первый интерполяционный фильтр или второй интерполяционный фильтр использоваться декодером для каждого из множества субпикселных местоположений.

8. Способ по п.1, в котором отдельный элемент синтаксиса определен для целопикселных местоположений видеоданных, чтобы указывать, должен ли первый фильтр или второй фильтр использоваться декодером для целопикселных местоположений.

9. Способ по п.7, в котором первый фильтр не применяет фильтрацию, а второй фильтр ассоциирован с коэффициентами адаптивной фильтрации.

10. Способ по п.2, дополнительно содержащий этап, на котором передают кодированные видеоданные и синтаксис, чтобы указывать, использовались ли первые интерполированные прогнозирующие данные или вторые интерполированные прогнозирующие данные, чтобы сформировать кодированные видеоданные.

11. Способ по п.10, дополнительно содержащий этапы, на которых: передают коэффициенты фильтрации, когда второй интерполяционный фильтр является адаптивным, и синтаксис указывает, что вторые интерполированные прогнозирующие данные использовались, чтобы сформировать кодированные видеоданные; и не передают коэффициенты фильтрации, когда первый интерполяционный фильтр является неперестраиваемым, и синтаксис указывает, что первые интерполированные прогнозирующие данные использовались, чтобы сформировать кодированные видеоданные.

12. Способ по п.2, в котором выбор между первыми интерполированными прогнозирующими данными и вторыми интерполированными прогнозирующими данными на основе анализа искажения в зависимости от скорости передачи содержит этапы, на которых: вычисляют первую функцию затрат на искажение в зависимости от скорости передачи, ассоциированную с видеоданными, если видеоданные кодируются посредством первых интерполированных прогнозирующих данных; вычисляют вторую функцию затрат на искажение в зависимости от скорости передачи, ассоциированную с видеоданными, если видеоданные кодируются посредством вторых интерполированных прогнозирующих данных; и выбирают между первыми интерполированными прогнозирующими данными и вторыми интерполированными прогнозирующими данными на основе первой и второй функций затрат на искажение в зависимости от скорости передачи.

13. Устройство видеокодирования, содержащее видеокодер, который:
формирует множество различных версий прогнозирующих данных для кодирования видеоданных на основе множества различных интерполяционных фильтров;
выбирает из множества различных версий прогнозирующих данных на основе анализа искажения в зависимости от скорости передачи;
кодирует видеоданные на основе выбора; и
кодирует синтаксис, чтобы указывать выбор, причем отдельный элемент синтаксиса определяется для каждого из множества субпикселных местоположений.

14. Устройство по п.13, в котором видеокодер: формирует первые интерполированные прогнозирующие данные для кодирования видеоданных на основе первого интерполяционного фильтра; формирует вторые интерполированные прогнозирующие данные для кодирования видеоданных на основе второго интерполяционного фильтра; и выбирает между первыми интерполированными прогнозирующими данными и вторыми интерполированными прогнозирующими данными на основе анализа искажения в зависимости от скорости передачи.

15. Устройство по п.14, в котором первый интерполяционный фильтр соответствует неперестраиваемому интерполяционному фильтру.

16. Устройство по п.15, в котором неперестраиваемый интерполяционный фильтр выполнен без промежуточного округления дробно-пикселных значений, которые используются, чтобы формировать другие дробно-пикселные значения.

17. Устройство по п.14, в котором первый интерполяционный фильтр соответствует неперестраиваемому интерполяционному фильтру, а второй интерполяционный фильтр соответствует адаптивному интерполяционному фильтру.

18. Устройство по п.14, в котором синтаксис содержит флаг, который определяет, должен ли первый интерполяционный фильтр или второй интерполяционный фильтр использоваться декодером.

19. Устройство по п.14, в котором отдельный элемент синтаксиса определен для каждого из множества субпикселных местоположений для кодированной единицы, чтобы указывать, должен ли первый интерполяционный фильтр или второй интерполяционный фильтр использоваться декодером для каждого из множества субпикселных местоположений.

20. Устройство по п.13, в котором отдельный элемент синтаксиса определен для целопикселных местоположений видеоданных, чтобы указывать, должен ли первый фильтр или второй фильтр использоваться декодером для целопикселных местоположений.

21. Устройство по п.20, в котором первый фильтр не применяет фильтрацию, а второй фильтр ассоциирован с коэффициентами адаптивной фильтрации.

22. Устройство по п.14, дополнительно содержащее передающее устройство, которое передает кодированные видеоданные и синтаксис, чтобы указывать, использовались ли первые интерполированные прогнозирующие данные или вторые интерполированные прогнозирующие данные, чтобы сформировать кодированные видеоданные.

23. Устройство по п.22, в котором передающее устройство: передает коэффициенты фильтрации, когда второй интерполяционный фильтр является адаптивным, и синтаксис указывает, что вторые интерполированные прогнозирующие данные использовались, чтобы сформировать кодированные видеоданные; и не передает коэффициенты фильтрации, когда первый интерполяционный фильтр является неперестраиваемым, и синтаксис указывает, что первые интерполированные прогнозирующие данные использовались, чтобы сформировать кодированные видеоданные.

24. Устройство по п.14, в котором при выборе между первыми интерполированными прогнозирующими данными и вторыми интерполированными прогнозирующими данными на основе анализа искажения в зависимости от скорости передачи устройство: вычисляет первую функцию затрат на искажение в зависимости от скорости передачи, ассоциированную с видеоданными, если видеоданные кодируются посредством первых интерполированных прогнозирующих данных; вычисляет вторую функцию затрат на искажение в зависимости от скорости передачи, ассоциированную с видеоданными, если видеоданные кодируются посредством вторых интерполированных прогнозирующих данных; и выбирает между первыми интерполированными прогнозирующими данными и вторыми интерполированными прогнозирующими данными на основе первой и второй функций затрат на искажение в зависимости от скорости передачи.

25. Устройство по п.13, в котором видеокодер содержит интегральную схему.

26. Устройство по п.13, в котором видеокодер содержит микропроцессор.

27. Устройство по п.13, причем устройство представляет собой устройство беспроводной связи, которое включает в себя видеокодер.

28. Устройство видеокодирования, содержащее:
средство для формирования множества различных версий прогнозирующих данных для кодирования видеоданных на основе множества различных интерполяционных фильтров;
средство для выбора из множества различных версий прогнозирующих данных на основе анализа искажения в зависимости от скорости передачи;
средство для кодирования видеоданных на основе выбора; и
средство для кодирования синтаксиса, чтобы указывать выбор, причем отдельный элемент синтаксиса определяется для каждого из множества субпикселных местоположений.

29. Устройство по п.28, в котором средство для формирования и средство для выбора содержат: средство для формирования первых интерполированных прогнозирующих данных для кодирования видеоданных на основе первого интерполяционного фильтра; средство для формирования вторых интерполированных прогнозирующих данных для кодирования видеоданных на основе второго интерполяционного фильтра; и средство для выбора между первыми интерполированными прогнозирующими данными и вторыми интерполированными прогнозирующими данными на основе анализа искажения в зависимости от скорости передачи.

30. Устройство по п.29, в котором первый интерполяционный фильтр соответствует неперестраиваемому интерполяционному фильтру.

31. Устройство по п.30, в котором неперестраиваемый интерполяционный фильтр выполнен без промежуточного округления дробно-пикселных значений, которые используются, чтобы формировать другие дробно-пикселные значения.

32. Устройство по п.29, в котором первый интерполяционный фильтр соответствует неперестраиваемому интерполяционному фильтру, а второй интерполяционный фильтр соответствует адаптивному интерполяционному фильтру.

33. Устройство по п.29, в котором синтаксис содержит флаг, который определяет, должен ли первый интерполяционный фильтр или второй интерполяционный фильтр использоваться декодером.

34. Устройство по п.29, в котором отдельный элемент синтаксиса определен для каждого из множества субпикселных местоположений для кодированной единицы, чтобы указывать, должен ли первый интерполяционный фильтр или второй интерполяционный фильтр использоваться декодером для каждого из множества субпикселных местоположений.

35. Устройство по п.28, дополнительно содержащее средство для формирования отдельного элемента синтаксиса для целопикселных местоположений видеоданных, чтобы указывать, должен ли первый фильтр или второй фильтр использоваться декодером для целопикселных местоположений.

36. Устройство по п.35, в котором первый фильтр не применяет фильтрацию, а второй фильтр ассоциирован с коэффициентами адаптивной фильтрации.

37. Устройство по п.29, дополнительно содержащее средство для передачи кодированных видеоданных и синтаксиса, чтобы указывать, использовались ли первые интерполированные прогнозирующие данные или вторые интерполированные прогнозирующие данные, чтобы сформировать кодированные видеоданные.

38. Устройство по п.37, дополнительно содержащее: средство для передачи коэффициентов фильтрации, когда второй интерполяционный фильтр является адаптивным, и синтаксис указывает, что вторые интерполированные прогнозирующие данные использовались, чтобы сформировать кодированные видеоданные; и средство для отмены передачи коэффициентов фильтрации, когда первый интерполяционный фильтр является неперестраиваемым, и синтаксис указывает, что первые интерполированные прогнозирующие данные использовались, чтобы сформировать кодированные видеоданные.

39. Устройство по п.29, в котором средство для выбора между первыми интерполированными прогнозирующими данными и вторыми интерполированными прогнозирующими данными на основе анализа искажения в зависимости от скорости передачи содержит: средство для вычисления первой функции затрат на искажение в зависимости от скорости передачи, ассоциированной с видеоданными, если видеоданные кодируются посредством первых интерполированных прогнозирующих данных; средство для вычисления второй функции затрат на искажение в зависимости от скорости передачи, ассоциированной с видеоданными, если видеоданные кодируются посредством вторых интерполированных прогнозирующих данных; и средство для выбора между первыми интерполированными прогнозирующими данными и вторыми интерполированными прогнозирующими данными на основе первой и второй функций затрат на искажение в зависимости от скорости передачи.

40. Машиночитаемый носитель хранения данных, содержащий инструкции, которые, когда выполняются посредством процессора, предписывают процессору:
формировать множество различных версий прогнозирующих данных для кодирования видеоданных на основе множества различных интерполяционных фильтров;
выбирать из множества различных версий прогнозирующих данных на основе анализа искажения в зависимости от скорости передачи;
кодировать видеоданные на основе выбора; и
кодировать синтаксис, чтобы указывать выбор, причем отдельный элемент синтаксиса определяется для каждого из множества субпикселных местоположений.

41. Машиночитаемый носитель хранения данных по п.40, в котором инструкции предписывают процессору: формировать первые интерполированные прогнозирующие данные для кодирования видеоданных на основе первого интерполяционного фильтра; формировать вторые интерполированные прогнозирующие данные для кодирования видеоданных на основе второго интерполяционного фильтра; и выбирать между первыми интерполированными прогнозирующими данными и вторыми интерполированными прогнозирующими данными на основе анализа искажения в зависимости от скорости передачи.

42. Машиночитаемый носитель хранения данных по п.41, причем первый интерполяционный фильтр соответствует неперестраиваемому интерполяционному фильтру, а второй интерполяционный фильтр соответствует адаптивному интерполяционному фильтру.

43. Машиночитаемый носитель хранения данных по п.41, причем синтаксис содержит флаг, который определяет, должен ли первый интерполяционный фильтр или второй интерполяционный фильтр использоваться декодером.

44. Машиночитаемый носитель хранения данных по п.41, причем отдельный элемент синтаксиса определен для каждого из множества субпикселных местоположений для кодированной единицы, чтобы указывать, должен ли первый интерполяционный фильтр или второй интерполяционный фильтр использоваться декодером для каждого из множества субпикселных местоположений.

45. Машиночитаемый носитель хранения данных по п.41, в котором инструкции предписывают процессору активировать передачу кодированных видеоданных и синтаксиса, чтобы указывать, использовались ли первые интерполированные прогнозирующие данные или вторые интерполированные прогнозирующие данные, чтобы сформировать кодированные видеоданные.

46. Машиночитаемый носитель хранения данных по п.45, дополнительно содержащий инструкции, которые предписывают процессору активировать передачу: коэффициентов фильтрации, когда второй интерполяционный фильтр является адаптивным, и синтаксис указывает, что вторые интерполированные прогнозирующие данные использовались, чтобы сформировать кодированные видеоданные; и без коэффициентов фильтрации, когда первый интерполяционный фильтр является неперестраиваемым, и синтаксис указывает, что первые интерполированные прогнозирующие данные использовались, чтобы сформировать кодированные видеоданные.

47. Машиночитаемый носитель хранения данных по п.41, причем при выборе между первыми интерполированными прогнозирующими данными и вторыми интерполированными прогнозирующими данными на основе анализа искажения в зависимости от скорости передачи, инструкции предписывают процессору: вычислять первую функцию затрат на искажение в зависимости от скорости передачи, ассоциированную с видеоданными, если видеоданные кодируются посредством первых интерполированных прогнозирующих данных; вычислять вторую функцию затрат на искажение в зависимости от скорости передачи, ассоциированную с видеоданными, если видеоданные кодируются посредством вторых интерполированных прогнозирующих данных; и выбирать между первыми интерполированными прогнозирующими данными и вторыми интерполированными прогнозирующими данными на основе первой и второй функций затрат на искажение в зависимости от скорости передачи.

Изобретение относится к области обработки трехмерного видео и, в частности, к формату применения, когда трехмерная графика записывается на носитель записи. Техническим результатом является предоставлять носитель записи, с помощью которого произвольный доступ может быть надежно выполнен при воспроизведении трехмерной графики.

Файл медиаконтейнера // 2504917

Изобретение относится к системам обработки многоракурсных (многовидовых) видеоданных и конкретно к файлу медиаконтейнера, содержащему такие многоракурсные видеоданные.

Способы и устройство для эффективного распространения данных изображения // 2504102

Изобретение относится к области передачи изображений по сети и, в частности, к способам передачи медицинских изображений между сервером и клиентом. Техническим результатом является обеспечение эффективной передачи данных источника с сервера к, по меньшей мере, одному клиенту.

Устройство управления информацией для пассажиров и способ обеспечения видеоданных для устройства управления информацией для пассажиров // 2504084

Изобретение относится к устройству управления информацией для пассажиров, которое предоставляет рекламную информацию пассажирам в поезде. Техническим результатом является эффективное использование емкости хранилища среды хранения.

Хостинг и широковещательная передача виртуальных событий с использованием потоковой передачи интерактивного видео // 2503998

Изобретение относится к средствам трансляции игрового соревнования в прямом эфире. Технический результат заключается в повышении быстродействия передачи потока интерактивного потокового видео с групповой передачей из службы хостинга множеству зрителей по Internet, Аудио от спортивного комментатора накладывается службой хостинга на видеопоток с групповой передачей.

Система сжатия видео и способ компенсации для ограничения полосы пропускания канала связи // 2501180

Изобретение относится к вычислительной технике. Технический результат заключается в уменьшении времени ожидания.

Потоковое интерактивное видеоклиентское устройство // 2500022

Изобретение относится к области систем обработки данных, которые улучшают способность пользователей манипулировать аудио- и видеоносителями и подключаться к ним.

Способ и устройство для управления представлением мультимедийных данных из мультиплексного сигнала среди устройств в локальной сети // 2499361

Изобретение относится к области систем цифровой связи и, более конкретно, способам для обеспечения возможности серверу широковещательной передачи предоставлять доступ среди устройств беспроводной связи для распространенного мультимедиа.

Система и способ сжатия интерактивного потокового видео // 2497184

Изобретение относится к области систем обработки данных. Техническим результатом является уменьшение времени, которое требуется сигналу для прохождения до и от игрового сервера.

Система для объединения записанного состояния приложения с выводом интерактивного потокового видео приложения // 2496141

Изобретение относится к области систем обработки данных. Техническим результатом является сокращение времени ожидания при исполнении твич игр.

Способ и устройство для беспроводного распространения мультиплексного сигнала, содержащего мультимедийные данные, по локальной сети // 2505939

Изобретение относится к области цифровой связи, в частности для обеспечения серверу широковещания возможности предоставлять доступ среди устройств беспроводной связи. Техническим результатом является обеспечение различных методик для получения мультимедийных данных от одного или более источников и передачи этих данных в локальной сети на одно или более устройств, тем самым обеспечивая повсеместный доступ к мультимедиа по всей сети. Указанный технический результат достигается тем, что сервер принимает мультимедийные данные от одного или более устройств в локальной сети, создает мультиплексный сигнал из различных мультимедийных данных, принятых от этих устройств, и беспроводным образом передает мультиплексный сигнал по локальной сети. Сервер дополнительно сконфигурирован таким образом, что мультиплексный сигнал содержит множество логических каналов, причем по меньшей мере один из этих логических каналов представляет мультимедийные данные, принятые от одного из устройств в сети. Посредством последующей настройки на один или более из логических каналов передаваемого мультиплексного сигнала устройство в локальной сети может представлять пользователю мультимедийные данные, которые исходят из или находятся на другом устройстве в сети. Мультиплексный сигнал дополнительно может содержать мультимедийные данные из источников в глобальной сети, такой как Интернет или сотовая телефонная сеть. 3 н. и 28 з.п. ф-лы, 15 ил.

Основанная на фрагментах система и способ сжатия видео // 2506709

Изобретение относится к области систем обработки данных. Техническим результатом является сокращение времени ожидания при исполнении видеоигр или приложений. Машинно-реализуемый способ сжатия видео содержит этап приема запроса в сервере от клиента на воспроизведение видеоигры или исполнение приложения по сети Internet. В ответ на данный запрос устанавливают видеоигру или сеанс приложения с клиентом. Согласно способу измеряют характеристики канала для канала связи сети Internet между сервером и клиентом. Далее осуществляют кодирование упомянутого вывода видео с использованием сжатия с малым временем ожидания на сервере для формирования видеопотока с малым временем ожидания. Вывод видео кодируется со скоростью передачи битов или с коэффициентом сжатия на основе измеренных характеристик канала. Кроме того, осуществляют потоковую передачу видеопотока с малым временем ожидания из сервера в клиент по сети Internet, причем этот видеопоток с малым временем ожидания декодируется в клиенте. Все операции, связанные с приемом управляющих сигналов, переданных из клиента, исполнением видеоигры или приложения, кодированием и потоковой передачей видеопотока с малым временем ожидания в клиент по сети Internet и декодированием видеопотока с малым временем ожидания в клиенте, выполняются так, что у пользователя возникает ощущение, что выбранная видеоигра или приложение реагируют немедленно на управляющие сигналы, принятые из клиента. 2 н. и 39 з.п. ф-лы, 40 ил.

Способ моделирования информации кодирования видеосигнала для компрессии/декомпрессии информации кодирования // 2506710

Изобретение относится к способу моделирования информации кодирования видеосигнала для компрессии (сжатия) информации кодирования или декомпрессии (восстановления) сжатой информации масштабируемым видеокодеком (SVC). Техническим результатом является обеспечение моделирования информации кодирования, имеющей корреляцию между множеством уровней, для увеличения коэффициента компрессии данных. Указанный технический результат достигается тем, что получают первую индексную переменную, основываясь на контекстном индексном смещении для информации кодирования блока изображения на первом уровне; получают вторую индексную переменную, используя контекстное индексное смещение и первую индексную переменную; и определяют первоначальное значение функции для вероятностного кодирования, основываясь второй индексной переменной, причем первую индексную переменную получают, основываясь на информации кодирования, указывающей корреляцию между первым уровнем и вторым уровнем. 2 н. и 10 з.п. ф-лы, 5 ил.

Способ и устройство обработки изображения // 2506711

Изобретение относится к вычислительной технике. Технический результат заключается в формировании прогнозируемого изображения с высокой точностью без увеличения процессорной нагрузки. Устройство обработки изображения содержит средства компенсации движения для выполнения компенсации движения с использованием в качестве опорных кадров множества кадров, образованных изображениями, полученными посредством декодирования кодированных изображений, и с использованием векторов движения, включенных в кодированные изображения, и для генерации множества изображений с компенсацией движения, соответствующих прогнозируемому изображению, на основе разных опорных кадров; первые средства фильтрации для применения фильтра нижних частот к разностному изображению между множеством изображений с компенсацией движения, генерируемых с использованием средств компенсации движения; вторые средства фильтрации для применения фильтра верхних частот к изображению, полученному первыми средствами фильтрации путем применения фильтра нижних частот; и средства генерации прогнозируемого изображения для генерации прогнозируемого изображения посредством добавления изображения, полученного первыми средствами фильтрации и изображения, полученного вторыми средствами фильтрации, к одному из множества изображений с компенсацией движения, сгенерированных средствами компенсации движения. 4 н. и 6 з.п. ф-лы, 27 ил.

Способ межкадрового прогнозирования для кодирования многоракурсной видеопоследовательности // 2506712

Изобретение относится к вычислительной технике. Технический результат заключается в уменьшении объема служебной информации в области сжатия многоракурсных видеопоследовательностей с картами глубин. Способ межкадрового прогнозирования для кодирования многоракурсной видеопоследовательности, в котором кодируемый кадр из видеопоследовательности кодируемого ракурса представляют как набор блоков, определяют, по меньшей мере, один восстановленный кадр из видеопоследовательности кодируемого ракурса, обозначаемый как опорный кадр, генерируют синтезированные кадры, соответствующие кодируемому кадру и каждому из опорных кадров, используя восстановленные карты глубин и восстановленные кадры видеопоследовательности из, по меньшей мере, одного другого ракурса, причем дополнительно: определяют в синтезированном кодируемом кадре синтезированный текущий блок, который соответствует кодируемому блоку; получают, по меньшей мере, один синтезированный вектор движения для синтезированного текущего блока с помощью синтезированных опорных кадров; выводят, по меньшей мере, один уточненный вектор движения для кодируемого блока с использованием метода сопоставления шаблонов, с использованием шаблона кодируемого блока, с использованием опорных кадров и с использованием полученного синтезированного вектора движения; вычисляют блок-прогноз для кодируемого блока с использованием уточненных векторов движения. 8 з.п. ф-лы, 9 ил.

Устройство и способ обработки изображения // 2506713

Изобретение относится к вычислительной технике. Технический результат заключается в обеспечении компенсации движения с высокой точностью. Устройство обработки изображения, содержащее модуль формирования изображения, предназначенный для формирования изображения и генерирования сигнала изображения; модуль обработки, предназначенный для формирования на основе сигнала изображения первых видеоданных, содержащих множество кадров, и вторых видеоданных, имеющих более высокое разрешение, чем у кадров, содержащихся в первых видеоданных; блок кодирования, предназначенный для сжатия первых и вторых видеоданных, подаваемых из модуля обработки, и записи их в модуле сохранения; модуль генерирования изображения, предназначенный для детектирования вектора движения между кадрами, содержащимися в первых видеоданных, полученных из модуля сохранения, при этом кадр первых видеоданных увеличивают до такого же разрешения, как и кадр вторых видеоданных, и для выполнения компенсации движения по кадру, расположенному между заданным кадром, содержащимся в первых видеоданных, и кадром, содержащимся во вторых видеоданных, и последовательного генерирования данных изображения со скомпенсированным движением на основе кадра со скомпенсированным движением и детектированного вектора движения. 2 н. и 6 з.п. ф-лы, 7 ил.

Кодер изображения и декодер изображения, способ кодирования изображения и способ декодирования изображения // 2506714

Изобретение относится к вычислительной технике. Технический результат заключается в повышении оптимальности кодирования сигнала движущегося изображения. Кодер изображений генерирует битовый поток на основании ввода цветного изображения, которое сформировано из множества цветовых компонентов, посредством сжатия-кодирования цветного изображения в единицах областей, полученных путем разделения цветного изображения на заранее определенные области, при этом кодер изображений содержит: блок кодирования, который кодирует идентификационную информацию общего использования режима интрапрогнозирования, указывающую, являются ли области, служащие в качестве единиц кодирования, кодированными с прогнозированием на основе режима интрапрогнозирования, совместно используемого для каждого цветового компонента, или нет, и который кодирует режим интрапрогнозирования, совместно используемый для каждого цветового компонента в случае, когда декодирование выполняется посредством использования режима интрапрогнозирования, совместно используемого для каждого цветового компонента. 4 н.п. ф-лы, 86 ил.

Передача изменяющегося визуального контента // 2506715

Изобретение относится к передаче изменяющегося видеоконтента в сеансе терминального сервера. Техническим результатом является повышение эффективности передачи и снижение объема данных, формирующих видеоконтент. Указанный технический результат достигается тем, что предложена технология для представления изменяющегося визуального контента, включающего в себя видео, анимацию и так далее, в режиме наложения. Изменяющийся визуальный контент, включенный в визуальное представление, может быть идентифицирован среди прочих визуальных элементов, включенных в визуальное представление. Изменяющимся визуальным контентом можно управлять на основе доступных ресурсов, связанных с представлением изменяющегося визуального контента в режиме наложения для клиента. 3 н. и 17 з.п. ф-лы, 4 ил.

Предоставление услуг с помощью данных на диске blu-ray // 2506716

Предложены способ предоставления услуги «видео по запросу» (VOD) с помощью плеера диска Blu-ray и машиночитаемый носитель с программой для осуществления такого способа. Способ содержит этапы, на которых подготавливают данные VOD, вводят данные VOD на BD, подготавливают меню элементов выбора VOD и метаданные VOD с использованием данных VOD, считанных с BD. Данные VOD отправляют на сервер контента, выполненный с возможностью использовать указанные данные для выбора доступных элементов для отображения в меню элементов выбора VOD. Элемент контента, выбранный пользователем в меню элементов выбора VOD, доставляют с сервера контента. Плеер BD выполнен с возможностью использовать данные VOD для предоставления услуги VOD. Техническим результатом является расширение арсенала средств предоставления услуги VOD. 3 н. и 14 з.п. ф-лы, 4 ил.

Система для ускорения доставки веб-страницы // 2507568

Изобретение относится к области систем обработки данных, которые улучшают способность пользователей манипулировать аудио- и видеоносителями. Технический результат заключается в уменьшении времени ожидании отклика веб-страницы. Способ ускоренной доставки веб-страницы заключается в исполнении на удаленном сервере приложения веб-браузера, используемого пользователем посредством интерактивного сжатого потокового видео, обеспечении пользователю доступа к веб-странице посредством приложения веб-браузера и отображения веб-страницы на клиентском устройстве в ответ на запрос пользователя. 9 з.п. ф-лы, 40 ил.