Устройство передачи, способ передачи, устройство приема и способ приема

Изобретение относится к области вычислительной техники для анализа аудиоданных. Технический результат заключается в снижении нагрузки на стороне приема аудиоданных при передаче аудиоданных нескольких типов. Технический результат достигается за счет передачи, с помощью блока передачи, метафайла, содержащего метаинформацию, используемую для получения, в устройстве приема, заранее заданного количества аудиопотоков, содержащих несколько групп закодированных данных, и вставки в метафайл информации об атрибутах, указывающей каждый атрибут закодированных данных для нескольких групп. 6 н. и 12 з.п. ф-лы, 20 ил.

 

Область техники, к которой относится изобретение

Настоящее изобретение касается устройства передачи, способа передачи, устройства приема и способа приема и, в частности, касается устройства передачи и подобного, касающегося технологии передачи аудиоданных нескольких типов.

Уровень техники

Обычно в качестве технологии пространственного (3D) звука предложена технология для сопоставления закодированных данных отсчетов с динамиком, расположенным в произвольном месте, на основе метаданных, с целью преобразования (например, смотри патентный документ 1).

Список цитируемой литературы

Патентные документы

Патентный документ 1: Национальная публикация (открытой) заявки на японский патент № 2014-520491

Раскрытие изобретения

Задачи, которые должно решить изобретение

Когда закодированные данные объектов, состоящие из закодированных данных отсчетов и метаданных, передают вместе с закодированными данными каналов, таких как 5.1 каналы, 7.1 каналы и подобным, то на приемной стороне может быть достигнуто воспроизведение звука с более реалистичным эффектом окружения.

Задача настоящего изобретения заключается в том, чтобы уменьшить нагрузку при обработке на приемной стороне при передаче закодированных данных нескольких типов.

Одна идея настоящего изобретения заключена в устройстве передачи, которое содержит:

блок передачи, выполненный с возможностью передачи метафайла, содержащего метаинформацию, используемую для получения, в устройстве приема, заранее заданного количества аудиопотоков, содержащих несколько групп закодированных данных; и

блок вставки информации, выполненный с возможностью вставки в метафайл информации об атрибутах, которая указывает каждый атрибут закодированных данных для нескольких групп.

Решение задач

В настоящей технологии блок передачи передает метафайл, содержащий метаинформацию, используемую для получения, в устройстве приема, заранее заданного количества аудиопотоков, содержащих несколько групп закодированных данных. Например, закодированные данные нескольких групп могут содержать или закодированные данные каналов или закодированные данные объектов или и те, и другие данные.

Блок вставки информации вставляет в метафайл информацию об атрибутах, указывающую каждый атрибут закодированных данных для нескольких групп. Например, метафайл может быть файлом описания (MPD) представления медиаданных. В этом случае, например, блок вставки информации может вставлять информацию об атрибутах в метафайл с использованием «дополнительного дескриптора».

Далее, например, блок передачи может передать метафайл по RF каналу передачи или по каналу передачи через сеть связи. Далее, например, блок передачи может дополнительно передавать контейнер заранее заданного формата с заранее заданным количеством аудиопотоков, содержащих несколько групп закодированных данных. Контейнер является, например, MP4. В соответствии с настоящей технологией, MP4 указывает базовый формат ISO файла медиаданных (ISOBMFF) (ISO/IEC 14496-12:2012).

Таким образом, в соответствии с настоящей технологией, вставляют в метафайл, содержащий метаинформацию, используемую для получения, в устройстве приема, заранее заданного количества аудиопотоков, содержащих несколько групп закодированных данных, информацию об атрибутах, указывающую каждый атрибут закодированных данных нескольких групп. Таким образом, сторона приема может легко распознать каждый атрибут закодированных данных нескольких групп до декодирования соответствующих закодированных данных, так что по выбору могут быть декодированы и использованы закодированные данные необходимой группы и может быть уменьшена нагрузка по обработке.

Здесь в соответствии с настоящей технологией, например, блок вставки информации может дополнительно вставить в метафайл информацию об отношении соответствия потоку, которая указывает аудиопоток, в котором содержатся, соответственно, закодированные данные нескольких групп. В этом случае, например, информация об отношении соответствия потоку может быть информацией, указывающей отношение соответствия между идентификаторами групп, которые, идентифицируют соответствующие элементы закодированных данных нескольких групп, и идентификаторами, которые идентифицируют соответствующие потоки из заранее заданного количества аудиопотоков. В этом случае на приемной стороне могут легко распознать аудиопоток, содержащий закодированные данные необходимой группы, и это может уменьшить нагрузку по обработке.

Далее, другая идея настоящего изобретения заключена в устройстве приема, которое содержит:

блок приема, выполненный с возможностью приема метафайла, содержащего метаинформацию, используемую для получения, в устройстве приема, заранее заданного количества аудиопотоков, содержащих несколько групп закодированных данных,

при этом метафайл содержит вставленную информацию об атрибутах, указывающую каждый атрибут закодированных данных для нескольких групп; и

блок обработки, выполненный с возможностью обработки заданного количества аудиопотоков на основе информации об атрибутах.

В соответствии с настоящей технологией, блок приема принимает метафайл. Метафайл содержит метаинформацию, используемую для получения, в устройстве приема, заранее заданного количества аудиопотоков, содержащих несколько групп закодированных данных. Например, закодированные данные нескольких групп могут содержать или закодированные данные каналов или закодированные данные объектов или и те, и другие данные. В метафайл вставляют информацию об атрибутах, указывающую каждый атрибут закодированных данных нескольких групп. Блок обработки обрабатывает заданное количество аудиопотоков на основе информации об атрибутах.

Таким образом, в соответствии с настоящей технологией, осуществляют процесс для заранее заданного количества аудиопотоков, на основе информации об атрибутах, которая указывает каждый атрибут закодированных данных нескольких групп, вставленных в метафайл. Таким образом, могут быть декодированы и использованы только закодированные данные нужной группы и это может уменьшить нагрузку при обработке.

Здесь, в соответствии с настоящей технологией, например, метафайл может дополнительно содержать информацию об отношении соответствия потоку, которая указывает аудиопоток, содержащий, соответственно, закодированные данные нескольких групп, и блок обработки может обработать заранее заданное количество аудиопотоков на основе информации об отношении соответствия потоку, а также информации об атрибутах. В этом случае, аудиопоток, содержащий закодированные данные необходимой группы, может быть легко распознан и это может уменьшить нагрузку при обработке.

Далее, в соответствии с настоящей технологией, например, блок обработки может по выбору осуществить процесс декодирования аудиопотока, содержащего закодированные данные группы, включающей в себя атрибут, совместимый с конфигурацией динамиков и информацией о выборе пользователя, что делают на основе информации об атрибутах и информации об отношении соответствия потоку.

Более того, еще одна идея настоящего изобретения заключена в устройстве приема, которое содержит:

блок приема, выполненный с возможностью приема метафайла, содержащего метаинформацию, используемую для получения, в устройстве приема, заранее заданного количества аудиопотоков, содержащих несколько групп закодированных данных,

при этом метафайл содержит вставленную информацию об атрибутах, указывающую каждый атрибут закодированных данных для нескольких групп;

блок обработки, выполненный с возможностью получения по выбору закодированных данных заранее заданной группы из заранее заданного количества аудиопотоков на основе информации об атрибутах, и изменения конфигурации аудиопотока, содержащего закодированные данные заранее заданной группы; и

блок передачи потока, выполненный с возможностью передачи на внешнее устройство аудиопотока с измененной конфигурацией.

В соответствии с технологией, блок приема принимает метафайл. Метафайл содержит метаинформацию, используемую для получения, в устройстве приема, заранее заданного количества аудиопотоков, содержащих несколько групп закодированных данных. В метафайл вставляют информацию об атрибутах, указывающую каждый атрибут закодированных данных нескольких групп.

Блок обработки по выбору получает закодированные данные заранее заданной группы из заранее заданного количества аудиопотоков на основе информации об атрибутах, и изменяет конфигурацию аудиопотока, содержащего закодированные данные заранее заданной группы. Далее, блок передачи потока передает на внешнее устройство аудиопоток с измененной конфигурацией.

Таким образом, в соответствии с настоящей технологией, на основе информации об атрибутах, которую вставляют в метафайл и которая указывает каждый атрибут закодированных данных нескольких групп, закодированные данные заранее заданной группы получают по выбору из заранее заданного количества аудиопотоков и изменяют конфигурацию аудиопотока, подлежащего передаче на внешнее устройство. Закодированные данные необходимой группы могут быть легко получены и это может уменьшить нагрузку при обработке.

Здесь, в соответствии с настоящей технологией, например, информацию об отношении соответствия потоку, которая указывает аудиопоток, содержащий, соответственно, закодированные данные нескольких групп, дополнительно вставляют в метафайл и блок обработки может по выбору получить закодированные данные заранее заданной группы из заранее заданного количества аудиопотоков на основе информации об отношении соответствия потоку, а также информации об атрибутах. В этом случае, аудиопоток, содержащий закодированные данные заранее заданной группы, может быть легко распознан и это может уменьшить нагрузку при обработке.

Результаты, достигаемые с помощью изобретения

В соответствии с настоящей технологией, нагрузка при обработке на приемной стороне может быть уменьшена при передаче закодированных данных нескольких типов. Описанный в настоящем документе эффект является только примером и не устанавливает никаких ограничений для изобретения и могут присутствовать дополнительные эффекты.

Краткое описание чертежей

Фиг. 1(a) и 1(b) - виды, показывающие схемы, иллюстрирующие примеры конфигураций системы доставки потока на основе MPEG-DASH;

фиг. 2(a) - 2(d) - виды, показывающие пример взаимосвязи структур, иерархически расположенных в файле MPD;

фиг. 3 - вид, показывающий структурную схему, иллюстрирующую пример конфигурации системы приемо-передачи в качестве одного варианта осуществления изобретения;

фиг. 4 - вид, показывающий структуру аудиокадра (1024 отсчетов) передаваемых данных 3D аудио;

фиг. 5 - вид, показывающий пример конфигурации передаваемых данных 3D аудио;

фиг. 6(a) и 6(b) - виды, схематично показывающие примеры конфигураций аудиокадра в случае, когда передаваемые данные 3D аудио передают с помощью одной дорожки (один аудиопоток), и в случае, когда передаваемые данные 3D аудио передают с помощью нескольких дорожек (более одного аудиопотока);

фиг. 7 - вид, показывающий пример деления на группы, в случае передачи с помощью четырех дорожек в примере конфигурации передаваемых данных 3D аудио;

фиг. 8 - вид, показывающий отношение соответствия или подобное между группами и дорожками в примере деления на группы (деление на четыре группы);

фиг. 9 - вид, показывающий пример деления на группы, в случае передачи с помощью двух дорожек в примере конфигурации передаваемых данных 3D аудио;

фиг. 10 - вид, показывающий отношение соответствия или подобное между группами и дорожками в примере деления на группы (деление на две группы);

фиг. 11 - вид, показывающий пример описания файла MPD;

фиг. 12 - вид, показывающий другой пример описания файла MPD;

фиг. 13 - вид, показывающий пример «schemeIdUri», определенного «SupplementaryDescriptor»;

фиг. 14(a) - 14(c) - виды, показывающие схемы для объяснения содержимого файла медиаданных с местоположением, которое указано с помощью «<baseURL>»;

фиг. 15(a) и 15(b) - виды, показывающие схемы для объяснения описания соответствия между идентификаторами (ID дорожки) дорожек и идентификаторами (ID уровня) уровней в прямоугольнике «moov»;

фиг. 16(a) и 16(b) - виды, показывающие пример передачи или подобного для каждого прямоугольника в случае системы передачи;

фиг. 17 - вид, показывающий структурную схему, иллюстрирующую пример конфигурации блока выработки DASH/MP4, содержащегося в системе передачи службы;

фиг. 18 - вид, показывающий структурную схему примера конфигурации устройства приема службы;

фиг. 19 - вид, показывающий блок-схему, иллюстрирующую пример процесса управления декодированием аудио, осуществляемого CPU в устройстве приема службы;

фиг. 20 - вид, показывающий структурную схему другого примера конфигурации устройства приема службы.

Вариант осуществления изобретения

Далее будут описаны варианты (далее называемые «вариантами осуществления изобретения») по реализации изобретения. Описание будет приведено в следующем порядке.

1. Вариант осуществления изобретения

2. Модифицированные примеры

<1. Вариант осуществления изобретения>

[Обзор системы доставки потока на основе MPEG-DASH]

Сначала приведем обзор системы доставки потока на основе MPEG-DASH, в которой может применена настоящая технология.

На фиг. 1(a) показан пример конфигурации системы 30А доставки потока на основе MPEG-DASH. В этом примере конфигурации, поток медиаданных и файл MPD передают по каналу передачи через сеть связи. Система 30А доставки потока выполнена так, что N устройств 33-1, 33-2,..., и 33-N приема службы соединены с файловым сервером 31 потока DASH и сервером 32 DASH MPD с помощью сети 34 (CDN) доставки содержимого.

Файловый сервер 31 потока DASH вырабатывает сегмент потока (далее надлежащим образом называемый «сегментом DASH») спецификации DASH на основе медиаданных (видеоданные, аудиоданные, данные субтитров или подобное) заранее заданного содержимого и передает сегмент в соответствии с запросом HTTP, выработанным устройством приема службы. Файловый сервер 31 потока DASH может быть сервером, выделенным для передачи потоков, и также сервером, функционирующим как веб-сервер.

Далее, в ответ на запрос сегмента заранее заданного потока, переданного из устройства 33 (33-1, 33-2,... и 33-N) приема службы с помощью CDN 34, файловый сервер 31 потока DASH передает, с помощью CDN 34, сегмент потока на устройство приема, которое является источником запроса. В этом случае, устройство 33 приема службы выбирает поток с оптимальной скоростью, в соответствии с состоянием среды сети, в которой расположен клиент с учетом значения скорости, которое описано в файле описания (MPD) представления медиаданных, и делает запрос.

Сервер 32 DASH MPD является сервером, который вырабатывает файл MPD для получения сегмента DASH, выработанного в файловом сервере 31 потока DASH. Файл MPD вырабатывают на основе содержимого метаданных, принятых от сервера (не показан) управления содержимым и адреса (url) сегмента, выработанного в файловом сервере 31 потока DASH. Здесь файловый сервер 31 потока DASH и сервер 32 DASH MPD физически могут быть одним устройством.

В формате MPD каждый атрибут описан с использованием такого элемента, как представление (представление) для каждого потока, такого как видео или аудио. Например, представления разделены для каждых нескольких потоков видеоданных с различными скоростями и каждая их скорость описана в файле MPD. Устройство 33 приема службы может выбрать оптимальный поток в соответствии с состоянием среды сети, в которой расположено устройство 33 приема службы, с точки зрения скорости, как описано выше.

На фиг. 1(b) показан пример конфигурации системы 30B доставки потока на основе MPEG-DASH. В этом примере конфигурации, поток медиаданных и файл MPD передают по RF каналу передачи. Система 30B доставки потока выполнена так, что система 36 передачи вещания соединена с файловым сервером 31 потока DASH и сервером 32 DASH MPD и M устройствами 35-1, 35-2, ... и 35-M приема службы.

В случае системы 30В доставки потока, система 36 передачи вещания передает сегмент (сегмент DASH) потока спецификации DASH, который выработан файловым сервером 31 потока DASH, и файл MPD, который выработан сервером 32 DASH MPD, с помощью радиовещательной волны.

На фиг. 2(a) - 2(d) показан пример взаимосвязи структур, иерархически расположенных в файле MPD. Как показано на фиг. 2(а), представление медиаданных всего файла MPD содержит несколько периодов, ограниченных временными интервалами. Например, первый период начинается с 0-ой секунды, а следующий период начинается с 100-ой секунды.

Как показано на фиг. 2(а), период содержит несколько представлений (Представления). Среди нескольких представлений, присутствует группа представлений, которые сгруппированы в соответствии с адаптационным набором (AdaptationSet), касающимся потоков медиаданных одного содержимого, но с разными атрибутами потока, например, с разными скоростями.

Как показано на фиг. 2(с), представление содержит информацию (SegmentInfo) сегмента. В информации сегмента, как показано на фиг. 2(d), присутствуют сегмент (Сегмент инициализации) инициализации и несколько сегментов (Сегмент медиаданных) медиаданных, в которых описана информация сегментов (Сегмент), полученная с помощью более мелкого ограничения периода. Сегмент медиаданных содержит, например, информацию (url) об адресе, используемую для фактического получения данных сегмента, таких как видео или аудио.

Далее, может свободно осуществляться переключение потоков между несколькими представлениями, сгруппированными в соответствии с адаптационным набором. Таким образом, возможно выбрать поток с оптимальной скоростью, в соответствии с состоянием среды сети, в которой расположено устройство приема службы, и возможно осуществить бесшовную доставку.

[Пример конфигурации системы приемо-передачи]

На фиг. 3 показан пример конфигурации системы 10 приемо-передачи в качестве одного варианта осуществления изобретения. Эта система 10 приемо-передачи состоит из системы 100 передачи службы и устройства 200 приема службы. В системе 10 приемо-передачи, система 100 передачи службы соответствует файловому серверу 31 потока DASH и серверу 32 DASH MPD из описанной выше системы 30А доставки потока с фиг. 1(а). Далее, в системе 10 приемо-передачи, система 100 передачи службы соответствует файловому серверу 31 потока DASH, серверу 36 DASH MPD и системе 36 передачи вещания из описанной выше системы 30B доставки потока с фиг. 1(b).

Далее, в системе 10 приемо-передачи, устройство 200 приема службы соответствует устройствам 33 (33-1, 33-2, ..., 33-N) приема службы из описанной выше системы 30А доставки потока с фиг. 1(а). Далее, в системе 10 приемо-передачи, устройство 200 приема службы соответствует устройствам 35 (35-1, 35-2, ..., 35-M) приема службы из описанной выше системы 30B доставки потока с фиг. 1(b).

Система 100 передачи службы передает DASH/MP4, то есть, файл MPD, служащий в качестве метафайла, и MP4, содержащий поток (сегмент медиаданных) медиаданных, такой как видео и аудио, по RF каналу передачи (смотри фиг. 1(b)) или по каналу передачи через сеть связи (смотри фиг. 1(а)).

На фиг. 4 показана структура аудиокадра (1024 отсчетов) в передаваемых данных 3D аудио (MPEGH), которых касается вариант осуществления настоящего изобретения. Аудиокадр состоит из нескольких пакетов (пакеты аудиопотоков mpeg) аудиопотоков MPEG. Каждый из пакетов аудиопотоков MPEG выполнен содержащим заголовок и полезную нагрузку.

Заголовок содержит такую информацию, как тип (Тип пакета) пакета, метка (Метка пакета) пакета и длина (Длина пакета) пакета. Информация, определенная типом пакета из заголовка, расположена в полезной нагрузке. Информация полезной нагрузки содержит информацию «SYNC», соответствующую начальному коду синхронизации, информацию «Кадр», которая служит в качестве фактических данных для передаваемых данных 3D аудио, и информацию «Config», указывающую конфигурацию информации «Кадр».

Информация «Кадр» содержит закодированные данные каналов и закодированные данные объектов, которые формируют передаваемые данные 3D аудио. Здесь закодированные данные каналов сформированы закодированными данными отсчетов, такими как элемент (SCE) одиночного канала, элемент (CPE) парного канала и низкочастотный элемент (LFE). Кроме того, закодированные данные объектов сформированы закодированными данными отсчетов элемента (SCE) одиночного канала и метаданными с целью сопоставления закодированных данных отсчетов и динамика, расположенного в произвольном месте, и преобразования закодированных данных отсчетов. Метаданные содержатся в качестве элемента (Ext_element) расширения.

На фиг. 5 показан пример конфигурации передаваемых данных 3D аудио. В этом примере передаваемые данные 3D аудио состоят из одного элемента закодированных данных каналов, и двух элементов закодированных данных объектов. Один элемент закодированных данных каналов является закодированными данными (CD) каналов для 5.1 каналов и сформирован закодированными данными SCE1, CPE1.1, CPE1.2 и LFE1 отсчетов.

Два элемента закодированных данных объектов представляют собой объект (IAO) «обеспечивающее эффект присутствия аудио» и объект (SDO) «речевой диалог». Закодированные данные объекта «обеспечивающее эффект присутствия аудио» являются закодированными данными объектов для обеспечивающего эффект присутствия звука и состоят из закодированных данных SCE2 отсчетов и метаданных EXE_El (метаданные объекта) 2, которые используют для сопоставления закодированных данных SCE2 отсчетов с динамиком, расположенным в произвольном месте, и для осуществления преобразования закодированных данных SCE2 отсчетов.

Закодированные данные объекта «речевой диалог» представляют собой закодированные данные объекта для разговорной речи. В этом примере присутствуют два элемента закодированных данных объекта «речевой диалог», соответственно, для первого и второго языков. Закодированные данные объекта «речевой диалог», соответствующего первому языку, состоят из закодированных данных SCE3 отсчетов и метаданных EXE_El (метаданные объекта) 3, которые используют для сопоставления закодированных данных SCE3 отсчетов с динамиком, расположенным в произвольном месте, и преобразования закодированных данных SCE3 отсчетов. Далее, закодированные данные объекта «речевой диалог», соответствующего второму языку, состоят из закодированных данных SCE4 отсчетов и метаданных EXE_El (метаданные объекта) 4, которые используют для сопоставления закодированных данных SCE4 отсчетов с динамиком, расположенным в произвольном месте, и преобразования закодированных данных SCE4 отсчетов.

Закодированные данные отличают с помощью идеи группы (Группа) в соответствии с типом данных. В показанном примере, закодированные данные каналов для 5.1 каналов определены как Группа 1 (Группа 1), закодированные данные объекта «обеспечивающее эффект присутствия аудио» определены как Группа 2 (Группа 2), закодированные данные объекта «речевой диалог», касающиеся первого языка, определены как Группа 3 (Группа 3) и закодированные данные объекта «речевой диалог», касающиеся второго языка, определены как Группа 4 (Группа 4).

Далее, группы, которые можно переключить на приемной стороне, зарегистрированы как группа (SW группа) переключения и закодированы. В показанном примере, Группа 3 и Группа 4 зарегистрированы в Группе 1 (Группа 1 переключения) переключения. Далее, некоторые группы могут быть сгруппированы в некоторую заранее установленную группу (заранее установленная Группа) и могут быть воспроизведены в соответствии с некоторым случаем использования. В показанном примере, Группа 1, Группа 2 и Группа 3 сгруппированы в Заранее установленную Группу 1, а Группа 1, Группа 2 и Группа 4 связаны в Заранее установленную Группу 2.

Возвращаясь к фиг. 3, система 100 передачи службы передает передаваемые данные 3D аудио, содержащие закодированные данные нескольких групп, как описано выше, с помощью одной дорожки в качестве одного аудиопотока, или с помощью нескольких дорожек в качестве нескольких аудиопотоков.

На фиг. 6(а) схематично показан пример конфигурации аудиокадра в случае, когда данные передают в одной дорожке (один аудиопоток) для примера конфигурации передаваемых данных 3D аудио с фиг. 5. В этом случае аудиодорожка 1 содержит информацию «SYNC» и информацию «Config», а также закодированные данные (CD) каналов, закодированные данные объекта (IAO) «обеспечивающее эффект присутствия аудио» и закодированные данные объекта (SDO) «речевой диалог».

На фиг. 6(b) схематично показан пример конфигурации аудиокадра в случае, когда данные передают в нескольких дорожках (несколько аудиопотоков), трех дорожках в этом примере, для примера конфигурации передаваемых данных 3D аудио с фиг. 5. В этом случае аудиодорожка 1 содержит информацию «SYNC» и информацию «Config», а также закодированные данные (CD) каналов. Далее, аудиодорожка 2 содержит информацию «SYNC» и информацию «Config», а также закодированные данные объекта (IAO) «обеспечивающее эффект присутствия аудио». Далее, аудиодорожка 3 содержит информацию «SYNC» и информацию «Config», а также закодированные данные объекта (SDO) «речевой диалог».

На фиг. 7 показан пример деления на группы, в случае передачи с помощью четырех дорожек для примера конфигурации передаваемых данных 3D аудио с фиг. 5. В этом случае аудиодорожка 1 содержит закодированные данные (CD) каналов, которые определены как Группа 1. Далее, аудиодорожка 2 содержит закодированные данные объекта (IAO) «обеспечивающее эффект присутствия аудио», которые определены как Группа 2. Далее, аудиодорожка 3 содержит закодированные данные объекта (SDO) «речевой диалог» для первого языка, которые определены как Группа 3. Далее, аудиодорожка 4 содержит закодированные данные объекта (SDO) «речевой диалог» для второго языка, которые определены как Группа 4.

На фиг. 8 показано отношение соответствия между группами из примера деления на группы (деление на четыре группы) с фиг. 7 и аудиодорожками или подобным. Здесь ID (ID группы) группы представляет собой идентификатор, который отличает группу. Атрибут (атрибут) указывает атрибут закодированных данных каждой группы. ID (ID Группы переключения) группы переключения представляет собой идентификатор для отличения группы переключения. ID (ID заранее установленной Группы) заранее установленной группы представляет собой идентификатор для отличения заранее установленной группы. ID (ID дорожки) дорожки представляет собой идентификатор для отличения аудиодорожки.

Показанное отношение соответствия указывает, что закодированные данные Группы 1 представляют собой закодированные данные каналов, которые не входят в группу переключения и которые содержатся в аудиодорожке 1. Далее, показанное отношение соответствия указывает, что закодированные данные Группы 2 представляют собой закодированные данные объекта «обеспечивающее эффект присутствия аудио» (закодированные данные объекта «обеспечивающее эффект присутствия аудио»), которые не входят в группу переключения и которые содержатся в аудиодорожке 2.

Далее, показанное отношение соответствия указывает, что закодированные данные Группы 3 представляют собой закодированные данные объекта для разговорной речи (закодированные данные объекта «речевой диалог») для первого языка, которые входят в группу 1 переключения и которые содержатся в аудиодорожке 3. Далее, показанное отношение соответствия указывает, что закодированные данные Группы 4 представляют собой закодированные данные объекта для разговорной речи (закодированные данные объекта «речевой диалог») для второго языка, которые входят в группу 1 переключения и которые содержатся в аудиодорожке 4.

Далее, показанное отношение соответствия указывает, что Заранее установленная Группа 1 содержит Группу 1, Группу 2 и Группу 3. Далее, показанное отношение соответствия указывает, что Заранее установленная Группа 2 содержит Группу 1, Группу 2 и Группу 4.

На фиг. 9 показан пример деления на группы, в случае передачи с помощью двух дорожек для примера конфигурации передаваемых данных 3D аудио с фиг. 5. В этом случае, аудиодорожка 1 содержит закодированные данные (CD) каналов, которые определены как Группа 1, и закодированные данные объекта (IAO) «обеспечивающее эффект присутствия аудио», которые определены как Группа 2. Кроме того, аудиодорожка 2 содержит закодированные данные объекта (SDO) «речевой диалог» для первого языка, которые определены как Группа 3, и закодированные данные объекта (SDO) «речевой диалог» для второго языка, которые определены как Группа 4.

На фиг. 10 показано отношение соответствия между группами из примера деления на группы (деление на две группы) с фиг. 9 и подпотоками. Показанное отношение соответствия указывает, что закодированные данные Группы 1 представляют собой закодированные данные каналов, которые не входят в группу переключения и которые содержатся в аудиодорожке 1. Далее, показанное отношение соответствия указывает, что закодированные данные Группы 2 представляют собой закодированные данные объекта «обеспечивающее эффект присутствия аудио» (закодированные данные объекта «обеспечивающее эффект присутствия аудио»), которые не входят в группу переключения и которые содержатся в аудиодорожке 1.

Далее, показанное отношение соответствия указывает, что закодированные данные Группы 3 представляют собой закодированные данные объекта для разговорной речи (закодированные данные объекта «речевой диалог») для первого языка, которые входят в группу 1 переключения и которые содержатся в аудиодорожке 2. Далее, показанное отношение соответствия указывает, что закодированные данные Группы 4 представляют собой закодированные данные объекта для разговорной речи (закодированные данные объекта «речевой диалог») для второго языка, которые входят в группу 1 переключения и которые содержатся в аудиодорожке 2.

Далее, показанное отношение соответствия указывает, что Заранее установленная Группа 1 содержит Группу 1, Группу 2 и Группу 3. Далее, показанное отношение соответствия указывает, что Заранее установленная Группа 2 содержит Группу 1, Группу 2 и Группу 4.

Возвращаясь к фиг. 3, система 100 передачи службы вставляет в файл MPD информацию об атрибутах, которая указывает каждый атрибут закодированных данных для нескольких групп, которые содержатся в передаваемых данных 3D аудио. Далее, система 100 передачи службы вставляет в файл MPD информацию об отношении соответствия потоку, которая указывает аудиодорожку (аудиопоток), в которой содержатся, соответственно, закодированные данные нескольких групп. В этом варианте осуществления настоящего изобретения считается, что информация об отношении соответствия потоку является информацией, указывающей отношение соответствия, например, между ID групп и ID дорожек.

Система 100 передачи службы вставляет в файл MPD информацию об атрибутах и информацию об отношении соответствия потоку. В настоящем варианте осуществления настоящего изобретения, в котором «SupplementaryDescriptor» может заново определить «schemeIdUri» в качестве вещательного или любого другого приложения, отдельно от существующего определения в существующем стандарте, система 100 передачи службы вставляет в файл MPD информацию об атрибутах и информацию об отношении соответствия потоку с использованием «SupplementaryDescriptor».

На фиг. 11 показан пример описания файла MPD, соответствующего примеру деления на группы (деление на четыре группы) с фиг. 7. На фиг. 12 показан пример описания файла MPD, соответствующего примеру деления на группы (деление на две группы) с фиг. 9. Здесь, для упрощения описания, приведен пример, в котором описана только информация, касающаяся аудиопотока, тем не менее, на практике, также описывают информацию, касающуюся других потоков медиаданных, таких как видеопоток. На фиг. 13 показан пример «schemeIdUri», определенного «SupplementaryDescriptor».

Сначала будет объяснен пример описания файла MPD с фиг. 11. Описание «<AdaptationSet mimeType="audio/mp4" group="1">» указывает, что присутствует адаптационный набор (AdaptationSet) для аудиопотока, аудиопоток подают в структуре файла MP4 и выделяют Группу 1.

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:codecType" value= "mpegh"/>» указывает, что кодек аудиопотока представляет собой MPEGH (3D аудио). Как показано на фиг. 13, «schemeIdUri="urn:brdcst:codecType"» указывает тип кодека. В этом примере указан «mpegh».

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:groupId" value= "group1"/>» указывает, что закодированные данные Группы 1 «group1» содержатся в аудиопотоке. Как показано на фиг. 13, «schemeIdUri="urn:brdcst:3dAudio:groupId"» указывает идентификатор группы.

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:attribute" value= "channeldata"/>» указывает, что закодированные данные Группы 1 «group1» представляют собой закодированные данные «channeldata» каналов. Как показано на фиг. 13, «chemeIdUri="urn:brdcst:3dAudio:attribute"» указывает атрибут закодированных данных соответствующей группы.

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:switchGroupId" value= "0"/>» указывает, что закодированные данные Группы 1 «group1» не принадлежат никакой группе переключения. Как показано на фиг. 13, «schemeIdUri="urn:brdcst:3dAudio:switchGroupId"» указывает идентификатор группы переключения, которой принадлежит соответствующая группа. Например, значение «0» указывает, что соответствующая группа не принадлежит никакой группе переключения. Когда «значение» является значением, отличным от «0», это указывает на принадлежность к некоторой группе переключения.

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:presetGroupId" value= "preset1"/>» указывает, что закодированные данные Группы 1 «group1» принадлежат Заранее установленной Группе 1 «preset1». Далее, описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:presetGroupId" value= "preset2"/>» указывает, что закодированные данные Группы 1 «group1» принадлежат Заранее установленной Группе 2 «preset2». Как показано на фиг. 13, «schemeIdUri="urn:brdcst:3dAudio:presetGroupId"» указывает идентификатор заранее установленной группы, которой принадлежит соответствующая группа.

Описание «<Representation id="1" bandwidth="128000">» указывает, что присутствует аудиопоток со скоростью в битах, равной 128 килобит в секунду, который содержит закодированные данные Группы 1 «group1» в адаптационном наборе Группы 1, в качестве представления, идентифицированного «Representation id="1"». Далее, описание «<baseURL>audio/jp1/128.mp4</BaseURL>» указывает, что местоположение аудиопотока представляет собой «audio/jp1/128.mp4».

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:levelId" value= "level1"/>» указывает, что аудиопоток передают с помощью дорожки, соответствующей Уровню 1 «level1». Как показано на фиг. 13, «schemeIdUri="urn:brdcst:3dAudio:levelId"» указывает идентификатор уровня, соответствующий идентификатору дорожки для передачи аудиопотока, содержащего закодированные данные соответствующей группы. Здесь соответствие между идентификаторами (ID дорожки) дорожек и идентификаторами (ID уровня) уровней описано, например, в прямоугольнике «moov», как описано ниже.

Далее, описание «<AdaptationSet mimeType="audio/mp4" group="2">» указывает, что присутствует адаптационный набор (AdaptationSet) для аудиопотока, аудиопоток подают в структуре файла MP4 и выделяют Группу 2.

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:codecType" value= "mpegh"/>» указывает, что кодек аудиопотока представляет собой «MPEGH (3D аудио)». Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:groupId" value= "group2"/>» указывает, что закодированные данные Группы 2 «group2» содержатся в аудиопотоке.

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:attribute" value= "objectSound"/>» указывает, что закодированные данные Группы 2 «group2» представляют собой закодированные данные объекта «objectSound» для обеспечивающего эффект присутствия звука. Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:switchGroupId" value= "0"/>» указывает, что закодированные данные Группы 2 «group2» не принадлежат никакой группе переключения.

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:presetGroupId" value= "preset1"/>» указывает, что закодированные данные Группы 2 «group2» принадлежат Заранее установленной Группе 1 «preset1». Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:presetGroupId" value= "preset2"/>» указывает, что закодированные данные Группы 2 «group2» принадлежат Заранее установленной Группе 2 «preset2».

Описание «<Representation id="2" bandwidth="128000">» указывает, что присутствует аудиопоток со скоростью в битах, равной 128 килобит в секунду, который содержит закодированные данные Группы 2 «group2» в адаптационном наборе Группы 2, в качестве представления, идентифицированного «Representation id="2"». Далее, описание «<baseURL>audio/jp2/128.mp4</BaseURL>» указывает, что местоположение аудиопотока представляет собой «audio/jp2/128.mp4». Далее, описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:levelId" value= "level2"/>» указывает, что аудиопоток передают с помощью дорожки, соответствующей Уровню 2 «level2».

Далее, описание «<AdaptationSet mimeType="audio/mp4" group="3">» указывает, что присутствует адаптационный набор (AdaptationSet), соответствующий аудиопотоку, при этом аудиопоток подают в структуре файла MP4 и выделяют Группу 3.

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:codecType" value= "mpegh"/>» указывает, что кодек аудиопотока представляет собой «MPEGH (3D аудио)». Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:groupId" value= "group3"/>» указывает, что закодированные данные Группы 3 «group3» содержатся в аудиопотоке. Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:attribute" value= "objectLang1"/>» указывает, что закодированные данные Группы 3 «group3» представляют собой закодированные данные объекта «objectLang1» для разговорной речи первого языка.

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:switchGroupId" value= "1"/>» указывает, что закодированные данные Группы 3 «group3» принадлежат группе 1 переключения (группа 1 переключения). Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:presetGroupId" value= "preset1"/>» указывает, что закодированные данные Группы 3 «group3» принадлежат Заранее установленной Группе 1 «preset1».

Описание «<Representation id="3" bandwidth="128000">» указывает, что присутствует аудиопоток со скоростью в битах, равной 128 килобит в секунду, который содержит закодированные данные Группы 3 «group3» в адаптационном наборе Группы 3, в качестве представления, идентифицированного «Representation id="3"». Далее, описание «<baseURL>audio/jp3/128.mp4</BaseURL>» указывает, что местоположение аудиопотока представляет собой «audio/jp3/128.mp4». Далее, описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:levelId" value= "level3"/>» указывает, что аудиопоток передают с помощью дорожки, соответствующей Уровню 3 «level3».

Далее, описание «<AdaptationSet mimeType="audio/mp4" group="4">» указывает, что присутствует адаптационный набор (AdaptationSet), соответствующий аудиопотоку, при этом аудиопоток подают в структуре файла MP4 и выделяют Группу 4.

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:codecType" value= "mpegh"/>» указывает, что кодек аудиопотока представляет собой «MPEGH (3D аудио)». Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:groupId" value= "group4"/>» указывает, что закодированные данные Группы 4 «group4» содержатся в аудиопотоке. Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:attribute" value= "objectLang2"/>» указывает, что закодированные данные Группы 4 «group4» представляют собой закодированные данные объекта «objectLang2» для разговорной речи второго языка.

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:switchGroupId" value= "1"/>» указывает, что закодированные данные Группы 4 «group4» принадлежат группе 1 переключения (группа 1 переключения). Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:presetGroupId" value = "preset2"/>» указывает, что закодированные данные Группы 4 «group4» принадлежат Заранее установленной Группе 2 «preset2».

Описание «<Representation id="4" bandwidth="128000">» указывает, что присутствует аудиопоток со скоростью в битах, равной 128 килобит в секунду, который содержит закодированные данные Группы 4 «group4» в адаптационном наборе Группы 4, в качестве представления, идентифицированного «Representation id="4"». Далее, описание «<baseURL>audio/jp4/128.mp4</BaseURL>» указывает, что местоположение аудиопотока представляет собой «audio/jp4/128.mp4». Далее, описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:levelId" value= "level4"/>» указывает, что аудиопоток передают с помощью дорожки, соответствующей Уровню 4 «level4».

Далее будет объяснен пример описания файла MPD с фиг. 12. Описание «<AdaptationSet mimeType="audio/mp4" group="1">» указывает, что присутствует адаптационный набор (AdaptationSet) аудиопотока, при этом аудиопоток подают в структуре файла MP4 и выделяют Группу 1. Далее, описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:codecType" value= "mpegh"/>» указывает, что кодек аудиопотока представляет собой «MPEGH (3D аудио)».

Описание «<Representation id="1" bandwidth="128000">» указывает, что присутствует аудиопоток со скоростью в битах, равной 128 килобит в секунду в адаптационном наборе Группы 1, в качестве представления, идентифицированного «Representation id="1"». Далее, описание «<baseURL>audio/jp1/128.mp4</BaseURL>» указывает, что местоположение аудиопотока представляет собой «audio/jp1/128.mp4». Далее, описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:levelId" value= "level1"/>» указывает, что аудиопоток передают с помощью дорожки, соответствующей Уровню 1 «level1».

Описание «<SubRepresentation id="11" subgroupSet="1">» указывает, что присутствует подпредставление, обозначенное с помощью «SubRepresentation id="11"» в представлении, которое обозначено с помощью «Representation id="1"», и выделяют набор 1 подгруппы.

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:groupId" value= "group1"/>» указывает, что закодированные данные Группы 1 «group1» содержатся в аудиопотоке. Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:attribute" value= "channeldata"/>» указывает, что закодированные данные Группы 1 «group1» представляют собой закодированные данные «channeldata» каналов.

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:switchGroupId" value = "0"/>» указывает, что закодированные данные Группы 1 «group1» не принадлежат никакой группе переключения. Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:presetGroupId" value= "preset1"/>» указывает, что закодированные данные Группы 1 «group1» принадлежат Заранее установленной Группе 1 «preset1». Далее, описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:presetGroupId" value= "preset2"/>» указывает, что закодированные данные Группы 1 «group1» принадлежат Заранее установленной Группе 2 «preset2».

Описание «<SubRepresentation id="12" subgroupSet="2">» указывает, что присутствует подпредставление, обозначенное с помощью «SubRepresentation id="12"» в представлении, которое обозначено с помощью «Representation id="1"», и выделяют набор 2 подгруппы.

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:groupId" value= "group2"/>» указывает, что закодированные данные Группы 2 «group2» содержатся в аудиопотоке. Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:attribute" value= "objectSound"/>» указывает, что закодированные данные Группы 2 «group2» представляют собой закодированные данные объекта «objectSound» для обеспечивающего эффект присутствия звука.

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:switchGroupId" value= "0"/>» указывает, что закодированные данные Группы 2 «group2» не принадлежат никакой группе переключения. Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:presetGroupId" value= "preset1"/>» указывает, что закодированные данные Группы 2 «group2» принадлежат Заранее установленной Группе 1 «preset1». Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:presetGroupId" value= "preset2"/>» указывает, что закодированные данные Группы 2 «group2» принадлежат Заранее установленной Группе 2 «preset2».

Далее, описание «<AdaptationSet mimeType="audio/mp4" group="2">» указывает, что присутствует адаптационный набор (AdaptationSet), соответствующий аудиопотоку, при этом аудиопоток подают в структуре файла MP4 и выделяют Группу 2. Далее, описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:codecType" value= "mpegh"/>» указывает, что кодек аудиопотока представляет собой «MPEGH (3D аудио)».

Описание «<Representation id="2" bandwidth="128000">» указывает, что присутствует аудиопоток со скоростью в битах, равной 128 килобит в секунду в адаптационном наборе Группы 1, в качестве представления, идентифицированного «Representation id="2"». Далее, описание «<baseURL>audio/jp2/128.mp4</BaseURL>» указывает, что местоположение аудиопотока представляет собой «audio/jp2/128.mp4». Далее, описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:levelId" value= "level2"/>» указывает, что аудиопоток передают с помощью дорожки, соответствующей Уровню 2 «level2».

Описание «<SubRepresentation id="21" subgroupSet="3">» указывает, что присутствует подпредставление, обозначенное с помощью «SubRepresentation id="21"» в представлении, которое обозначено с помощью «Representation id="2"», и выделяют набор 3 подгруппы.

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:groupId" value= "group3"/>» указывает, что закодированные данные Группы 3 «group3» содержатся в аудиопотоке. Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:attribute" value= "objectLang1"/>» указывает, что закодированные данные Группы 3 «group3» представляют собой закодированные данные объекта «objectLang1» для разговорной речи первого языка.

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:switchGroupId" value= "1"/>» указывает, что закодированные данные Группы 3 «group3» принадлежат группе 1 переключения (группа 1 переключения). Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:presetGroupId" value = "preset1"/>» указывает, что закодированные данные Группы 3 «group3» принадлежат Заранее установленной Группе 1 «preset1».

Описание «<SubRepresentation id="22" subgroupSet="4">» указывает, что присутствует подпредставление, обозначенное с помощью «SubRepresentation id="22"» в представлении, которое обозначено с помощью «Representation id="2"», и выделяют набор 4 подгруппы.

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:groupId" value= "group4"/>» указывает, что закодированные данные Группы 4 «group4» содержатся в аудиопотоке. Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:attribute" value= "objectLang2"/>» указывает, что закодированные данные Группы 4 «group4» представляют собой закодированные данные объекта «objectLang2» для разговорной речи второго языка.

Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:switchGroupId" value= "1"/>» указывает, что закодированные данные Группы 4 «group4» принадлежат группе 1 переключения (группа 1 переключения). Описание «<SupplementaryDescriptor schemeIdUri="urn:brdcst:3dAudio:presetGroupId" value = "preset2"/>» указывает, что закодированные данные Группы 4 «group4» принадлежат Заранее установленной Группе 2 «preset2».

Далее, будет описано содержание файла медиаданных, местоположение которого указано с помощью «<baseURL>», то есть файла, содержащегося в каждой аудиодорожке. В случае, например, нефрагментированного MP4 (нефрагментированный MP4) содержимое файла медиаданных иногда определяют как «url 1», как показано на фиг. 14(а). В этом случае первым расположен прямоугольник «ftyp», описывающий тип файла. Прямоугольник «ftyp» указывает, что файл является нефрагментированным файлом MP4. Далее расположены прямоугольник «moov» и прямоугольник «mdat». Прямоугольник «moov» содержит все метаданные, например, информацию о заголовке каждой дорожки, метаописание содержимого, информацию о времени и подобное. Прямоугольник «mdat» содержит собственно медиаданные.

Далее, в случае, например, фрагментированного MP4 (фрагментированный MP4) содержимое файла медиаданных иногда определяют как «url 2», как показано на фиг. 14(b). В этом случае первым расположен прямоугольник «styp», описывающий тип сегмента. Далее, расположен прямоугольник «sidx», описывающий индекс сегмента. Затем расположено заранее заданное количество фрагментов (фрагмент киноизображения) киноизображения. Здесь, фрагмент киноизображения сформирован прямоугольником «moof», содержащим управляющую информацию, и прямоугольником «mdat», содержащим собственно медиаданные. Так как фрагмент, полученный при разбиении передаваемых медиаданных на фрагменты, содержится в прямоугольнике «mdat» одного фрагмента киноизображения, управляющая информация, содержащаяся в прямоугольнике «moof», является управляющей информацией, касающейся этого фрагмента. «styp», «sidx», «moof» и «mdat» представляют собой блоки, которые составляют сегмент.

Далее, также рассматривают комбинацию описанных выше «url 1» и «url 2». В этом случае, например, «url 1» может быть установлен как сегмент инициализации, а «url 1» и «url 2» могут быть установлены как MP4 одной службы. В качестве альтернативы, «url 1» и «url 2» могут быть объединены в одну и определены как «url 3», как показано на фиг. 14(с).

Как описано выше, в прямоугольнике «moov», записано соответствие между идентификаторами (ID дорожки) дорожек и идентификаторами (ID уровня) уровней. Как показано на фиг. 15(а), прямоугольник «ftyp» и прямоугольник «moov» составляют сегмент (сегмент инициализации) инициализации. В прямоугольнике «moov» присутствует прямоугольник «mvex» и дополнительно в прямоугольнике «mvex» присутствует прямоугольник «leva».

Как показано на фиг. 15(b), в прямоугольнике «leva» определено соответствие между идентификаторами (ID дорожки) дорожек и идентификаторами (ID уровня) уровней. В показанном примере, «level0» связан с «track0», «level1» связан с «track1», а «level2» связан с «track2».

На фиг. 16(а) показан пример передачи каждого прямоугольника в случае системы вещания. Один сегмент сформирован первым сегментом (сегментами) инициализации, за которым следует прямоугольник «styp», прямоугольник «sidx» и заранее заданное количество фрагментов киноизображений (сформированных прямоугольником «moof» и прямоугольником «mdat»). В показанном примере заранее заданное количество равно единице.

Как описано выше, в прямоугольнике «moov», составляющем сегмент (is) инициализации, записано соответствие между идентификаторами (ID дорожки) дорожек и идентификаторами (ID уровня) уровней. Далее, как показано на фиг. 16(b), в прямоугольнике «sidx» каждая дорожка определена уровнем (уровень) и присутствует зарегистрированная информация о диапазоне каждой дорожки. Другими словами, в соответствии с каждым уровнем, в файле зарегистрированы информация о времени воспроизведения и информация о положении начала. На приемной стороне, что касается аудио, аудиопоток нужной аудиодорожки может быть по выбору извлечен на основе информации о диапазоне.

Возвращаясь к фиг. 3, устройство 200 приема службы принимает от системы 100 передачи службы, DASH/MP4, который являются MP4, содержащим файл MPD, в качестве метафайла, и поток (сегмент медиаданных) медиаданных, такой как видео, аудио или подобное, переданный по RF каналу передачи или по каналу передачи через сеть связи.

Как описано выше, помимо видеопотока, MP4 содержит заранее заданное количество аудиодорожек (аудиопотоков), включающих в себя несколько групп закодированных данных, которые составляют передаваемые данные 3D аудио. Далее, в файл MPD вставляют информацию об атрибутах, указывающую каждый атрибут нескольких групп закодированных данных, содержащихся в передаваемых данных 3D аудио, и вставляют информацию об отношении соответствия потоку, которая указывает аудиодорожку (аудиопоток), содержащую, соответственно, закодированные данные нескольких групп.

Устройство 200 приема службы по выбору осуществляет процесс декодирования аудиопотока, содержащего закодированные данные группы, атрибут которой совместим с конфигурацией динамиков и информацией о выборе пользователя, что делают на основе информации об атрибутах и информации об отношении соответствия потоку, и получает вывод аудио из 3D аудио.

[Блок выработки DASH/MP4 из системы передачи службы]

На фиг. 17 показан пример конфигурации блока 110 выработки DASH/MP4, содержащегося в системе 100 передачи службы. Блок выработки DASH/MP4 содержит блок 111 управления, устройство 112 кодирования видео, устройство 113 кодирования аудио и устройство 114 форматирования DASH/MP4.

На устройство 112 кодирования видео поступают видеоданные SV, устройство 112 кодирования видео осуществляет кодирование, такое как MPEG2, H.264/AVC и H.265/HEVC, видеоданных SV и вырабатывает видеопоток (элементарный видеопоток). На устройство 113 кодирования аудио поступают аудиоданные SA, данные объекта «обеспечивающее эффект присутствия аудио» и данные объекта «речевой диалог» вместе с данными каналов.

Устройство 113 кодирования аудио осуществляет MPEGH кодирование аудиоданных SA и получает передаваемые данные 3D аудио. Как показано на фиг. 5, передаваемые данные 3D аудио содержат закодированные данные (CD) каналов, закодированные данные объекта (IAO) «обеспечивающее эффект присутствия аудио» и закодированные данные объекта (SDO) «речевой диалог». Устройство 113 кодирования аудио вырабатывает один или несколько аудиопотоков (элементарные аудиопотоки), содержащих закодированные данные нескольких групп, то есть четырех групп в этом примере (смотри фиг. 6(a) и 6(b)).

Устройство 114 форматирования DASH/MP4 вырабатывает MP4, содержащий поток (сегмент медиаданных) медиаданных из видео и аудио в качестве содержимого на основе видеопотока, выработанного в устройстве 112 кодирования видео, и заранее заданного количества аудиопотоков, выработанных в устройстве 113 кодирования аудио. Здесь каждый поток видео или аудио сохраняют в MP4, соответственно, как отдельные дорожки.

Далее устройство 114 форматирования DASH/MP4 вырабатывает файл MPD с использованием метаданных содержания, информации об URL сегмента и подобного. В варианте осуществления настоящего изобретения, устройство 114 форматирования DASH/MP4 вставляет в файл MPD информацию об атрибутах, указывающую каждый атрибут закодированных данных нескольких групп, содержащихся в передаваемых данных 3D аудио, и также вставляют информацию об отношении соответствия потоку, которая указывает аудиодорожку (аудиопоток), содержащую, соответственно, закодированные данные нескольких групп (смотри фиг. 11 и 12).

Далее коротко опишем работу устройства 110 выработки DASH/MP4, показанного на фиг. 17. Видеоданные SV подают на устройство 112 кодирования видео. Устройство 112 кодирования видео осуществляет кодирование, такое как H.264/AVC, H.265/HEVC или подобное, видеоданных SV и вырабатывает видеопоток, содержащий закодированные данные видео. Видеопоток подают на устройство 114 форматирования DASH/MP4.

Аудиоданные SA подают на устройство 113 кодирования аудио. Аудиоданные SA содержат данные каналов и данные объекта «обеспечивающее эффект присутствия аудио» и данные объекта «речевой диалог». Устройство 113 кодирования аудио осуществляет MPEGH кодирование аудиоданных SA и получает передаваемые данные 3D аудио.

Передаваемые данные 3D аудио содержат закодированные данные объекта (IAO) «обеспечивающее эффект присутствия аудио» и закодированные данные объекта (SDO) «речевой диалог», помимо закодированных данных (CD) каналов (смотри фиг. 5). Далее в устройстве 113 кодирования аудио вырабатывают один или несколько аудиопотоков, содержащих четыре группы закодированных данных (смотри фиг. 6(a) и 6(b)). Видеопоток подают на устройство 114 форматирования DASH/MP4.

Устройство 114 форматирования DASH/MP4 вырабатывает MP4, содержащий поток (сегмент медиаданных) медиаданных из видео, аудио или подобного в качестве содержимого на основе видеопотока, выработанного в устройстве 112 кодирования видео, и заранее заданного количества аудиопотоков, выработанных в устройстве 113 кодирования аудио. Здесь каждый поток видео или аудио сохраняют в MP4, соответственно, как отдельные дорожки (дорожка).

Далее устройство 114 форматирования DASH/MP4 вырабатывает файл MPD с использованием метаданных содержания, информации сегмента URL или подобного. В файл MPD вставляют информацию об атрибутах, указывающую каждый атрибут закодированных данных нескольких групп, содержащихся в передаваемых данных 3D аудио, и также вставляют информацию об отношении соответствия потоку, которая указывает аудиодорожку (аудиопоток), содержащую, соответственно, закодированные данные нескольких групп.

[Пример конфигурации устройства приема службы]

На фиг. 18 показан пример конфигурации устройства 200 приема службы. Устройство 200 приема службы содержит блок 201 приема, блок 202 анализа DASH/MP4, устройство 203 декодирования видео, схему 204 обработки изображений, схему 205 привода панели и панель 206 отображения. Далее, устройство 200 приема службы содержит буферы 211-1 - 211-N контейнеров, устройство 212 объединения, устройство 213 декодирования 3D аудио, схему 214 обработки вывода аудио и систему 215 динамиков. Далее, устройство 200 приема службы содержит CPU 221, флеш-ROM 222, DRAM 223, внутреннюю шину 224, блок 225 приема для дистанционного управления и устройство 226 передачи для дистанционного управления.

CPU 221 управляет работой каждого блока в устройстве 200 приема службы. Во флеш-ROM 222 хранится программное обеспечение управления и данные. DRAM 223 составляет рабочую область для CPU 221. CPU 221 запускает программное обеспечение путем разворачивания программного обеспечения и данных, считанных из флеш-ROM 222, в DRAM 223 и управляет каждым блоком в устройстве 200 приема службы.

Блок 225 приема для дистанционного управления принимает сигнал дистанционного управления (код дистанционного управления), переданный из устройства 226 передачи для дистанционного управления, и подает сигнал на CPU 221. CPU 221 управляет каждым блоком в устройстве 200 приема службы на основе кода дистанционного управления. CPU 221, флеш-ROM 222 и DRAM 223 соединены друг с другом с помощью внутренней шины 224.

Блок 201 приема принимает DASH/MP4, который являются файлом MPD, в качестве метафайла, и MP4, содержащий поток (сегмент медиаданных) медиаданных, такой как видео и аудио, переданный от системы 100 передачи службы по RF каналу передачи или по каналу передачи через сеть связи.

Помимо видеопотока, MP4 содержит заранее заданное количество аудиодорожек (аудиопотоков), включающих в себя несколько групп закодированных данных, которые составляют передаваемые данные 3D аудио. Далее, в файл MPD вставляют информацию об атрибутах, указывающую каждый атрибут закодированных данных нескольких групп, содержащихся в передаваемых данных 3D аудио, и также вставляют информацию об отношении соответствия потоку, которая указывает аудиодорожку (аудиопоток), содержащую, соответственно, закодированные данные нескольких групп.

Блок 202 анализа DASH/MP4 анализирует файл MPD и MP4, принятые блоком 201 приема. Блок 202 анализа DASH/MP4 извлекает видеопоток из MP4 и передает видеопоток на устройство 203 декодирования видео. Устройство 203 декодирования видео осуществляет процесс декодирования видеопотока и получает несжатые видеоданные.

Схема 204 обработки изображений осуществляет процесс масштабирования и процесс регулировки качества изображения для видеоданных, полученных устройством 203 декодирования видео, и получает видеоданные для отображения. Схема 205 привода панели приводит в действие панель 206 отображения на основе видеоданных, которые подлежат отображению и которые получены схемой 204 обработки изображений. Панель 206 отображения выполнена, например, с помощью жидкокристаллического дисплея (LCD), органического электролюминесцентного (органического EL дисплея) дисплея и подобного.

Далее, блок 202 анализа DASH/MP4 извлекает информацию MPD, содержащуюся в файле MPD, и передает информацию MPD на CPU 221. CPU 221 управляет процессом получения потока видео или аудио на основе информации MPD. Далее блок 202 анализа DASH/MP4 извлекает из MP4 такие метаданные, как, например, информация о заголовке каждой дорожки, метаописание содержимого, информация о времени, и передает метаданные на CPU 221.

CPU 21 распознает аудиодорожку (аудиопоток), содержащий закодированные данные группы, включающей в себя атрибут, совместимый с конфигурацией динамиков и информацией о выборе зрителя (пользователя), на основе информации об атрибутах, указывающей атрибут закодированных данных каждой группы, информацией об отношении соответствия потоку, указывающей аудиодорожку (аудиопоток), в которой содержится каждая группа в файле MPD.

Далее, под управлением CPU 221, блок 202 анализа DASH/MP4 обращается к ID (ID уровня) уровня, ID (ID дорожки) дорожки другими словами, и по выбору извлекает один или несколько аудиопотоков, содержащих закодированные данные группы, включающей в себя атрибут, совместимый с конфигурацией динамиков и информацией о выборе зрителя (пользователя), из заранее заданного количества аудиопотоков, содержащихся в MP4. 0

Буферы 211-1 - 211-N контейнеров импортируют каждый аудиопоток, извлеченный, соответственно, блоком 202 анализа DASH/MP4. Здесь N, представляющее собой количество буферов 211-1 - 211-N контейнеров, является необходимым и достаточным числом и при фактической работе это число эквивалентно количеству аудиопотоков, извлеченных в блоке 202 анализа DASH/MP4.

В устройстве 212 объединения считывают аудиопоток каждого аудиокадра из каждого буфера контейнеров из буферов 211-1 - 211-N контейнеров, в который импортировали каждый аудиопоток, извлеченный с помощью блока 202 анализа DASH/MP4, и подают на устройство 213 декодирования 3D аудио закодированные данные группы, содержащей атрибут, совместимый с конфигурацией динамиков и информацией о выборе зрителя (пользователя).

Устройство 213 декодирования 3D аудио осуществляет процесс декодирования закодированных данных, поданных из устройства 212 объединения, и получает аудиоданные для приведения в действие каждого динамика системы 215 динамиков. Здесь возможны три случаях закодированных данных, с которыми осуществляют процесс декодирования: случай, когда содержатся только закодированные данные каналов, случай, когда содержатся только закодированные данные объектов, и случай, когда содержатся как закодированные данные каналов, так и закодированные данные объектов.

При декодировании закодированных данных каналов, устройство 213 декодирования 3D аудио получает аудиоданные для приведения в действие каждого динамика с помощью осуществления уменьшения и увеличения числа каналов для конфигурации динамиков из системы 215 динамиков. Далее, при декодировании закодированных данных объектов, устройство 213 декодирования 3D аудио вычисляет преобразование для динамиков (соотношение частей для каждого динамика) на основе информации объектов (метаданные) и смешивает аудиоданные объекта с аудиоданными для приведения в действие каждого динамика в соответствии с результатом вычислений.

Схема 214 обработки вывода аудио осуществляет необходимый процесс обработки, такой как цифро-аналоговое преобразование, усиление и подобное, аудиоданных, полученных из устройства 213 декодирования 3D аудио, для приведения в действие каждого динамика, и подает данные на систему 215 динамиков. Система 215 динамиков содержит несколько динамиков, таких как динамики для нескольких каналов, например, 2 каналов, 5.1 каналов, 7.1 каналов и 22.2 каналов или подобные.

Далее объясним работу устройства 200 приема службы, показанного на фиг. 18. В блоке 201 приема принимают DASH/MP4, который является файлом MPD, в качестве метафайла, и MP4, содержащий поток (сегмент медиаданных) медиаданных, такой как видео и аудио, от системы 100 передачи службы по RF каналу передачи или по каналу передачи через сеть связи. Файл MPD и MP4, принятые таким образом, подают на блок 202 анализа DASH/MP4.

В блоке 202 анализа DASH/MP4 анализируют файл MPD и MP4, принятые блоком 201 приема. Далее, в блоке 202 анализа DASH/MP4 извлекают видеопоток из MP4 и передают на устройство 203 декодирования видео. В устройстве 203 декодирования видео осуществляет процесс декодирования видеопотока и получают несжатые видеоданные. Видеоданные подают на схему 204 обработки изображений.

В схеме 204 обработки изображений осуществляют процесс масштабирования, регулировки качества изображения или подобное для видеоданных, полученных устройством 203 декодирования видео, и получают видеоданные для отображения. Видеоданные для отображения подают на схему 205 привода панели. В схеме 205 привода панели на основе видеоданных для отображения приводят в действие панель 206 отображения. В этой конфигурации, с помощью панели 206 отображения отображают изображение, соответствующее видеоданным, подлежащим отображению.

Далее, в блоке 202 анализа DASH/MP4 извлекают информацию MPD, содержащуюся в файле MPD, и передают информацию MPD на CPU 221. Далее, в блоке 202 анализа DASH/MP4 извлекают из MP4 такие метаданные, как, например, информация о заголовке каждой дорожки, метаописание содержимого, информация о времени или подобные, и передают метаданные на CPU 221. В CPU 221 распознают аудиодорожку (аудиопоток), в которой закодированные данные группы, содержащей атрибут, совместимый с конфигурацией динамиков и информацией о выборе зрителя (пользователя), на основе информации об атрибутах, информации об отношении соответствия потоку или подобной информации, которая содержится в файле MPD.

Далее, под управлением CPU 221 в блоке 202 анализа DASH/MP4 из заранее заданного количества аудиопотоков, содержащихся в MP4, с помощью ID дорожки, по выбору извлекают один или несколько аудиопотоков, содержащих закодированные данные группы, включающей в себя атрибут, совместимый с конфигурацией динамиков и информацией о выборе зрителя (пользователя).

Аудиопоток, извлеченный в блоке 202 анализа DASH/MP4, импортируют в соответствующий буфер контейнеров из буферов 211-1 - 211-N контейнеров. В устройстве 212 объединения аудиопоток считывают из каждого аудиокадра из каждого буфера контейнеров, в который импортировали аудиопоток, и подают аудиопоток на устройство 213 декодирования 3D аудио в качестве закодированных данных группы, содержащей атрибут, совместимый с конфигурацией динамиков и информацией о выборе зрителя. В устройстве 213 декодирования 3D аудио осуществляют процесс декодирования закодированных данных, поданных из устройства 212 объединения, и получают аудиоданные для приведения в действие каждого динамика системы 215 динамиков.

Здесь, при декодировании закодированных данных, осуществляют процессы по уменьшению и увеличению числа каналов для конфигурации динамиков из системы 215 динамиков и получают аудиоданные для приведения в действие каждого динамика. Кроме того, при декодировании закодированных данных объектов, вычисляют преобразование для динамиков (соотношение частей для каждого динамика) на основе информации объектов (метаданные) и смешивают аудиоданные объекта с аудиоданными для приведения в действие каждого динамика в соответствии с результатами вычислений.

Аудиоданные для приведения в действие каждого динамика, полученные в устройстве 213 декодирования 3D аудио, подают на схему 214 обработки вывода аудио. В схеме 214 обработки вывода аудио осуществляют необходимые процессы, такие как цифро-аналоговое преобразование, усиление или подобное, для аудиоданных с целью приведения в действие каждого динамика. Далее, прошедшие обработку аудиоданные подают на систему 215 динамиков. При этой конфигурации, вывод аудио, соответствующего изображению панели 206 отображения, получают из системы 215 динамиков.

На фиг. 19 показан пример процесса управления декодированием аудио, который осуществляет CPU 221 в устройстве 200 приема службы, показанном на фиг. 18. Сначала, на этапе ST1, CPU 221 начинает процесс. Далее на этапе ST2 CPU 221 определяет конфигурацию динамиков устройства приема, то есть конфигурацию динамиков системы 215 динамиков. Затем, на этапе ST3 CPU 221 получает касающуюся вывода аудио информацию о выборе, который осуществляет зритель (пользователь).

Далее, на этапе ST4, CPU 221 считывает информацию, которая касается каждого аудиопотока информации MPD и которая представляет собой «groupID», «attribute», «switchGroupID», «presetGroupID» и «levelID». Далее на этапе ST5 CPU 221 распознает ID (ID дорожки) аудиодорожки, которой принадлежат закодированные данные группы, содержащей атрибут, совместимый с конфигурацией динамиков и информацией о выборе зрителя.

Далее, на этапе ST6, CPU 221 выбирает каждую аудиодорожку на основе результата распознавания и импортирует сохраненный аудиопоток в буфер контейнеров. Далее, на этапе ST7, CPU 221 считывает аудиопоток для каждого аудиокадра из буфера контейнеров и подает закодированные данные необходимой группы на устройство 213 декодирования 3D аудио.

Далее, на этапе ST8 CPU 221 определяет, нужно ли декодировать закодированные данные объектов. На этапе ST9 при декодировании закодированных данных объектов, CPU 221 вычисляет преобразование для динамиков (соотношение частей для каждого динамика) с использованием азимута (информации об ориентации) и подъема (информации об угле подъема) на основе информации объектов (метаданные). После этого CPU 221 переходит к процессу этапа ST10. Здесь, на этапе ST8, когда не декодируют закодированные данные объектов, CPU 221 сразу переходит на процесс этапа ST10.

На этапе ST10 CPU 221 определяет, нужно ли декодировать закодированные данные каналов. На этапе ST11 при декодировании закодированных данных каналов, CPU 221 осуществляет процессы по уменьшению и увеличению числа каналов для конфигурации динамиков из системы 215 динамиков и получает аудиоданные для приведения в действие каждого динамика. После этого CPU 221 переходит к процессу этапа ST12. Здесь, когда на этапе ST10 не декодируют закодированные данные объектов, CPU 221 сразу переходит на процесс этапа ST12.

На этапе ST12, когда декодируют закодированные данные объектов, CPU 221 смешивает аудиоданные объекта с аудиоданными для приведения в действие каждого динамика в соответствии с результатом вычисления с этапа ST9, и после этого осуществляет управление динамическим диапазоном. Далее, CPU 221 заканчивает процесс на этапе ST13. Здесь, когда не декодируют закодированные данные объектов, CPU 221 пропускает процесс на этапе ST12.

Как описано выше, в системе 10 приемо-передачи, показанной на фиг. 3, система 100 передачи службы вставляет в файл MPD информацию об атрибутах, которая указывает каждый атрибут закодированных данных нескольких групп, которые содержатся в заранее заданном количестве аудиопотоков. Таким образом, сторона приема может легко распознать каждый атрибут закодированных данных нескольких групп до декодирования закодированных данных, так что по выбору могут быть декодированы и использованы закодированные данные необходимых групп и это может уменьшить нагрузку по обработке.

Далее, в системе 10 приемо-передачи, показанной на фиг. 3, система 100 передачи службы вставляет в файл MPD информацию об отношении соответствия потоку, которая указывает аудиодорожку (аудиопоток), в которой содержатся, соответственно, закодированные данные нескольких групп. Таким образом, приемная сторона может легко распознать аудиодорожку (аудиопоток), содержащий закодированные данные необходимой группы, и может быть уменьшена нагрузка по обработке.

<2. Модифицированные примеры>

Здесь, в описанных выше вариантах осуществления изобретения устройство 200 приема службы выполнено с возможностью извлечения по выбору аудиопотока, содержащего закодированные данные группы, включающей в себя атрибут, совместимый с конфигурацией динамиков и информацией о выборе зрителя, из нескольких аудиопотоков, переданных от устройства 100 передачи службы, и с возможностью получения аудиоданных для приведения в действие заранее заданного количества динамиков, что делают путем осуществления процесса декодирования.

Здесь, в качестве устройства приема службы, можно рассматривать извлечение по выбору одного или нескольких аудиопотоков, содержащих закодированные данные группы, включающей в себя атрибут, совместимый с конфигурацией динамиков и информацией о выборе зрителя, из нескольких аудиопотоков, переданных от устройства 100 передачи службы, изменение конфигурации аудиопотока, содержащего закодированные данные группы, включающей в себя атрибут, совместимый с конфигурацией динамиков и информацией о выборе зрителя, и доставку аудиопотока с измененной конфигурацией на устройство (в том числе DLNA устройство), соединенное с внутренней сетью.

На фиг. 20 показан пример конфигурации устройства 200А приема службы, которое распределяет аудиопоток с измененной конфигурацией на устройство, соединенное с внутренней сетью, как описано выше. На фиг. 20 одинаковые ссылочные позиции применены для частей, которые соответствуют частям с фиг. 18, и их подробное описание будет опущено.

Под управлением CPU 221, блок 202 анализа DASH/MP4 ссылается на ID (ID уровня) уровня, то есть ID (ID дорожки) дорожки и по выбору извлекает один или несколько аудиопотоков, содержащих закодированные данные группы, включающей в себя атрибут, совместимый с конфигурацией динамиков и информацией о выборе зрителя (пользователя), из заранее заданного количества аудиопотоков, содержащихся в MP4.

Аудиопоток, извлеченный в блоке 202 анализа DASH/MP4, импортируют в соответствующий буфер контейнеров из буферов 211-1 - 211-N контейнеров. В устройстве 212 объединения аудиопоток для каждого аудиокадра считывают из каждого буфера контейнеров, в который аудиопоток был импортирован, и подают на устройство 231 изменения конфигурации потока.

В устройстве 231 изменения конфигурации потока по выбору получают заранее заданную группу, содержащую атрибут, совместимый с конфигурацией динамиков и информацией о выборе зрителя, и изменяют конфигурацию аудиопотока, содержащего закодированные данные заранее заданной группы. Аудиопоток с измененной конфигурацией подают на устройство 232 доставки. Далее, аудиопоток с измененной конфигурацией доставляют (передают) на устройство 300, соединенное с внутренней сетью, из интерфейса 232 доставки.

Соединение с внутренней сетью содержит Ethernet соединение и беспроводное соединение, такое как «WiFi» и «Bluetooth». Здесь «WiFi» и «Bluetooth» являются зарегистрированными торговыми марками.

Далее, устройство 300 содержит динамик объемного звучания, второй дисплей, устройство вывода аудио, прикрепленное к сетевому конечному устройству. Устройство 300, принимающее доставку аудиопотока с измененной конфигурацией, осуществляет процесс декодирования, аналогичный процессу для устройства 213 декодирования 3D аудио в устройстве 200 приема службы с фиг. 18, и получает аудиоданные для приведения в действие заранее заданного количества динамиков.

Далее, устройство приема службы может обладать конфигурацией, при которой описанный выше аудиопоток с измененной конфигурацией передают на устройство, соединенное с помощью цифрового интерфейса, такого как «Мультимедийный интерфейс (HDMI) высокой четкости», «Мобильный канал (MHL) высокой четкости», стандарт «DisplayPort» или подобного. Здесь, «HDMI» и «MHL» являются зарегистрированными торговыми марками.

Далее, в описанном выше варианте осуществления изобретения приведен пример, в котором предусмотрено поле «attribute» и передают информацию об атрибутах для закодированных данных каждой группы (смотри фиг. 11 - 13). Тем не менее, настоящая технология включает в себя способ, в котором определяют конкретное значение ID (GroupID) группы между устройствами передачи и устройствами приема, так что тип (атрибут) закодированных данных можно распознать путем распознавания конкретного ID группы. В этом случае ID группы служит в качестве информации об атрибутах для закодированных данных группы помимо идентификатора группы и поле «attribute» не требуется.

Далее, в описанных выше вариантах осуществления изобретения приведен пример, в котором закодированные данные каналов и закодированные данные объектов содержатся в закодированных данных нескольких групп (смотри фиг. 5). Тем не менее, настоящая технология может быть аналогично применена в случае, в котором закодированные данные нескольких групп содержат только закодированные данные каналов или содержат только закодированные данные объектов.

Настоящая технология может обладать следующими конфигурациями.

(1) Устройство передачи, которое содержит:

блок передачи, выполненный с возможностью передачи метафайла, содержащего метаинформацию, используемую для получения, в устройстве приема, заранее заданного количества аудиопотоков, содержащих несколько групп закодированных данных; и

блок вставки информации, выполненный с возможностью вставки в метафайл информации об атрибутах, которая указывает каждый атрибут закодированных данных для нескольких групп.

(2) Устройство передачи по (1), в котором блок вставки информации вставляет в метафайл информацию об отношении соответствия потоку, которая указывает аудиопоток, в котором содержатся, соответственно, закодированные данные нескольких групп.

(3) Устройство передачи по (2), в котором информация об отношении соответствия потоку является информацией, указывающей отношение соответствия между идентификаторами групп, которые, соответственно, идентифицируют каждый элемент закодированных данных нескольких групп, и идентификаторами, которые, соответственно, идентифицируют каждый поток из заранее заданного количества аудиопотоков.

(4) Устройство передачи по любому из (1) - (3), в котором метафайл представляет собой файл MPD.

(5) Устройство передачи по (4), в котором блок вставки информации вставляет информацию об атрибутах в метафайл с использованием «дополнительного дескриптора».

(6) Устройство передачи по любому из (1) - (5), в котором блок передачи передает метафайл по RF каналу передачи или по каналу передачи через сеть связи.

(7) Устройство передачи по любому из (1) - (6), в котором блок передачи передает контейнер в заранее заданном формате с заранее заданным количеством аудиопотоков, содержащих закодированные данные нескольких групп.

(8) Устройство передачи по (7), в котором контейнер представляет собой MP4.

(9) Устройство передачи по любому из (1) - (8), в котором закодированные данные нескольких групп содержат или закодированные данные каналов или закодированные данные объектов или и те, и другие данные.

(10) Способ передачи, включающий в себя:

этап передачи, заключающийся в передаче, с помощью блока передачи, метафайла, содержащего метаинформацию, используемую для получения, в устройстве приема, заранее заданного количества аудиопотоков, содержащих несколько групп закодированных данных; и

этап вставки информации, заключающийся во вставке в метафайл информации об атрибутах, указывающей каждый атрибут закодированных данных для нескольких групп.

(11) Устройство приема, содержащее:

блок приема, выполненный с возможностью приема метафайла, содержащего метаинформацию, используемую для получения, в устройстве приема, заранее заданного количества аудиопотоков, содержащих несколько групп закодированных данных,

при этом метафайл содержит вставленную информацию об атрибутах, указывающую каждый атрибут закодированных данных для нескольких групп; и

блок обработки, выполненный с возможностью обработки заданного количества аудиопотоков на основе информации об атрибутах.

(12) Устройство приема по (11),

в котором

в метафайл дополнительно вставляют информацию об отношении соответствия потоку, указывающую аудиопоток, в котором, соответственно, содержатся закодированные данные нескольких групп, и

блок обработки обрабатывает заранее заданное количество аудиопотоков, на основе информации об отношении соответствия потоку, а также информации об атрибутах.

(13) Устройство приема по (12), в котором блок обработки по выбору осуществляет процесс декодирования аудиопотока, содержащего закодированные данные группы, включающей в себя атрибут, совместимый с конфигурацией динамиков и информацией о выборе пользователя, что делают на основе информации об атрибутах и информации об отношении соответствия потоку.

(14) Устройство приема по любому из (11) - (13), в котором закодированные данные нескольких групп содержат или закодированные данные каналов или закодированные данные объектов или и те, и другие данные.

(15) Способ приема, включающий в себя:

этап приема, заключающийся в приеме, с помощью блока приема, метафайла, содержащего метаинформацию, используемую для получения, в устройстве приема, заранее заданного количества аудиопотоков, содержащих несколько групп закодированных данных,

при этом метафайл содержит вставленную информацию об атрибутах, указывающую каждый атрибут закодированных данных для нескольких групп; и

этап обработки, заключающийся в обработке заданного количества аудиопотоков на основе информации об атрибутах.

(16) Устройство приема, содержащее:

блок приема, выполненный с возможностью приема метафайла, содержащего метаинформацию, используемую для получения, в устройстве приема, заранее заданного количества аудиопотоков, содержащих несколько групп закодированных данных,

при этом метафайл содержит вставленную информацию об атрибутах, указывающую каждый атрибут закодированных данных для нескольких групп;

блок обработки, выполненный с возможностью получения по выбору закодированных данных заранее заданной группы из заранее заданного количества аудиопотоков на основе информации об атрибутах, и изменения конфигурации аудиопотока, содержащего закодированные данные заранее заданной группы; и

блок передачи потока, выполненный с возможностью передачи на внешнее устройство аудиопотока с измененной конфигурацией.

(17) Устройство приема по (16), в котором

в метафайл дополнительно вставляют информацию об отношении соответствия потоку, указывающую аудиопоток, в котором, соответственно, содержатся закодированные данные нескольких групп, и

блок обработки по выбору получает закодированные данные заранее заданной группы из заранее заданного количества аудиопотоков, на основе информации об отношении соответствия потоку, а также информации об атрибутах.

(18) Способ приема, включающий в себя:

этап приема, заключающийся в приеме, с помощью блока приема, метафайла, содержащего метаинформацию, используемую для получения, в устройстве приема, заранее заданного количества аудиопотоков, содержащих несколько групп закодированных данных,

при этом метафайл содержит вставленную информацию об атрибутах, указывающую каждый атрибут закодированных данных для нескольких групп;

этап обработки, заключающийся в получении по выбору закодированных данных заранее заданной группы из заранее заданного количества аудиопотоков на основе информации об атрибутах, и в изменении конфигурации аудиопотока, содержащего закодированные данные заранее заданной группы; и

этап передачи потока, заключающийся в передаче на внешнее устройство аудиопотока с измененной конфигурацией.

Основные характеристики настоящей технологии могут уменьшить нагрузку по обработке на приемной стороне с помощью вставки в файл MPD информации об атрибутах, которая указывает соответствующие атрибуты закодированных данных нескольких групп, содержащихся в заранее заданном количестве аудиопотоков, и информации об отношении соответствия потоку, которая указывает аудиодорожку (аудиопоток), содержащую, соответственно, закодированные данные нескольких групп (смотри фиг. 11, 12 и 17).

Список ссылочных позиций

10 Система приемо-передачи

30A, 30B Система доставки потока на основе MPEG-DASH

31 Файловый сервер потока DASH

32 Сервер DASH MPD

33, 33-1 - 33-N Устройство приема службы

34 CDN

35, 35-1 - 35-N Устройство приема службы

36 Система передачи вещания

100 Система передачи службы

110 Блок выработки DASH/MP4

112 Устройство кодирования видео

113 Устройство кодирования аудио

114 Устройство форматирования DASH/MP4

200 Устройство приема службы

201 Блок приема

202 Блок анализа DASH/MP4

203 Устройство декодирования видео

204 Схема обработки изображений

205 Схема привода панели

206 Панель отображения

211-1 - 211-N Буфер контейнеров

212 Устройство объединения

213 Устройство декодирования 3D аудио

214 Схема обработки вывода аудио

215 Система динамиков

221 CPU

222 Флеш-ROM

223 DRAM

224 Внутренняя шина

225 Блок приема для дистанционного управления

226 Устройство передачи для дистанционного управления

231 Блок изменения конфигурации потока

232 Интерфейс доставки

300 Устройство

1. Устройство передачи метафайла, содержащее:

блок передачи, выполненный с возможностью передачи метафайла, содержащего метаинформацию, используемую для получения, в устройстве приема, заранее заданного количества аудиопотоков, содержащих несколько групп закодированных данных; и

блок вставки информации, выполненный с возможностью вставки в метафайл информации об атрибутах, которая указывает каждый атрибут закодированных данных для нескольких групп.

2. Устройство передачи метафайла по п. 1, в котором блок вставки информации вставляет в метафайл информацию об отношении соответствия потоку, которая указывает аудиопоток, в котором содержатся, соответственно, закодированные данные нескольких групп.

3. Устройство передачи метафайла по п. 2, в котором информация об отношении соответствия потоку является информацией, указывающей отношение соответствия между идентификаторами групп, которые, соответственно, идентифицируют каждый элемент закодированных данных нескольких групп, и идентификаторами, которые, соответственно, идентифицируют каждый поток из заранее заданного количества аудиопотоков.

4. Устройство передачи метафайла по п. 1, в котором метафайл представляет собой файл MPD.

5. Устройство передачи метафайла по п. 4, в котором блок вставки информации вставляет информацию об атрибутах в метафайл с использованием «дополнительного дескриптора».

6. Устройство передачи метафайла по п. 1, в котором блок передачи передает метафайл по RF каналу передачи или по каналу передачи через сеть связи.

7. Устройство передачи метафайла по п. 1, в котором блок передачи передает контейнер в заранее заданном формате с заранее заданным количеством аудиопотоков, содержащих закодированные данные нескольких групп.

8. Устройство передачи метафайла по п. 7, в котором контейнер представляет собой MP4.

9. Устройство передачи метафайла по п. 1, в котором закодированные данные нескольких групп содержат или закодированные данные каналов или закодированные данные объектов или и те, и другие данные.

10. Способ передачи метафайла, включающий в себя:

этап передачи, заключающийся в передаче, с помощью блока передачи, метафайла, содержащего метаинформацию, используемую для получения, в устройстве приема, заранее заданного количества аудиопотоков, содержащих несколько групп закодированных данных; и

этап вставки информации, заключающийся во вставке в метафайл информации об атрибутах, указывающей каждый атрибут закодированных данных для нескольких групп.

11. Устройство приема метафайла, содержащее:

блок приема, выполненный с возможностью приема метафайла, содержащего метаинформацию, используемую для получения, в устройстве приема, заранее заданного количества аудиопотоков, содержащих несколько групп закодированных данных,

при этом метафайл содержит вставленную информацию об атрибутах, указывающую каждый атрибут закодированных данных для нескольких групп; и

блок обработки, выполненный с возможностью обработки заданного количества аудиопотоков на основе информации об атрибутах.

12. Устройство приема метафайла по п. 11,

в котором

в метафайл дополнительно вставляют информацию об отношении соответствия потоку, указывающую аудиопоток, в котором, соответственно, содержатся закодированные данные нескольких групп, и

блок обработки обрабатывает заранее заданное количество аудиопотоков на основе информации об отношении соответствия потоку, а также информации об атрибутах.

13. Устройство приема метафайла по п. 12, в котором блок обработки по выбору осуществляет процесс декодирования аудиопотока, содержащего закодированные данные группы, включающей в себя атрибут, совместимый с конфигурацией динамиков и информацией о выборе пользователя, что делают на основе информации об атрибутах и информации об отношении соответствия потоку.

14. Устройство приема метафайла по п. 11, в котором закодированные данные нескольких групп содержат или закодированные данные каналов или закодированные данные объектов или и те, и другие данные.

15. Способ приема метафайла, включающий в себя:

этап приема, заключающийся в приеме, с помощью блока приема, метафайла, содержащего метаинформацию, используемую для получения, в устройстве приема, заранее заданного количества аудиопотоков, содержащих несколько групп закодированных данных,

при этом метафайл содержит вставленную информацию об атрибутах, указывающую каждый атрибут закодированных данных для нескольких групп; и

этап обработки, заключающийся в обработке заданного количества аудиопотоков на основе информации об атрибутах.

16. Устройство приема метафайла, содержащее:

блок приема, выполненный с возможностью приема метафайла, содержащего метаинформацию, используемую для получения, в устройстве приема, заранее заданного количества аудиопотоков, содержащих несколько групп закодированных данных,

при этом метафайл содержит вставленную информацию об атрибутах, указывающую каждый атрибут закодированных данных для нескольких групп;

блок обработки, выполненный с возможностью получения по выбору закодированных данных заранее заданной группы из заранее заданного количества аудиопотоков на основе информации об атрибутах и изменения конфигурации аудиопотока, содержащего закодированные данные заранее заданной группы; и

блок передачи потока, выполненный с возможностью передачи на внешнее устройство аудиопотока с измененной конфигурацией.

17. Устройство приема метафайла по п. 16, в котором

в метафайл дополнительно вставляют информацию об отношении соответствия потоку, указывающую аудиопоток, в котором, соответственно, содержатся закодированные данные нескольких групп, и

блок обработки по выбору получает закодированные данные заранее заданной группы из заранее заданного количества аудиопотоков, на основе информации об отношении соответствия потоку, а также информации об атрибутах.

18. Способ приема метафайла, включающий в себя:

этап приема, заключающийся в приеме, с помощью блока приема, метафайла, содержащего метаинформацию, используемую для получения, в устройстве приема, заранее заданного количества аудиопотоков, содержащих несколько групп закодированных данных,

при этом метафайл содержит вставленную информацию об атрибутах, указывающую каждый атрибут закодированных данных для нескольких групп;

этап обработки, заключающийся в получении по выбору закодированных данных заранее заданной группы из заранее заданного количества аудиопотоков на основе информации об атрибутах и в изменении конфигурации аудиопотока, содержащего закодированные данные заранее заданной группы; и

этап передачи потока, заключающийся в передаче на внешнее устройство аудиопотока с измененной конфигурацией.



 

Похожие патенты:

Изобретение относится к средствам для приема и передачи данных. Технический результат заключается в повышении эффективности приемопередачи аудиоданных.

Изобретение относится к высокочастотной реконструкции (HFR), усиленной перекрестными произведениями, где новая составляющая с частотой QΩ+rΩ0 генерируется на основе существующих составляющих с частотами Ω и Ω+Ω0.

Изобретение относится к кодированию и декодированию аудиосигнала. Технический результат – улучшение реконструкции высокочастотных полос аудиосигнала.

Изобретение относится к средствам для кодирования и декодирования многоканального сигнала. Технический результат заключается в повышении эффективности кодирования.

Изобретение относится к средствам кодирования и декодирования аудио. Технический результат заключается в повышении эффективности кодирования и декодирования аудио.

Изобретение относится к средствам стереофонического кодирования и декодирования аудиосигналов. Технический результат заключается в повышении эффективности использования полосы частот.

Изобретение относится к средствам для кодирования аудиосигналов. Технический результат заключается в повышении эффективности кодирования аудио.

Изобретение относится к средствам для кодирования аудиосигналов. Технический результат заключается в повышении эффективности кодирования аудио.

Изобретение относится к средствам для обработки сигналов. Технический результат заключается в повышении эффективности кодирования и декодирования сигналов.

Изобретение относится к средствам для расширения диапазона частот для акустических сигналов. Технический результат заключается в повышении эффективности расширения диапазона частот входных сигналов для повышения качества аудио.

Изобретение относится к обработке аудиосигнала. Технический результат - уменьшение разрыва аудио при восстановлении пакета в начальной точке аудио.

Изобретение относится к средствам для кодирования и декодирования аудио. Технический результат заключается в сокращении количества кодируемых битов, которые должны быть распределены для кодирования спектра расширенной полосы, наряду с предотвращением ухудшения качества звука в расширенной полосе.

Изобретение относится к технике связи и предназначено для обработки данных при передаче множественных видов элементов аудиоданных. Технический результат – уменьшение нагрузки по обработке данных на приеме при передаче множественных видов элементов аудиоданных.

Изобретение относится к средствам для кодирования аудио. Технический результат заключается в повышении эффективности усиления диалога в аудиосистемах.

Изобретение относится к средствам для приема и передачи данных. Технический результат заключается в повышении эффективности приемопередачи аудиоданных.

Изобретение относится к области вычислительной техники для цифровой обработки звуковой фонограммы. Технический результат заключается в повышении скорости обработки цифровой фонограммы с записью речи.

Изобретение относится к области вычислительной техники. Технический результат заключается в повышении эффективности получения предварительно заданного типа аудиоданных из числа множества типов аудиоданных.

Изобретение относится к средствам для приема и передачи аудиоданных. Технический результат заключается в повышении эффективности обработки на приемной стороне при передаче аудиоданных нескольких типов.

Изобретение относится к обработке аудиосигналов, в частности, к способу воспроизведения многоканального аудиосигнала, включающего в себя звуковой сигнал с возвышением в окружении с горизонтальной схемой расположения, тем самым получая параметр рендеринга в соответствии с типом рендеринга и конфигурируя матрицу понижающего микширования.

Изобретение относится к средствам стереофонического кодирования на основе MDCT с комплексным предсказанием. Технический результат заключается в повышении эффективности стереофонического кодирования при передаче данных с высокой битовой скоростью.
Наверх