Способ определения предпочтений медиапользователей
Владельцы патента RU 2704484:
Ершов Дмитрий Евгеньевич (RU)
Мальцев Кирилл Владимирович (RU)
Черноталов Антон Павлович (RU)
Изобретение относится к сетевым технологиям, используемым для определения аудио- и видеоконтента, относящегося, в том числе, к отложенному медиапотреблению. Техническим результатом является более высокая точность определения медиапотребления, распознавание отложенного телесмотрения и радиослушания, снижение доли нераспознанного аудио- или видеоконтента , а также сокращение временных и технических издержек на распознавание медиаконтента. Предложен способ определения предпочтений медиапользователей, заключающийся в получении информации от множества зарегистрированных медиапользователей информации о прослушанном или просмотренном аудио- или видеоконтенте, распознавании, на основе временного параметра, полученной от медиапользователей информации в базе данных транслировавшегося аудио- или видеоконтента и формировании статистической информации о предпочтениях медиапользователей, в котором распознавание контента осуществляют сравнением сигнатур, полученных от медиапользователей, с сигнатурами, сформированными в процессе записи трансляции аудио- или видеоконтента, а в случае появления нераспознанного аудио- или видеоконтента проводят его распознавание путём последовательного сравнения со всем накопленным объемом базы данных транслировавшегося аудио- или видеоконтента с учетом степени близости совокупности К признаков сигнатур. Получение информации о прослушанном или просмотренном аудио- или видеоконтенте от множества зарегистрированных медиапользователей организуют посредством их мобильных устройств, выполненных с возможностью звукового распознавания аудио- или видеоконтента. 1 з.п. ф-лы, 2 ил.
Изобретение относится к сетевым технологиям, используемым для определения аудио- и видеоконтента, относящегося, в том числе, к отложенному медиапотреблению.
Актуальность изобретения обусловлена возрастающей долей отложенного медиапотребления, связанного с увеличением объема видео и аудио контента, потребляемого с помощью Интернета, общей диджитализацией медиа, появлением персональных средств и сред медиапотребления, внедрением новых коммуникационных стратегий; изменением в содержательной и форматной структуре медиаконтента и других факторов.
Очевидна тенденция дальнейшего увеличения доли медиапользователей (медиапотребителей), использующих для просмотра видеоконтента, включая телевизионные программы, средства, позволяющие осуществлять просмотр в более удобное для медиапотребителя время, отличное от основной вещательной сетки.
Существующие традиционные методы измерения медиапотребления ориентированы на исследование домашнего телесмотрения членами домохозяйства и не имеют возможности учитывать внедомашнее и отложенное телесмотрение, а также потребление видео-контента с помощью различных платформ.
Существующий в отечественной и мировой практике способ измерения телесмотрения использует специальные устройства – пиплметры (people meter), которые устанавливаются на все стационарные телевизоры домохозяйства, участвующего в исследовании. Фиксация телесмотрения осуществляется с помощью пульта управления.
Прибор автоматически фиксирует, какой канал смотрит каждый из членов семьи, когда и в течение какого времени происходит просмотр. Эта информация хранится в памяти пиплметра, затем передается в базу проекта и подвергается дальнейшей обработке. Пиплметры используют технологию Audio Matching System (AMS). Эта технология распознавания основана на сопоставлении специальных звуковых меток (сигнатур) из базы данных трансляций со звуковыми сигнатурами, полученными с ТВ-метров (См., например: «Audio matching system and method» CA2645793A1). Данный способ предназначен для анализа, в пределах каждого домохозяйства, видео-контента во время его непосредственной трансляции по телевизионным (ТВ) каналам и не позволяет фиксировать внедомашнее, отложенное потребление ТВ-контента, а также просмотр видео-контента с помощью различных платформ, предоставляющих такую возможность.
В качестве прототипа выбран способ сбора данных о медиапотреблении (US2015264430A1), который в дополнение к аналогичным вышеуказанным признакам характеризуется также тем, что базовое устройство (пиплметр) может быть сконфигурировано для захвата сигналов, излучаемых телевизором, таким образом, что прямое физическое соединение с телевизором не требуется.
Задачей настоящего изобретения являлось создание способа, обеспечивающего, в дополнение к известным технологиям, определение аудио- и видеоконтента, потребляемого медиапользователями в режиме «отложенного просмотра» или «отложенного прослушивания». Под отложенным медиапотреблением в контексте описания данного изобретения имеется в виду просмотр или прослушивание видео- и аудиоконтента, включая телевизионные и радио каналы, с помощью различных технических средств, позволяющих осуществлять просмотр контента вне основной вещательной сетки: в записи, с помощью Интернет-ресурсов и т.п.
Техническим результатом является устранение недостатков существующих способов распознавания медиаконтента, а именно более высокая точность определения медиапотребления, распознавание отложенного телесмотрения и радиослушания, снижение доли нераспознанного аудио- или видеоконтента (далее также – контент, медиаконтент) в структуре медиапотребления, а также сокращение временных и технических издержек на распознавание медиаконтента.
Указанная задача решается способом определения предпочтений медиапользователей, заключающимся в получении информации от множества зарегистрированных медиапользователей информации о прослушанном или просмотренном аудио- или видеоконтенте, распознавании, на основе временного параметра, полученной от медиапользователей информации в базе данных транслировавшегося аудио- или видеоконтента и формировании статистической информации о предпочтениях медиапользователей, в котором, согласно предложению, распознавание контента осуществляют сравнением сигнатур, полученных от медиапользователей с сигнатурами, сформированными в процессе записи трансляции аудио- или видеоконтента, а в случае появления нераспознанного аудио- или видеоконтента (не распознанного на основе временного параметра, в режиме реального времени) проводят его распознавание путём последовательного сравнения со всем накопленным объемом (массивом) базы данных транслировавшегося аудио- или видеоконтента с учетом степени близости совокупности К признаков сигнатур.
Заявляемый способ предусматривает выполнение следующих операций:
• Формирование базы данных сигнатур нераспознанного аудио- или видеоконтента .
• Формирование базы данных распознанного аудио- или видеоконтента (сигнатурами, сформированными в процессе записи трансляции аудио- или видеоконтента).
• Последовательное сравнение нераспознанных сигнатур с распознанными на основе близости совокупности признаков.
Формирование базы данных сигнатур нераспознанного медиаконтента осуществляется с помощью отдельной системы сбора информации о медиапотреблении от участников исследования (медиапользователей), которые используют специальное приложение на смартфоне.
Данное приложение с определенной частотой записывает с помощью встроенного микрофона акустические сигналы, формирует сигнатуры и отправляет их с помощью интернет-связи в специализированную систему распознавания контента.
Система распознавания контента осуществляет сравнение сигнатур, полученных от медиапользователей с сигнатурами, сформированными в процессе записи трансляции телевизионных каналов и радиостанций.
В случае установления сходства сигнатур, система фиксирует в статистической базе данных о медиапотреблении информацию о том, что конкретный медиапользователь в установленное время осуществлял телесмотрение или радиослушание определенного с помощью системы телевизионного канала или радиостанции.
В случае если система не определила сходство сигнатуры ни с одним из анализируемых телевизионных каналов и радиостанций, данная сигнатура фиксируется в специализированной базе данных (база данных нераспознанных сигнатур). Также в указанной базе данных фиксируются значения характеристик сигнатуры, используемые для дальнейшего сравнения с распознанным медиаконтентом. Параметры распознанного медиаконтента формируются с помощью существующих в открытом доступе официальных сеток вещания телеканалов и радиостанций.
Далее система сравнивает каждую сигнатуру нераспознанного контента с сигнатурами распознанного контента. Поскольку сравнение нераспознанного контента со всем объемом распознанного контента является процессом, требующим существенного объема временных и технических ресурсов, предлагается последовательное сравнение с учетом степени близости совокупности К признаков сигнатур. Такой подход позволяет оптимизировать временные затраты и технические ресурсы на процесс распознавания контента.
Заявляемый способ может быть реализован системой (совокупностью распределённых в пространстве устройств).
На фиг. 1 показаны элементы системы для реализации способа. Элемент 1 – это совокупность мобильных устройств медиапользователей, на которых установлено специальное приложение, позволяющее с определенной регулярностью записывать с помощью микрофона устройства аудио сигнал и преобразовывать его в сигнатуру. Далее, сигнатуры с помощью Интернет-связи отправляются на сервер, на котором формируется база данных сигнатур (элемент 3). Элемент 4 – устройство, позволяющее записывать сигнатуры трансляций ТВ-каналов и радиостанций (элемент 2). Элемент 5 – устройство, осуществляющее сравнение сигнатур с мобильных устройств с сигнатурами трансляций с учетом параметра времени записи. Элемент 8 – база данных нераспознанных сигнатур, для которых не было найдено совпадений ни с одним из транслируемых в соответствующий временной отрезок ТВ-каналов и радиостанций 2. Элемент 9 – база данных, содержащая информацию о телесмотрении и радиослушании медиапотребителей. Элемент 6 – устройство, осуществляющее кодировку сигнатур ТВ и радио трансляций, а именно: определение транслируемого контента и его параметров, на основе официально публикуемых сеток вещания. Элемент 7 – база данных сигнатур с описанием параметров контента. Элемент 10 – устройство, осуществляющее последовательное сравнение нераспознанных сигнатур с сигнатурами из базы данных распознанного контента. В случае нахождения совпадения, в базе данных статистики медиапотребления (элемент 9) осуществляется соответствующая запись.
Система функционирует следуя алгоритму, который состоит из следующей последовательности действий:
Формирование базы данных сигнатур 3 с мобильных устройств 1 медиапользователей.
Формирование базы данных 4 сигнатур трансляций ТВ-каналов и радиостанций.
Кодировка сигнатур (контента) трансляций ТВ-каналов и радиостанций 2 устройством 6 в соответствии с официальными сетками вещания и формирование базы данных 7 распознанного контента.
Формирование базы данных 9 статистики телесмотрения (медиапотребления) на основе сравнения сигнатур с мобильных устройств медиапользователей (база данных 3) с сигнатурами распознанного контента (база данных 7) по признаку совпадения времени телесмотрения (радиослушания) и трансляции.
Формирование базы данных 8 нераспознанных сигнатур (нераспознанного контента) на основе сравнения сигнатур с мобильных устройств медиапользователей (база данных 3) с сигнатурами распознанного контента (база данных 7) по признаку отсутствия совпадений телесмотрения (радиослушания) и трансляции в соответствующий временной отрезок.
Определение (распознавание) контента нераспознанных сигнатур (база данных 8) на основе последовательного сравнения с сигнатурами распознанного контента с учетом степени близости совокупности К признаков.
На фиг. 2 более подробно раскрыт алгоритм сопоставления нераспознанных сигнатур с сигнатурами распознанного контента.
Данный алгоритм состоит из следующих последовательных действий:
1. Сигнатуры из базы данных 8 нераспознанных сигнатур последовательно проходят фильтрацию по признаку схожести с медиа-контентом. Сигнатуры, которые по своим признакам не являются медиаконтентом удаляются из базы данных.
2. Далее определяются значения К признаков сигнатуры.
3. Сигнатуры из базы данных 7 распознанного контента фильтруются и ранжируются по степени близости совокупности К признаков.
4. Далее идет последовательное сравнение нераспознанной сигнатуры с сигнатурами распознанного контента с учетом степени близости совокупности К признаков.
5. В случае нахождения совпадений, в базе данных 9 статистики медиапотребления регистрируется соответствующая запись, в ином случае, процесс повторяется со следующей нераспознанной сигнатурой.
Реализация заявленного способа в тестовом режиме подтвердила достижение указанного технического результата.
1. Способ определения предпочтений медиапользователей, заключающийся в получении информации от множества зарегистрированных медиапользователей информации о прослушанном или просмотренном аудио- или видеоконтенте, распознавании, на основе временного параметра, полученной от медиапользователей информации в базе данных транслировавшегося аудио- или видеоконтента и формировании статистической информации о предпочтениях медиапользователей, отличающийся тем, что распознавание контента осуществляют сравнением сигнатур, полученных от медиапользователей, с сигнатурами, сформированными в процессе записи трансляции аудио- или видеоконтента, а в случае появления нераспознанного аудио- или видеоконтента проводят его распознавание путём последовательного сравнения со всем накопленным объемом базы данных транслировавшегося аудио- или видеоконтента с учетом степени близости совокупности К признаков сигнатур.
2. Способ по п. 1, отличающийся тем, что получение информации о прослушанном или просмотренном аудио- или видеоконтенте от множества зарегистрированных медиапользователей организуют посредством их мобильных устройств, выполненных с возможностью звукового распознавания аудио- или видеоконтента.