Способ и система поиска принадлежности ip-адреса территориальному кластеру на основе данных транзакций



Способ и система поиска принадлежности ip-адреса территориальному кластеру на основе данных транзакций
Способ и система поиска принадлежности ip-адреса территориальному кластеру на основе данных транзакций
Способ и система поиска принадлежности ip-адреса территориальному кластеру на основе данных транзакций
Способ и система поиска принадлежности ip-адреса территориальному кластеру на основе данных транзакций
Способ и система поиска принадлежности ip-адреса территориальному кластеру на основе данных транзакций
Способ и система поиска принадлежности ip-адреса территориальному кластеру на основе данных транзакций
Способ и система поиска принадлежности ip-адреса территориальному кластеру на основе данных транзакций
Способ и система поиска принадлежности ip-адреса территориальному кластеру на основе данных транзакций

Владельцы патента RU 2713761:

Публичное акционерное общество "Сбербанк России" (ПАО Сбербанк) (RU)

Изобретение относится к области вычислительной техники для обработки данных. Технический результат заключается в обеспечении определения местоположения участников транзакции с помощью используемых IP-адресов при их отнесении к заданному территориальному кластеру. Технический результат достигается за счет получения данных о транзакциях пользователей, содержащих IP-адреса отправителей и получателей транзакций; выполнения ранжирования частоты использования IP-адресов и количества транзакций между упомянутыми IP-адресами; формирования графа на основании данных ранжирования, в котором вершинами являются IP-адреса, а ребрами - количество переводов за определенный период времени между отправителями и получателями, использующими соответствующие IP-адреса; осуществления построения территориальных кластеров на основании сформированного графа, причем каждый кластер содержит несколько IP-адресов; получения транзакционной информации пользователя, содержащей по меньшей мере IP-адрес; осуществления поиска полученного IP-адреса в территориальном кластере и, в случае нахождения IP-адреса, присвоения пользователю соответствующего территориального кластера. 2 н. и 3 з.п. ф-лы, 5 ил.

 

ОБЛАСТЬ ТЕХНИКИ

[0001] Заявленное решение относится, в общем, к области обработки данных, а в частности к способу и системе поиска принадлежности IP-адресов территориальным кластерам на основе транзакционных данных.

УРОВЕНЬ ТЕХНИКИ

[0002] Все большая доля транзакций проводятся клиентами в удаленных каналах обслуживания, в которых единственным параметром, позволяющим определить фактическое расположение клиента, является IP-адрес. На текущий момент существуют справочники, которые сопоставляют конкретный IP-адрес с городом. Такие справочники не позволяют полноценно решать задачи, где необходимо понимать территориальное расположение клиента. Например, для случая противодействия мошенничеству, когда необходимо определение территориальной близости между двумя близкими по времени клиентскими сессиями в удаленном канале обслуживания, выполненными с различными IP-адресами. Основной причиной является то, что справочники устаревают, также IP-адреса могут переходить к другим провайдерам, принцип написания наименования населенных пунктов тоже не является формализованным в привязке к IP-адресам (один и тот же город зачастую имеет несколько написаний), точность для IP-адресов сотовых операторов крайне низкая.

[0003] Для целей анализа мошеннических действий при осуществлении транзакций существующие методы основываются на анализе удаленности пользователей от места выполнения транзакции, например, POS-терминалов, банкоматов и т.п. Для целей идентификации местонахождения участника транзакции может использоваться геолокация пользовательских устройств для выполнения транзакции, например, мобильных телефонов.

[0004] Такие решения, например, раскрываются в следующих патентных документах: US 20120215701 A1 (Playspan Inc., 23.08.2012), US 20190043054 A1 (Capital One Services LLC, 07.02.2019), US 20120209773 A1 (PayPal Inc., 16.08.2012).

[0005] Общим недостатком известных решений является необходимость использования уточняющих данных, характеризующих конкретные точки выполнения транзакций, в частности, известные решения основываются исключительно на использовании гео-позиции пользователя и средств выполнения транзакций для анализа точек предположительного местоположения, что не позволяет получить сегментированную информацию о территориальной принадлежности клиента тому или иному кластеру, соответствующему наиболее часто используемым IP-адресам, что позволит более быстро определить местоположение пользователя.

РАСКРЫТИЕ ИЗОБРЕТЕНИЯ

[0006] Решаемой технической проблемой или технической задачей с помощью заявленного изобретения является формирование кластеров, указывающих территориальную принадлежность IP-адресов.

[0007] Технический результат заключается в обеспечении определения местоположения участников транзакции с помощью используемых IP-адресов при их отнесении к заданному территориальному кластеру.

[0008] Дополнительным техническим результатом является повышение скорости определения метаположения пользователя за счет сформированных кластеров, соответствующих территориальному распределению IP-адресов.

[0009] Заявленный результат достигается за счет компьютерно-реализуемого способа поиска принадлежности IP-адреса территориальному кластеру на основе данных транзакций, который выполняется с помощью процессора и содержит этапы, на которых:

- получают данные о транзакциях пользователей, содержащие IP-адреса отправителей и получателей транзакций;

- выполняют ранжирование частоты использования IP-адресов и количества транзакций между упомянутыми IP-адресами;

- формируют граф на основании данных ранжирования, в котором вершинами являются IP-адреса, а ребрами - количество переводов за определенный период времени между отправителями и получателями, использующими соответствующие IP-адреса;

- осуществляют построение территориальных кластеров на основании сформированного графа, причем каждый кластер содержит несколько IP-адресов;

- получают транзакционную информацию пользователя, содержащую по меньшей мере IP-адрес;

- осуществляют поиск полученного IP-адреса в территориальном кластере и в случае нахождения IP-адреса присваивают пользователю соответствующий территориальный кластер.

[0010] В одном из частных вариантов осуществления способа данные о транзакциях получают от устройств выполнения транзакций.

[0011] В другом частном варианте осуществления способа устройства представляют собой: мобильные устройства, банкоматы, POS-терминалы или их сочетания.

[0012] В другом частном варианте осуществления способа данные о транзакциях дополнительно содержат гео-координаты пользователя.

[0013] Заявленное решение также реализуется за счет компьютерной системы, содержащей по меньшей мере один процессор и память, хранящую исполняемые процессором инструкции для реализации вышеуказанного способа.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0014] Признаки и преимущества настоящего технического решения станут очевидными из приводимого ниже подробного описания изобретения и прилагаемых чертежей, на которых:

[0015] Фиг. 1 иллюстрирует блок-схему выполнения заявленного способа.

[0016] Фиг. 2 иллюстрирует пример построения графа на основании IP-адресов.

[0017] Фиг. 3 - Фиг. 4 иллюстрируют примеры сформированных кластеров.

[0018] Фиг. 5 иллюстрирует пример вычислительного устройства.

ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ

[0019] На Фиг. 1 представлен процесс выполнения заявленного способа (100) поиска принадлежности IP-адреса территориальному кластеру. На первом шаге (101) осуществляется сбор данных о транзакциях, которые могут включать в себя историю трат, историю входов в интернет-банк, устройства клиента, финансовое поведение клиента, остатки на счетах и т.д. Данные транзакций пользователя содержат IP-адреса пользователей в формате ХХХ.ХХХ.ХХХ.ХХХ, участвующих в переводах денежных средств, в частности р2р транзакции (англ. Payer-to-payer). Данные транзакций, как правило, поступают от устройств осуществления транзакций, например, банкоматов, POS-терминалов, мобильных устройств пользователей с установленным приложением для выполнения транзакций и т.п.

[0020] По собранным данным транзакций, отбираются переводы между пользователями (р2р транзакции). Для каждого клиента определяется его IP-адрес класса С (ХХХ.ХХХ.ХХХ), с которого он осуществлял вход в канал выполнения транзакций, например, мобильное приложение Сбербанк Онлайн или использование банкомата наибольшее число раз. Далее на этапе (102) в каждой транзакции клиент-отправитель платежа и клиент-получатель платежа сопоставляются с IP-адресом класса С, полученным ранее. Затем все транзакции агрегируются по уникальной паре IP-адрес отправителя и IP-адрес получателя, а также подсчитывается число транзакций по этой паре. Пример статистики представлен в Таблице 1.

[0021]

[0022] На основе полученных данных по переводам между клиентами и их сессиям в удаленных каналах обслуживания (например, мобильное приложение, WEB-интерфейс) строится граф (этап 103), вершинами которого являются IP-адреса класса xxx.xxx.xxx, ребрами - количество переводов за определенный период времени между клиентами, использующими такие IP-адреса. Пример такого графа представлен на Фиг. 2. Граф ненаправленный. В случае, если между вершинами количество транзакций меньше заданного порога N (экспериментально N=40, если период 30 дней), то такое ребро исключается.

[0023] К построенному графу применяется алгоритм кластеризации (например, label propagation - https://en.wikipedia.org/wiki/Label_Propagation_Algorithm). Алгоритм кластеризации вершин графа позволяет отнести IP-адрес к определенному кластеру. Такая группировка позволяет выявлять IP-адреса, используемые клиентами, имеющими социальные и финансовые связи между собой (осуществление транзакций, обмен сообщениями посредством сети Интернет и т.п.). Алгоритм построения графа может быть реализован на основе алгоритма, раскрытого в статье «Community Detection via Semi-Synchronous Label Propagation Algorithms» (arXiv:1103.4450vl, 23.03.2011). Работа алгоритма основывается на ранжировании и отборе наибольших кластеров, их которых выбирается заданное число кластеров (например, 11 кластеров, что является оптимальных в ходе проведенных экспериментов), оставшиеся кластеры объединяются в один. На основании кластеризации графа формируются территориальные кластеры (104), которые позволяют на основе данных об использовании клиентами средств выполнения транзакций (банкоматов, POS-терминалов, мобильного приложения, посещения офисов банка и др.) определить фактическое местоположение клиента в определенный временной период. Результатом данного алгоритма является многоугольник, заданный гео-координатами на поверхности земли с плотностью распределения точек активности клиента.

[0024] Границы многоугольника могут определяться методом, схожим с картографированием ареала живых организмов (контурный метод), при котором на карту наносятся линейные границы ареала, с формированием контурной линии всей территории, в пределах которой можно встретить клиента, проявившего транзакционную активность. Дополнительно определяется центр многоугольника (медиана значений координат точек, входящих в многоугольник) и, в случае нахождения выброса в данных (координата, выделяющаяся от общей выборки по клиенту и определяемая «правилом трех сигм»), многоугольник перестраивается заново без точек-выбросов.

[0025] Данный подход позволяет каждого клиента, участвующего в кластеризации, отнести к определенному кластеру следующим способом:

• найти его самый часто используемый IP-адрес класса С (ХХХ.ХХХ.ХХХ);

• найти, к какому кластеру относится этот IP-адрес;

• присвоить клиенту выявленный кластер.

[0026] Алгоритм сопоставления гео-позиционирования клиента с IP-адресами клиентских сессий - используются для составления базы данных, с помощью которой можно определить территориальный кластер IP-адреса. Территориальный кластер представляет собой многоугольник, заданный гео-координатами на поверхности земли, построенный на основе данных клиентов, использующих IP-адрес с вычисленным кластером и по которым известны точные гео-кординаты местонахождения (например, при посещении офиса банка) (105). При получении информации по текущим сессиям клиентов, осуществляющих транзакции, в частности данным использующихся IP-адресов при использовании устройств осуществления транзакций, выполняется сравнение полученного IP-адреса со сформированными территориальными кластерами, и при выявлении соответствующего IP-адреса в том или ином кластере клиенту присваивается территориальное месторасположение в рамках заданного кластера.

[0027] Определение наиболее часто используемого IP-адреса клиентом может выполняться с помощью анализа его транзакционной активности за заданный промежуток времени, например, день, неделя, месяц и т.п. Дополнительно в процессе кластеризации IP-адресов клиентов могут использоваться личные идентификаторы клиентов, например, данные паспорта, идентифицирующие территориальную регистрацию клиентов.

[0028] Примеры сформированных кластеров представлены на Фиг. 3 - Фиг. 4. Для валидации полученных результатов работы алгоритма (100) было отобрано по 10000 клиентов из каждого кластера, по каждому клиенту была вычислена его средняя точка обитания (по использованию банкоматов и POS-терминалов). Точки нанесены на географическую карту и разбиты по сформированным кластерам.

[0029] На основании полученной информации по кластерам была оценена бизнес-метрика, в ходе которой были отобраны данные транзакций между клиентами, по которым поступала информация по подозрению в осуществлении мошеннических действий (фрод) от системы фрод-мониторинга. За заданный период времени было получено 86 519 срабатываний. Уникальное количество клиентов, участвующих в этих транзакциях (отправитель и получатель) - 142847. По 118536 (83%) клиентам был сформирован кластер.

[0030] Если из транзакционных переводов исключить транзакции, по которым у отправителя и получателя нет кластера либо он «0» (объединение малых кластеров), то для оценки остается 50199 транзакций (58%). Если ввести признак «равенство кластера отправителя и получателя», то распределение: перевод в разрезе легитимных ("G") и мошеннических ("F") транзакций будет выглядеть, как представлено в Таблице 2.

[0031] Созданный способ (100) кластеризации клиентов инструмент позволяет по истории входов в интернет-банк (IP-адреса) разделить клиентов по принадлежности к географической общности, не используя знания об их гео-координтах. На сегодняшний момент многие клиенты пользуются только мобильным приложением интернет-банка (узнают остатки денежных средств, осуществляют переводы и т.д.). Есть также клиенты, использующие и мобильное приложение и банкоматную сеть (внос/снятие наличных, подключение мобильного банка и т.д.). При использовании банкомата можно определить, в каком месте находился клиент, получая услугу. Составленный алгоритм позволяет использовать знания о поведении клиентов, использующих как банкоматы, так и мобильное приложение, при обогащении профилей клиентов, не оставляющих географический след. Таким образом, реализуется возможность применимости моделей, в которых есть необходимость понимания фактического месторасположения клиента, на тех, кто пользуется только интернет-банком с отключенным модулем определения геолокации.

[0032] Результаты работы кластеризации могут использоваться в качестве дополнительного признака для повышения эффективности модели скоринга транзакции. При осуществлении легитимных транзакций клиенты чаще осуществляют переводы клиентам, которые находятся в одной географической местности с отправителем. При этом в мошеннических переводах чаще наблюдается паттерн поведения, в котором отправитель и получатель находятся на далеком расстоянии друг от друга: мошенникам не всегда известна локация жертвы и подобрать клиента получателя из того же региона, что и отправитель - затруднительно. При создании модели оценки перевода на возможное мошенничество признак одного географического местоположения отправителя и получателя оказывает сильное влияние на снижение ложных срабатываний антифрод системы.

[0033] На Фиг. 5 представлен пример общего вида вычислительной системы (200) на базе вычислительного устройства (200), которое обеспечивает реализацию заявленного способа (100). Устройство (200) может является частью компьютерной системы, например, сервером, обрабатывающим необходимые данные для осуществления способа (100).

[0034] В общем случае, вычислительное устройство (200) содержит объединенные общей шиной информационного обмена один или несколько процессоров (201), средства памяти, такие как ОЗУ (202) и ПЗУ (203), интерфейсы ввода/вывода (204), устройства ввода/вывода (205), и устройство для сетевого взаимодействия (206).

[0035] Процессор (201) (или несколько процессоров, многоядерный процессор) могут выбираться из ассортимента устройств, широко применяемых в текущее время, например, компаний Intel™, AMD™, Apple™, Samsung Exynos™, MediaTEK™, Qualcomm Snapdragon™ и т.п. Под процессором также необходимо учитывать графический процессор, например, GPU NVIDIA или ATI, который также является пригодным для полного или частичного выполнения способа (100). При этом, средством памяти может выступать доступный объем памяти графической карты или графического процессора.

[0036] ОЗУ (202) представляет собой оперативную память и предназначено для хранения исполняемых процессором (201) машиночитаемых инструкций для выполнение необходимых операций по логической обработке данных. ОЗУ (202), как правило, содержит исполняемые инструкции операционной системы и соответствующих программных компонент (приложения, программные модули и т.п.).

[0037] ПЗУ (203) представляет собой одно или более устройств постоянного хранения данных, например, жесткий диск (HDD), твердотельный накопитель данных (SSD), флэш-память (EEPROM, NAND и т.п.), оптические носители информации (CD-R/RW, DVD-R/RW, BlueRay Disc, MD) и др.

[0038] Для организации работы компонентов устройства (200) и организации работы внешних подключаемых устройств применяются различные виды интерфейсов В/В (204). Выбор соответствующих интерфейсов зависит от конкретного исполнения вычислительного устройства, которые могут представлять собой, не ограничиваясь: PCI, AGP, PS/2, IrDa, FireWire, LPT, COM, SAT A, IDE, Lightning, USB (2.0, 3.0, 3.1, micro, mini, type C), TRS/Audio jack (2.5, 3.5, 6.35), HDMI, DVI, VGA, Display Port, RJ45, RS232 и т.п.

[0039] Для обеспечения взаимодействия пользователя с вычислительным устройством (200) применяются различные средства (205) В/В информации, например, клавиатура, дисплей (монитор), сенсорный дисплей, тач-пад, джойстик, манипулятор мышь, световое перо, стилус, сенсорная панель, трекбол, динамики, микрофон, средства дополненной реальности, оптические сенсоры, планшет, световые индикаторы, проектор, камера, средства биометрической идентификации (сканер сетчатки глаза, сканер отпечатков пальцев, модуль распознавания голоса) и т.п.

[0040] Средство сетевого взаимодействия (206) обеспечивает передачу данных устройством (200) посредством внутренней или внешней вычислительной сети, например, Интранет, Интернет, ЛВС и т.п. В качестве одного или более средств (206) может использоваться, но не ограничиваться: Ethernet карта, GSM модем, GPRS модем, LTE модем, 5G модем, модуль спутниковой связи, NFC модуль, Bluetooth и/или BLE модуль, Wi-Fi модуль и др.

[0041] Дополнительно могут применяться также средства спутниковой навигации в составе устройства (200), например, GPS, ГЛОНАСС, BeiDou, Galileo.

[0042] Представленные материалы заявки раскрывают предпочтительные примеры реализации технического решения и не должны трактоваться как ограничивающие иные, частные примеры его воплощения, не выходящие за пределы испрашиваемой правовой охраны, которые являются очевидными для специалистов соответствующей области техники.

1. Компьютерно-реализуемый способ поиска принадлежности IP-адреса территориальному кластеру на основе данных транзакций, выполняемый с помощью процессора и содержащий этапы, на которых:

• получают данные о транзакциях пользователей, содержащие IP-адреса отправителей и получателей транзакций;

• выполняют ранжирование частоты использования IP-адресов и количества транзакций между упомянутыми IP-адресами;

• формируют граф на основании данных ранжирования, в котором вершинами являются IP-адреса, а ребрами - количество транзакций за определенный период времени между отправителями и получателями, использующими соответствующие IP-адреса;

• осуществляют построение территориальных кластеров на основании сформированного графа, причем каждый кластер содержит несколько IP-адресов;

• получают транзакционную информацию пользователя, содержащую по меньшей мере IP-адрес;

• осуществляют поиск полученного IP-адреса в территориальном кластере и в случае нахождения IP-адреса присваивают пользователю соответствующий территориальный кластер.

2. Способ по п. 1, характеризующийся тем, что данные о транзакциях получают от устройств выполнения транзакций.

3. Способ по п. 2, характеризующийся тем, что устройства представляют собой: мобильные устройства, банкоматы, POS-терминалы или их сочетания.

4. Способ по п. 2, характеризующийся тем, что данные о транзакциях дополнительно содержат геокоординаты пользователя.

5. Система поиска принадлежности IP-адреса территориальному кластеру на основе данных транзакций, содержащая по меньшей мере один процессор и память, содержащую машиночитаемые инструкции, которые при их выполнении с помощью процессора реализуют способ по пп. 1-4.



 

Похожие патенты:

Изобретение относится к мобильной связи. Мобильное устройство (10) для мониторинга пациента содержит радиосистему (14), которая имеет пороговое значение для сканирования и пороговое значение для перехода, которое ниже порогового значения для сканирования или равно ему.

Изобретение относится к устройству экстренного оповещения в случае экстренной ситуации с транспортным средством. Техническим результатом является обеспечение возможности голосового разговора с центром экстренного оповещения, даже если использование микрофона или динамика в транспортном средстве отключается вследствие поломки или неисправности.

Изобретение относится к области радиосвязи. Техническим результатом является повышение точности определения местоположения.

Изобретение относится к области связи. Обеспечены системы и способы для управления мощностью физического канала в системе связи.

Изобретение относится к радиосвязи. Технический результат заключается в обеспечении системы связи, способной передавать и принимать данные через базовую сеть для терминала связи, поддерживающего двойную возможность подключения с Новым Радио.

Группа изобретений относится к области беспроводных систем связи реального времени. Технический результат заключается в повышении точности синхронизации.

Изобретение относится к области реализации мобильности, выполняемой посредством объекта управления. Технический результат изобретения заключается в возможности узлу политики увеличивать разрешенную область и уменьшать неразрешенную область, не оказывая влияния на подписку конечного пользователя.

Изобретение относится к области устанавливания беспроводного соединения между устройствами. Техническим результатом является сокращение времени повторного состыковывания устройств и ускорение захвата текущей ситуации при уменьшении усилий для инициализации сеанса состыковывания.

Изобретение относится к архитектуре межсетевого шлюза, которая позволяет осуществлять развертывание беспроводных сенсорных сетей в большом масштабе, и к взаимному соединению таких сетей с другими сетями.

Изобретение относится к способу работы абонентского терминала (UE) миллиметрового диапазона длин волн (мм-диапазона). Технический результат заключается в обеспечении формирования облачных ячеек с терминалом UE мм-диапазона в центре для улучшения работы в мм-диапазоне в динамически изменяющейся среде.

Изобретение относится к области связи. Технический результат - эффективное управление связью, чтобы сбалансировать факторы мощности и надежности, и эффективная передача сообщения к некоторым предпочтительным сетям на основе анализа заголовков пакетов Интернет-протокола версии 6 (IPv6).

Группа изобретений относится к системам, управляемым вычислительными устройствами. Масштабируемая система бытовой автоматизации для мониторинга, управления и контроля санитарной установки и элементов, которые содержит санитарная установка, подключаемыми устройствами, которые поддерживают связь друг с другом по сети системы.

Изобретение относится к обработке информации об аварийных сигналах. Технический результат – снижение затрат на эксплуатацию и техническое обслуживание в сети, осуществляющей указанную обработку.

Изобретение относится к вычислительной технике. Технический результат заключается в обеспечении возможности выдачи предупреждений для ситуаций, в которых может возникнуть неисправность.

Изобретение относится к подаче питания одному или более устройствам. Технический результат заключается в расширении арсенала средств.

Изобретение относится к способу передачи данных по асинхронным сетям связи. Техническим результатом является обеспечение гарантированной передачи исходных данных по асинхронным сетям связи с низкоскоростными каналами связи и/или низким качеством соединения каналов связи.

Изобретение относится к технологиям сетевой связи. Технический результат заключается в повышении эффективности сетевого оборудования по обработке сетевых пакетов в соответствии с заданной конфигурацией, который достигается за счет реализации способа организации взаимодействия компонентов сетевого оборудования.

Изобретение относится к дата-центру и может быть использовано для анализа и сброса ненормального состояния стоек, применяемых в дата-центре. Технический результат – автоматическое выполнение процедуры удаленного аварийного восстановления ВМС в стойке для сброса ненормального состояния ВМС из удаленного пункта.

Изобретение относится к области телекоммуникационных сетей связи, в частности к способам передачи данных по различным типам линий связи. Техническим результатом является уменьшение вероятности потерь переданных данных на стороне приема.

Изобретение относится к системе и способу передачи данных с транспортного средства в пункт дистанционного управления. Множество потоков данных принимаются от транспортного средства, по меньшей мере один из которых включает в себя мультимедийные данные.

Группа изобретений относится к области вычислительной техники. Технический результат - повышение качества анализа транзакций, выполненных в банковских приложениях, запущенных в эмулируемой операционной системе.
Наверх