Россельхозбанк обзавелся собственным озером данных

«Инфосистемы Джет» совместно с Россельхозбанком (РСХБ) создала озеро данных (data lake) для консолидации и глубокого анализа клиентских данных. Проект реализован с применением концепции стратегического управления данными (data governance) и позволит банку уже в текущем году значительно улучшить финансовые показатели за счет формирования таргетинговых предложений для клиентов.

Эффективность взаимодействия с клиентами в банках сильно зависит от полноты клиентских профилей. Если данные о клиенте находятся в разных системах, получить полноценную аналитику по его предпочтениям становится практически нерешаемой задачей. Для того, чтобы собрать всю информацию о клиентах в одном месте и организовать для сотрудников банка быстрый доступ к необходимым данным, в РСХБ решили создать озеро данных с набором аналитических инструментов внутри. Партнером проекта стала ИТ-компания «Инфосистемы Джет»

Перед РСХБ и «Инфосистемы Джет» стояла задача собрать максимально исчерпывающие профили клиентов в озере, наладить взаимодействие всех информационных систем банка и создать пул инструментов для аналитики. Специалисты организовали наполнение озера данными из процессинга, CRM и MDM, систем для онлайн-продаж продуктов банка, а также чат-бота и ряда других систем, которые содержат информацию о клиентах.

«В работе с данными очень важно, чтобы они давали результат как можно быстрее. До внедрения озера путь данных от источника до дата-сайнтистов мог занимать несколько месяцев, за это время данные теряют свою актуальность, — говорит Александр Сабуров, заместитель директора Департамента корпоративного развития “РСХБ”. — Сейчас наши аналитики сами находят нужные данные в data lake, благодаря чему они начинают работать и давать результат практически сразу. С помощью озера мы можем строить больше гипотез на актуальных данных, и делать нашим клиентам релевантные предложения. Таким образом мы сможем больше зарабатывать на маркетинговых активностях, и меньше тратить, уменьшая риски и оптимизируя процессы. Немаловажно, что при этом мы соблюдаем compliance-требования внешних регуляторов».

Для создания data lake были выбраны продукты экосистемы Hadoop и платформа интеграции Informatica Data Engineering Integration. Для реализации архитектуры аналитической платформы использовалась многоуровневая архитектура (LSA — Layered Scalable Architecture).

«Для РСХБ мы построили настоящее мега-озеро данных. Оно имеет бесконечный потенциал, и мы продолжаем работы по созданию в нем удобных аналитических инструментов и подключению новых источников данных», — говорит Дмитрий Кулагин, директор центра управления данными “Инфосистемы Джет”. — «Проект позволит заметно ускорить обслуживание клиентов и создать новую реальность, в которой вы только задумались о том, что вам нужно от банка, а банк уже подготовил вам предложение».

Процесс создания и наполнения озера данными занял меньше трех месяцев. В настоящее время аналитики банка уже начали применять различные алгоритмы машинного обучения по обработке доступной клиентской информации. В ближайшее время планируется дальнейшая работа по интеграции других внутренних и внешних систем, содержащих полезные данные.