Big Data: инструкция по эксплуатации

Дата публикации: 27 июня 2017

Big Data: инструкция по эксплуатации

Артем Пинчук, коммерческий директор проекта СПАРК

Розничные банки разделились на тех, кто уже активно использует Big Data при принятии решений и управлении кредитными рисками, и на тех, кто только собирается это делать. У отставших есть важное преимущество: они могут воспользоваться решениями, которые уже опробованы рынком и показали свою эффективность.

Шаг первый: ETL

Первый этап работы с Big Data –  извлечение, обработка и загрузка (так называемый ETL). Этот этап поглощает, по опыту, до 70% всех усилий на реализацию проекта. Поэтому столь важно пройти этот этап максимально быстро, с наименьшими затратами, сразу перейти к самому главному – к извлечению из данных реальной стоимости.

СПАРК – это самое масштабное хранилище Big Data о российском бизнесе. В нем в режиме онлайн обрабатываются и анализируются по разным параметрам сотни неструктурированных источников.

Объем уже накопленной в СПАРКе информации – более 20 Тб. В качестве СУБД используется Oracle, обеспечивающая высокую производительность при нагрузке в миллионы запросов в час. Для эффективного выстраивания взаимосвязей между объектами мы разработали промышленное решение класса графовых баз данных, способное анализировать в моменте 100 млн связей.

Зачем такие масштабы? Дело в том, что СПАРК, один из проектов группы "Интерфакс", сегодня по факту стал интегральной частью индустрии Big Data, формирующейся в российском финансовом секторе.

Десятки банков подключили API СПАРК, чтобы использовать его данные для «кредитных фабрик», маркетинга, комплаенса, предоставления клиентам информационных услуг в рамках онлайн-бэнкинга, персонализации маркетинговых предложений.

Шлюз помогает банкам избавиться от сотни разрозненных источников и заменить их одним надежным каналом с уже обработанной информацией.

В сутки через API мы обрабатываем, по состоянию на март 2017 года, более 0,5 млн запросов. Это освобождает банки от необходимости самим перелопачивать сотни источников, хранить ненужные им терабайты данных, постоянно искать какие-то новые базы, которые где-то ухитрились «раскопать» конкуренты.

Шаг второй: отвечаем на вопросы

Наша работа – ежедневно давать ответы на конкретные вопросы.

Существует ли компания, выдавшая потенциальному заемщику справку по форме 2-НДФЛ? Будет ли она и дальше платить ему зарплату? Каковы контактные данные работодателя, если потребуется навести справки?

Нет ли у клиента - юридического лица каких-либо стоп-факторов? Не является ли данный «физик» на самом деле ИП, у которого были те или иные проблемы?

Если речь идет о «кредитной фабрике» для МСП, СПАРК сможет предложить набор собственных скорингов, учитывающих многие десятки факторов и характеризующих платежеспособность, благонадежность юридических лиц. История  этих скорингов насчитывает более 5 лет, по каждому из них мы можем показать результаты бэк-тестирования.

Если банк считает собственные скоринги, СПАРК предоставит готовые факторы для расчета этих показателей.

В онлайн-банках, созданных с использованием информации СПАРКа, реализованы удобные опции, позволяющие быстро проверять контрагента на предмет соблюдения требований «должной осмотрительности».

В корпоративной CRM шлюз СПАРКа поможет устранить дубли и расширить сведения о клиентах.

Наконец, СПАРК позволит экономить время на заполнение различных форм. Например, при оформлении онлайн-кредита API СПАРК дает возможность клиенту сразу "подтянуть" нужные данные по работодателю и заодно верифицировать эти сведения.

Еще одна привычная для СПАРКа задача – автоматизация отчетности по клиентам, предоставляемой в ЦБ.

Список решаемых нами банковских задач постоянно увеличивается, потому что постоянно расширяется и сам СПАРК, и потребности клиентов.

Работая с кредитными организациями уже много лет, мы хорошо понимаем технологические требования, предъявляемые к источникам для «кредитных фабрик». Поэтому наш шлюз поддерживает SSL, что соответствует требованиям безопасности, имеет поддержку 24X7. Мы довели скорость отклика при запросе до 0,2-0,3 секунды.

Один из наших клиентов благодаря интеграции API СПАРК сократил время проверки стандартной кредитной заявки с 7 минут до 2 секунд, а расширенной - с 20 до 3 минут.

При этом доля заявок, в которых выявляется негатив по работодателю (например, компания находится в стадии ликвидации), выросла до 3,5% против 2,5% при проверке в ручном режиме. Мы также избавляем сотрудников от ручных проверок и экономим их время.

Еще один банк-клиент благодаря интеграции API СПАРК смог заметно снизить уровень просрочки.

Шаг третий: к новым вызовам

Работая в информационной компании с почти 30-летним опытом, мы хорошо знаем, что информация – все более важный источник конкурентных преимуществ.

Стандартными наборами данных сегодня никого не удивишь.

Чтобы оставаться лидером рынка, мы постоянно находимся в поиске, напрямую работаем с десятками государственных ведомств, инвестируем в R&D, создаем партнерства, развиваем системы раскрытия информации, - такие как, например, «Федресурс».

Кроме того, СПАРК сам формирует уникальные наборы данных. Так, мы реализуем проект по сбору и анализу информации о платежной дисциплине бизнеса. Участники проекта (а это крупные ресурсоснабжающие, телекоммуникационные, торговые предприятия) ежемесячно сообщают нам о платежах более 500 тыс. своих клиентов. На этой основе мы рассчитываем скоринги платежной дисциплины, которые оказываются самым оперативным сигналом об ухудшении финансового здоровья компании.

Для сравнения: все российские кредитные бюро накопили в своих базах данных примерно столько же сведений о платежных историях компаний.

СПАРК собирает все данные. Как показывает практика, лишней информации почти не бывает.

Большие и малые данные, постоянная работа по их сбору и анализу дают нам возможность находить ответы на новые вызовы, которые встают перед банками.

Сегодня один из растущих сегментов - кредитование МСБ. У банков, судя по медленным темпам роста числа заемщиков, пока не хватает опыта и знаний, чтобы поставить эту работу на поток. Но при этом есть огромное желание не отстать от конкурентов!

СПАРК, который занимается оценкой кредитных рисков уже 15 лет, поможет вам сделать рывок с точки зрения понимания конкретных факторов, свидетельствующих об уровне кредитоспособности заемщиков в сфере МСП.

API СПАРК предоставит эти факторы прямо на конвейер вашей «кредитной фабрики», обеспечив принятие решений и успешное развитие нового направления вашего бизнеса.