Для микрофинансовых организаций определение платежеспособности клиента — едва ли не самая важная часть работы. В ход идёт всё — данные соцсетей, история поиска, информация о платежах на мобильный, machine learning, big data и даже такие экзотические показатели, как то, насколько быстро и часто вы двигаете ползунки. Roem.ru спросил у представителей рынка МФО, как делают скоринг они.
***
Директор по управлению рисками сервиса онлайн-кредитования MoneyMan Екатерина Казак:
Для создания алгоритма оценки рисков «Скоринг 5.0» MoneyMan анализировал более 500 агрегатов. Модель принимает решение о выдаче займа на основе множества данных, включая технологии множественного поиска, внутреннюю кредитную историю, антифрод сервис «Национальный хантер», данные нескольких бюро кредитных историй и другие внешние источники, например, информацию о платежах потенциальных заемщиков на счета мобильной связи и данные из аккаунтов заемщиков в социальных сетях.
По итогам 2014 года уровень NPL 90+ (просрочка более 90 дней) по кредитному портфелю MoneyMan в России не превысил 14% по ежемесячным винтажам профинансированных займов. Это гораздо ниже среднерыночного уровня NPL 90+, который по итогам 2014 года составил по нашим оценкам 30−32%. Но и это приемлемые цифры. Считается, что в бизнес модели микрофинансирования NPL 90+ не должен превышать 35%.
Анастасия Мухачева, операционный директор сервиса p2p-кредитования Fingooroo:
Fingooroo использует собственные скоринговые модели, разработанные на алгоритмах логистической регрессии и дерева решений. Скоринговая модель позволяет на лету отсеивать примерно 80% входящего трафика. Мы анализируем все доступные внешние источники информации (бюро кредитных историй, внешние базы данных, соц сети).
Генеральный директор микрофинансовой компании «Займо» Евгений Ждановских:
Для определения кредитоспособности своих клиентов используем технологию «больших данных». Мы собираем поведенческую информацию клиента в сети, метаинформацию и личную информацию, которую предоставляет о себе клиент.
Наши алгоритмы сопоставляют личную информацию, которую предоставил в своей заявке клиент, с информацией, полученной от третьих лиц, а также с информацией, которую мы можем найти о заемщике в сети интернет, например, IP-адрес клиента, страничка клиента в социальных сетях, следы, оставленные клиентом в интернете, информация по мобильным платежам.
В Facebook, Vkontakte или Odnoklassniki в первую очередь нас интересует «качество» страницы клиента. Во-первых, нам важно, чтобы страница велась клиентом лично на протяжении некоторого времени, а не выглядела подозрительной, как будто только что созданной.
Во-вторых, данные, которые предоставлены на личной страничке клиента в социальных сетях, должны совпадать с данными, предоставленными им в заявке на получение займа. В первую очередь это касается данных о месте работы, учебы, а также семейном статусе. Так, если он указывает в заявке, что живет в Москве, а GPS-навигация фотографий, которые клиент публикует, указывает, что большинство фото опубликованы в Мурманске, то алгоритм заподозрит обман.
В-третьих, алгоритм изучает друзей клиентов в социальных сетях и проверяет, нет ли их в базе кредитных мошенников компании. Влияет на получение займа и та информация, являются ли большинство друзей клиента трудоустроенными, а также есть ли у них семья и дети. В скоринг компании постоянно включаются все новые и новые модели. Просрочка по займам от 90 дней и выше составила за 2014 год около 12%.
Генеральный директор МФО «Займер» Сергей Седов:
В качестве источников информации для скоринга используются данные из нашей базы, обогащенные информацией из крупнейших бюро кредитных историй, данными о платежах заемщиков за мобильную связь, услуги ЖКХ, а также неструктурированные данные из соцсетей и других общедоступных источников.
Всего при принятии решения анализируется более 1800 показателей, в том числе такие «экзотические», как поведение пользователя на сайте — например, как он двигает ползунки с суммой и сроком займа. Для повторных клиентов обязательно анализируется платёжная дисциплина. Эффективность каждой модели зависит от региона, повозрастной категории и сезонности. В среднем у моделей показатель NPL 90+ от 12% до 20%.
Генеральный директор Platiza.ru Илья Саломатов:
При построении скоринговых систем онлайн-сервиса Platiza.ru мы используем стандартные статистические методы и алгоритмы machine learning и big data. Наша скоринговая карта построена на основе логистической регрессии. Мы применяем алгоритмы искусственного интеллекта, основанные на использовании нейронных сетей.
При проверке данных потенциального клиента система учитывает большое количество характеристик и проводит точный анализ различных сведений (возраст заёмщика, наличие у него кредитов и т. д.), что в результате даёт меньший процент «отсеянных» заявок. Для анализа клиента мы используем информацию из анкеты, которую он заполняет в процессе регистрации, учитываем качество его кредитной истории и производим проверку на его наличие в черных списках, которые есть в открытых источниках.
Руководитель направления риск-менеджмента компании SAS Россия/СНГ Николай Филипенков:
Прежде всего скоринговые системы анализируют данные из заявки на кредит и данные из бюро кредитных историй, которые содержат детальную информацию о выплатах по кредитам по всей банковской системе. Последний год ознаменовался активным использованием источников больших данных — информации о поисковых запросах, данных из социальных сетей, информации о социальных связях заемщика и других интернет-данных.