«Коммерсант», со ссылкой на подтверждение госкорпорации «Ростех», рассказал о создании совместного предприятия Газпромбанка, «Ростеха», USM Holdings Алишера Усманова и подконтрольного предпринимателю «МегаФона». Сотовый оператор внесёт в СП часть пакета Mail.ru Group (MRG) — 5,23% экономической и 58,87% голосующей доли в интернет-холдинге. Принадлежащие MRG соцсети Читать полностью »
Рубрика «скоринг» - 2
«МегаФон» вступил в СП с государством и дал в качестве приданного Mail.ru
2018-05-08 в 14:13, admin, рубрики: B2B, mail.ru group, USM Holdings, Алишер Усманов, банки, Газпромбанк, Госвеб, Доверие к соцсетям, запуск, инвестиции, Мегафон, ростех, Сбербанк, скоринг, сотовые операторы, соцсети, Текучка, телеком, яндекс, метки: b2b, mail.ru group, USM Holdings, Алишер Усманов, банки, Газпромбанк, Госвеб, Доверие к соцсетям, запуск, инвестиции, Мегафон, Ростех, Сбербанк, скоринг, сотовые операторы, соцсети, Текучка, телеком, яндексНациональное бюро кредитных историй заработало в контакте с Mail.ru Group
2018-04-02 в 21:30, admin, рубрики: B2B, mail.ru group, банки, Вконтакте, Доверие к соцсетям, персональные данные, скоринг, соцсети, Текучка, метки: b2b, mail.ru group, банки, Вконтакте, Доверие к соцсетям, персональные данные, скоринг, соцсети, ТекучкаНациональное бюро кредитных историй (НБКИ) на «легальной и прозрачной основе», по описанию представителя Mail.ru Group, получило доступ к данным о пользователях «ВКонтакте», передал РБК, сославшийся на 3 источника на рынке данных. Один из них утверждает, Читать полностью »
Коэффициент Джини. Из экономики в машинное обучение
2018-03-06 в 10:59, admin, рубрики: auc, data mining, gini, kaggle, python, бинарная классификация, Блог компании Open Data Science, джини, математика, машинное обучение, метрика, скоринг, статистика, теория вероятностейИнтересный факт: в 1912 году итальянский статистик и демограф Коррадо Джини написал знаменитый труд «Вариативность и изменчивость признака», и в этом же году «Титаник» затонул в водах Атлантики. Казалось бы, что общего между этими двумя событиями? Всё просто, их последствия нашли широкое применение в области машинного обучения. И если датасет «Титаник» в представлении не нуждается, то об одной замечательной статистике, впервые опубликованной в труде итальянского учёного, мы поговорим поподробней. Сразу хочу заметить, что статья не имеет никакого отношения к коэффициенту Джини (Gini Impurity), который используется в деревьях решений как критерий качества разбиения в задачах классификации. Эти коэффициенты никак не связаны друг с другом и общего между ними примерно столько же, сколько общего между трактором в Брянской области и газонокосилкой в Оклахоме.
Коэффициент Джини (Gini coefficient) — метрика качества, которая часто используется при оценке предсказательных моделей в задачах бинарной классификации в условиях сильной несбалансированности классов целевой переменной. Именно она широко применяется в задачах банковского кредитования, страхования и целевом маркетинге. Для полного понимания этой метрики нам для начала необходимо окунуться в экономику и разобраться, для чего она используется там.
Читать полностью »
Использование нейронной сети для построения модели оценки заёмщиков в сфере онлайн-микрофинансирования
2017-10-25 в 10:35, admin, рубрики: логистическая регрессия, нейронные сети, скоринг, финансы в IT, финтехВ настоящее время для построения скоринговой модели стандартом “де факто” в финансовой отрасли является использование функций логистической регрессии (logit-функций). Суть метода сводится к нахождению такой линейной комбинации начальных данных (предикторов), которая в результате logit-преобразования будет максимально правдоподобно осуществлять предсказания.
Практический недостаток метода — в необходимости длительной подготовки данных для построения модели (около недели работы специалиста). В реальных условиях работы микрофинансовой компании набор данных о заемщиках постоянно меняется, подключаются и отключаются различные дата-провайдеры, сменяются поколения займов — этап подготовки становится узким местом.
Другой недостаток logit-функций связан с их линейностью — влияние каждого отдельного предиктора на конечный результат равномерно на всем множестве значений предиктора.
Модели на базе нейронных сетей лишены этих недостатков, но редко применяются в отрасли — нет надежных методов оценки переобучения, большое влияние “шумящих” значений в исходных данных.
Ниже мы покажем, как с помощью применения различных методов оптимизации модели на базе нейронных сетей позволяют получить лучший результат предсказаний по сравнению с моделями на базе logit-функций.
Краткий курс машинного обучения или как создать нейронную сеть для решения скоринг задачи
2017-10-23 в 17:22, admin, рубрики: data mining, data science, genetic algorithms, machine learning, neural networks, python, Алгоритмы, генетический алгоритм, градиентный спуск, машинное обучение, нейронные сети, оптимизационные задачи, Программирование, скоринг, эволюционный алгоритмМы часто слышим такие словесные конструкции, как «машинное обучение», «нейронные сети». Эти выражения уже плотно вошли в общественное сознание и чаще всего ассоциируются с распознаванием образов и речи, с генерацией человекоподобного текста. На самом деле алгоритмы машинного обучения могут решать множество различных типов задач, в том числе помогать малому бизнесу, интернет-изданию, да чему угодно. В этой статье я расскажу как создать нейросеть, которая способна решить реальную бизнес-задачу по созданию скоринговой модели. Мы рассмотрим все этапы: от подготовки данных до создания модели и оценки ее качества.
Вопросы, которые разобраны в статье:
• Как собрать и подготовить данные для построения модели?
• Что такое нейронная сеть и как она устроена?
• Как написать свою нейронную сеть с нуля?
• Как правильно обучить нейронную сеть на имеющихся данных?
• Как интерпретировать модель и ее результаты?
• Как корректно оценить качество модели?
Читать полностью »
Банки получили доступ к выпискам из Пенсионного фонда о заёмщиках
2017-06-20 в 4:48, admin, рубрики: api, B2B, банки, Госвеб, госуслуги, запуск, пенсионный фонд, персональные данные, скоринг, Текучка, электронный документооборот, метки: api, b2b, банки, Госвеб, госуслуги, запуск, пенсионный фонд, персональные данные, скоринг, Текучка, электронный документооборотЗампред ЦБ Ольга Скоробогатова рассказала, что российские банки получили доступ к данным Пенсионного фонда России (ПФР) — как это описывают собеседники газеты «Ведомости»: к сведениям о пенсионных счетах потенциальных заемщиков. Получить, например, сведения на всех работающих у корпоративного клиента, Читать полностью »
Решение задачи кредитного скоринга методом логистической регрессии
2017-03-22 в 15:23, admin, рубрики: логистическая регрессия, машинное обучение, скорингОтучившись на нескольких онлайн-курсах, попробовал занять позицию, связанную с Machine Learning — на входе получил тестовое задание о кредитном скоринге. Свое решение которой здесь и привожу:
Задание
Данные содержат информацию о выданных кредитах, требуется предсказать вероятность успешного возврата кредита.
Тренировочная выборка содержится в файле train.csv, тестовая — test.csv.
Информация о значениях признаков содержится в файле feature_descr.xlsx.
Целевой признак — loan_status (бинарный). 1 означает что кредит успешно вернули.
В рамках тестового задания вам предлагается:
- Обучить модель на предоставленных данных, найти качество полученной модели.
- Записать предсказания (вероятности) для тестового набора в файл results.csv
- Продемонстрировать результаты анализа в графическом виде (ROC-curve)
Тщательный выбор фич и подбор гиперпараметров можно не проводить.
«Некоторые считают наш бизнес живодерским, это не так… если выдавать займы людям в сложных ситуациях, то никто их не вернет»
2015-06-23 в 14:20, admin, рубрики: eKapusta, Александ Герасев, интервью, Нам пишут, онлайн-кредитование, скоринг, метки: eKapusta, Александ Герасев, интервью, Нам пишут, онлайн-кредитование, скорингКакова реальная ставка займов
Наша ставка по займам — 1,7% в день или 620% годовых. Это чуть меньше среднерыночной ставки, которую рассчитывает ЦБ — по итогам первого квартала 2015 года она равна 642% годовых (речь о потребительских микрозаймах без обеспечения до 1 месяца до 30 тысяч рублей; аналогичное значение для срока от 6 месяцев до 1 года — 189,12%; нецелевой потребительский кредит в банке до 1 года до 30 тысяч рублей — 42,99% - Roem.ruЧитать полностью »