Неделю назад я делал здесь обзор существующих алгоритмов рекомендаций. В этой статье я продолжу данный обзор: расскажу об item-based варианте коллаборативной фильтрации, о методах, основанных на матричных разложениях, проблемах тестирования, а также о менее «раскрученных» (но не менее интересных) алгоритмах.
Рубрика «data mining» - 29
Анатомия рекомендательных систем. Часть вторая
2018-08-30 в 8:39, admin, рубрики: big data, CleverDATA, data mining, Алгоритмы, Блог компании ГК ЛАНИТ, Ланит, машинное обучениеДобро пожаловать в эпоху нигилизма приватности
2018-08-28 в 8:06, admin, рубрики: big data, data mining, анализ данных, Киберпанк, приватность, реляционные базы данных, СУБДНа Google и Facebook легко свалить вину, но на самом деле компании собирали, продавали и повторно использовали наши личные данные в течение десятилетий, а теперь, когда общественность наконец заметила, уже слишком поздно. Война за приватность давно закончилась, и мы проиграли.
Месторождение природного газа в Дервезе (Туркменистан) провалилось в подземную пещеру, создав непрерывно горящий кратер диаметром 69 м. Его называют «Врата в ад». Фото: Giles Clarke / Getty
Бариста обжигается на работе, покупает крем для ожогов в магазине Target, а позже в тот день видит рекламу этого продукта в Facebook. В другом Target кто-то кричит товарищу взять Red Bull; по дороге домой Instagram выводит спонсорское сообщение с этим напитком. Женщина занимается выпечкой и вслух восклицает, что хорошо бы купить миксер KitchenAid — и через несколько мгновений видит рекламу на телефоне. Два друга говорят о недавних поездках в Японию, а вскоре одному из них предлагают билеты со скидкой. Охрана аэропорта конфисковала у девушки флакон духов, а по приезду она видит рекламу местных парфюмерных магазинов в Facebook. Это лишь некоторые из многих странных совпадений, которые вызывают у современных пользователей неприятное чувство слежки и потери приватности. Причины иногда безобидны, а иногда и нет. По мере того как эти технологии выходят на свет, некоторые из них требуют нормативного или правового регулирования.
Читать полностью »
KDD 2018, день пятый, завершающий
2018-08-27 в 7:38, admin, рубрики: big data, data mining, kdd2018, machine learning, Блог компании Mail.Ru Group, машинное обучение
Вот и завершился пятый, последний день KDD. Удалось услышать несколько интересных докладов от Facebook и Google AI, помайнить футбольные тактики и погенерировать немного химикатов. Об этом и не только — под катом. До встречи через год в Анкоридже, столице Аляски!
Читать полностью »
Как мы сократили время на разработку скоринговых моделей в пять раз, переключившись на Python
2018-08-24 в 8:40, admin, рубрики: Credit Scoring, data mining, data science, machine learning, python, Алгоритмы, банкинг, Блог компании ID Finance, машинное обучение, регрессия
Сейчас все очень много говорят про искусственный интеллект и его применение во всех сферах работы компании. Однако есть некоторые области, где еще с давних времён главенствует один вид модели, так называемый «белый ящик» — логистическая регрессия. Одна из таких областей – банковский кредитный скоринг.
Читать полностью »
KDD 2018, день четвертый, выступает нобелевский лауреат
2018-08-23 в 13:25, admin, рубрики: big data, data mining, kdd2018, machine learning, Блог компании Mail.Ru Group, машинное обучение
Второй день основной программы KDD. Под катом снова много интересного: от машинного обучения в Pinterest до разных способов прокопаться к водопроводным трубам. В том числе было выступление нобелевского лауреата по экономике — рассказ о том, как NASA работает с телеметрией, и много графовых эмбедингов :)
Читать полностью »
KDD 2018, день третий, основная программа
2018-08-22 в 12:51, admin, рубрики: big data, data mining, kdd2018, machine learning, recommender system, Блог компании Mail.Ru Group, машинное обучение
Сегодня, наконец, началась основная программа конференции. Acceptance rate в этом году составила всего 8 %, т.е. выступать должны лучшие из лучших из лучших. Явно разделены прикладные и исследовательские потоки, плюс идет несколько отдельных сопутствующих мероприятий. Прикладные потоки выглядят более интересно, там доклады, в основном, от мэйджоров (Google, Amazon, Alibaba и т.д.). Расскажу о тех выступлениях, на которых удалось побывать.
Читать полностью »
KDD 2018, день второй, семинары
2018-08-21 в 13:01, admin, рубрики: big data, data mining, kdd2018, machine learning, анализ временных рядов, Блог компании Mail.Ru Group, машинное обучение
Сегодня на KDD 2018 день семинаров — вместе с большой конференцией, которая начнется завтра, несколько групп собрали слушателей по некоторым специфичным темам. Побывал на двух таких тусовках.
Читать полностью »
Анатомия рекомендательных систем. Часть первая
2018-08-21 в 8:13, admin, рубрики: big data, CleverDATA, data mining, data scientist, Алгоритмы, алгоритмы рекомендаций, Блог компании ГК ЛАНИТ, дата саентист, Ланит, машинное обучение, рекомендательные системыЯ работаю дата-саентистом в компании CleverDATA. Мы занимаемся проектами в области машинного обучения, и один из наиболее частых запросов на разработку основанных на машинном обучении маркетинговых решений — это разработка рекомендательных моделей.
В данной статье я расскажу о рекомендательных системах, постараюсь дать максимально полный обзор существующих подходов и на пальцах объясню принципы работы алгоритмов. Часть материала базируется на неплохом курсе по рекомендательным системам лаборатории MovieLens (которая большинству знакома по одноименному датасету для тестирования рекомендаций), остальное – из личного опыта. Статья состоит из двух частей. В первой описана постановка задачи и дан обзор простых (но популярных) алгоритмов рекомендаций. Во второй статье я расскажу о более продвинутых методах и некоторых практических аспектах реализации.
Открытый вебинар «Наивный байесовский классификатор»
2018-08-20 в 15:10, admin, рубрики: big data, data mining, data science, Байес, Блог компании Отус, классификация, машинное обучениеВсем привет!
В рамках нашего курса Data Scientist мы провели открытый урок на тему «Наивный баейсовский классификатор». Занятие вёл преподаватель курса Максим Кретов — ведущий исследователь в лаборатории нейронных сетей и глубокого обучения (МФТИ). Предлагаем ознакомиться с видео и кратким изложением.
Заранее спасибо.
KDD 2018, день первый, туториалы
2018-08-20 в 8:57, admin, рубрики: big data, data mining, graph mining, kdd2018, machine learning, Privacy, машинное обучение
Сегодня в Лондоне стартовала одна из главных Data Science конференций года, постараюсь оперативно рассказывать о том, что интересного удалось услышать.
Читать полностью »