Рубрика «machine learning» - 53

Сборка XGBoost для Python под Windows

2015-12-17 в 11:06, admin, рубрики: machine learning, python, xgboost, машинное обучение

Windows is so evil that consumes extra energy to make the things running.

Сборка XGBoost для Python под Windows - 1

Библиотека XGBoost гремит на всех соревнованиях по машинному обучению и помогает завоёвывать призовые места. Однако, стать обладателем этого пакета для Python под Windows не так просто.

Процесс установки скудно описан на GitHub и немногим шире на форуме Kaggle. Поэтому попробую описать пошагово и более подробно. Надеюсь это поможет сохранить много времени неопытным пользователям.
Читать полностью »

IoT и хакатон Azure Machine Learning: как мы делали проект вне конкурса

2015-12-14 в 6:29, admin, рубрики: azure, internet of things, machine learning, microsoft, Интернет вещей, облачные сервисы, Разработка для интернета вещей, хакатон

IoT и хакатон Azure Machine Learning: как мы делали проект вне конкурса - 1
Не так давно состоялся очередной хакатон от Microsoft. На этот раз, он был посвящен машинному обучению. Тема очень актуальная и перспективная, однако, для меня достаточно туманная. На момент начала хакатона я имел только общее представление о том, что это такое, зачем оно нужно и пару раз видел результаты работы обученных моделей. Узнав, что анонс обещал множество экспертов в помощь новичкам, я решил объединить приятное с полезным и попробовать использовать машинное обучение при работе с каким нибудь IoT решением. Далее я расскажу что из этого получилось.
Читать полностью »

Конференция Microsoft Research — Cloud computing for Research with Microsoft Azure, 19 мая в МГУ

2015-04-21 в 5:59, admin, рубрики: big data, cloud, internet of things, machine learning, microsoft, Microsoft Azure, microsoft research, Блог компании Microsoft, машинное обучение, наука, Разработка для интернета вещей, метки: Microsoft, Microsoft Research

Привет!

Май становится все горячее — у нас уже есть Microsoft DevCon 2015 в Яхонтах — главная конференция для разработчиков Microsoft в России, Embedded Day — конференция по встраиваемым технологиям и Интернету Вещейшкола по машинному обучению то Microsoft Research.

Однако мы подготовили еще один настоящий подарок — целую конференцию от Microsoft Research про то, как делать исследования в облаке. С каждым днем количество ресурсов, необходимых для научных вычислений, растёт, и локально справляться уже давно не получается. С приходом облака и прикладных инструментов, а также стараний Microsoft Research, нам есть что предложить научному сообществу. 19 мая, в Московском Государственном Университете, пройдет мини-конференция, где мы обсудим, как облако помогает в прикладных и теоретических изысканиях истины. С нами — ведущие эксперты, доктора наук из Microsoft Research.

В программе:
Читать полностью »

Обзор обновлений платформы Microsoft Azure за март 2015. Много Open Source

2015-04-08 в 8:50, admin, рубрики: Application insights, azure, azuredigest, chef, iaas, linux, mac, machine learning, Microsoft Azure, sql, Visual Studio, vm, web sites, Блог компании Microsoft

В дайджесте новостей облачной платформы Microsoft Azure собраны основные анонсы и контент для разработчиков, ИТ-профессионалов и всех специалистов, интересующихся облачными технологиями и платформой Azure. Предыдущие выпуски дайджеста всегда можно найти по следующей ссылке. С этого дайджеста в полезном контенте будет не только наш контент, но и интересные и хорошие ссылки, которые могут быть написаны и не Microsoft.

В сегодняшнем дайджесте правит бал Open Source.
Читать полностью »

Антифрод (часть 4): аналитическая система распознания мошеннических платежей

2015-04-03 в 6:26, admin, рубрики: antifraud, azure ml, data mining, machine learning, Microsoft Azure, машинное обучение, платежные системы, метки: antifraud

No Fraud

В заключительной четвертой части статьи подробно обсудим наиболее сложную с технической точки зрения часть antifraud-сервиса – аналитическую систему распознания мошеннических платежей по банковским картам.

Выявление различного рода мошенничеств является типичным кейсом для задач обучения с учителем (supervised learning), поэтому аналитическая часть антифрод-сервиса, в соответствии с лучшими отраслевыми практиками, будет построена с использованием алгоритмов машинного обучения.

Для стоящей перед нами задачи воспользуемся Azure Machine Learning – облачным сервисом выполнения задач прогнозной аналитики (predictive analytics). Для понимания статьи будут необходимы базовые знания в области машинного обучения и знакомство с сервисом Azure Machine Learning.

Что уже было сделано? (для тех, кто не читал предыдущие 3 части, но интересуется)

В первой части статьи мы обсудили, почему вопрос мошеннических платежей (fraud) стоит так остро для всех участников рынка электронных платежей – от интернет-магазинов до банков – и в чем основные сложности, из-за которых стоимость разработки таких систем подчас является слишком высокой для многих участников ecommerce-рынка.

Во 2-ой части были описаны требования технического и нетехнического характера, которые предъявляются к таким системам, и то, как я собираюсь снизить стоимость разработки и владения antifraud-системы на порядок(и).

В 3-ей части была рассмотрена программная архитектура сервиса, его модульная структура и ключевые детали реализации.

В заключительной четвертой части у нас следующая цель…

Цель

В этой части я опишу проект, на первом шаге которого мы обучим четыре модели, используя логистическую регрессию, персептрон, метод опорных векторов и дерево решений. Из обученных моделей выберем ту, которая дает большую точность на тестовой выборке и опубликуем ее в виде REST/JSON-сервиса. Далее для полученного сервиса напишем программного клиента и проведем нагрузочное тестирование на REST-сервис.

Читать полностью »

Azure Machine Learning для Data Scientist

2015-04-02 в 9:15, admin, рубрики: azure ml, cloud, machine learning, Microsoft Azure, Алгоритмы, Блог компании Microsoft, машинное обучение, облако

Эта статья создана нашим другом из коммьюнити, Дмитрием Петуховым, Microsoft Certified Professional, разработчиком компании Quantum Art.
Статья — часть цикла про Fraud Detection, остальные статьи можно найти в профиле у Дмитрия.

Azure Machine Learning для Data Scientist - 1

Azure Machine Learning – облачный сервис для выполнения задач прогнозной аналитики (predictive analytics). Сервис представлен двумя компонентами: Azure ML Studio – средой разработки, доступной через web-интерфейс, и web-сервисами Azure ML.
Типичная последовательность действий data scientist'a при поиске закономерностей в наборе данных с использованием алгоритмов обучения с учителем изображена и подробно описана под хабракатом.
Читать полностью »

Big Data на практике: ожидание VS реальность

2015-03-30 в 8:57, admin, рубрики: Apache, big data, data mining, machine learning, анализ данных, математика, машинное обучение, практике, Программирование

Big Data на практике: ожидание VS реальность - 1 Привет, хабр!

После последней публикации «Ваш персональный курс по Big Data» мне пришло несколько сотен писем с вопросами, читая которые, я с удивлением обнаружил, что люди очень сильно погружаются в теорию, уделяя мало времени решению практических задач, в которых навыки необходимы совершенно другие. Cегодня я расскажу, какие сложности появляются на практике и с чем приходится работать при решении реальных задач.
Читать полностью »

Ваш персональный курс по Big Data

2015-03-16 в 13:13, admin, рубрики: big data, data mining, machine learning, python, анализ социальных сетей, Большие данные, математика, машинное обучение, Поисковые машины и технологии, социальные сети, метки: Big Data, Data Mining

Ваш персональный курс по Big Data - 1 Привет!

После публикации нескольких статей по Big Data и Машинному обучению, ко мне пришло немало писем от читателей с вопросами. За последние несколько месяцев мне удалось помочь многим людям сделать быстрый старт, некоторые из них — уже решают прикладные задачи и делают успехи. А кто-то уже устроился на работу и занимается решением реальных задач. Моя цель — чтобы вокруг меня были умные люди, с которыми в том числе и я смогу работать в дальнейшем. Поэтому я хочу помочь тем, кто действительно хочет научиться решать настоящие задачи на практике. В сети присутствует большое количество мануалов о том, как стать ученым по данным (Data Scientist). В свое время я прошел все, что там есть. Однако, на практике порой нужны совсем другие знания. О том, какие именно навыки нужны — я расскажу в сегодняшней статье и постараюсь ответить на все Ваши вопросы.
Читать полностью »

Обзор наиболее интересных материалов по анализу данных и машинному обучению №39 (9 — 15 марта 2015)

2015-03-15 в 15:58, admin, рубрики: big data, data mining, data science, data science digest, high scalability, machine learning, машинное обучение

Обзор наиболее интересных материалов по анализу данных и машинному обучению №39 (9 — 15 марта 2015) - 1
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Читать полностью »

Обзор наиболее интересных материалов по анализу данных и машинному обучению №38 (2 — 8 марта 2015)

2015-03-10 в 8:52, admin, рубрики: big data, data mining, data science, data science digest, high scalability, machine learning, машинное обучение

Обзор наиболее интересных материалов по анализу данных и машинному обучению №38 (2 — 8 марта 2015) - 1
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «machine learning» - 53

Сборка XGBoost для Python под Windows

IoT и хакатон Azure Machine Learning: как мы делали проект вне конкурса

Конференция Microsoft Research — Cloud computing for Research with Microsoft Azure, 19 мая в МГУ

Обзор обновлений платформы Microsoft Azure за март 2015. Много Open Source

Антифрод (часть 4): аналитическая система распознания мошеннических платежей

Цель

Azure Machine Learning для Data Scientist

Big Data на практике: ожидание VS реальность

Ваш персональный курс по Big Data

Обзор наиболее интересных материалов по анализу данных и машинному обучению №39 (9 — 15 марта 2015)

Обзор наиболее интересных материалов по анализу данных и машинному обучению №38 (2 — 8 марта 2015)

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «machine learning» - 53

Цель

Новости

Актуальные темы

Архив