Рубрика «big data» - 117

Deep learning и Caffe на новогодних праздниках

2015-01-28 в 11:53, admin, рубрики: big data, data mining, deep learning, инструментарий, нейронные сети, обработка изображений

Мотивация

В данной статье вы познакомитесь c применением deep learning на практике. Будет использован фреймворк Caffe на датасете SVHN.

Deep Learning. Этот buzz word уже давно звенит в ушах, но попробовать его на практике никак не удавалось. Подвернулся удобный случай это исправить! На новогодние праздники был назначен контест на kaggle по распознаванию номеров домов в рамках курса по анализу изображений.
Читать полностью »

Кластеризация: расскажи мне, что ты покупаешь, и я скажу кто ты

2015-01-26 в 14:04, admin, рубрики: big data, data mining, retail, Алгоритмы, Блог компании datawiz.io, математика, ритейл

Задача Datawiz.io: провести кластеризацию клиентов программы лояльности в ритейле.

Кластеризация — это метод поиска закономерностей, предназначенный для разбиения совокупности объектов на однородные группы (кластеры) или поиска существующих структур в данных.

Целью кластеризации является получение новых знаний. Это как “найти клад в собственном подвале”.

Для чего это нужно компаниям? Чтобы лучше узнать своих клиентов. Чтобы найти индивидуальный подход к каждому клиенту, а не работать со всеми одинаково.
Читать полностью »

Когда данных действительно много: Vowpal Wabbit

2015-01-25 в 16:59, admin, рубрики: big data, data mining, machine learning, python, разработка

Привет!

Когда данных действительно много: Vowpal Wabbit - 1

В предыдущих двух постах (раз, два) мы расмотрели основные алгоритмы и техники, применяющиеся участниками соревнований Kaggle. Сегодня хотелось бы пойти дальше и поговорить про то, с какими трудностями встречаются исследователи при разработке алгоритмов в случае, когда данных очень много и обучаться приходится на выборках, которые не помещаются в память. Сразу стоит отметить, что это происходит довольно часто, даже на самом Kaggle (в данной задаче обучающая выборка имеет обьем в несколько гигабайт и новичку может быть просто не понятно, что с этим делать). Ниже мы рассмотрим алгоритмы машинного обучения и инструменты, справляющиеся с данной проблемой.
Читать полностью »

Обзор наиболее интересных материалов по анализу данных и машинному обучению №32 (19 — 25 января 2015)

2015-01-25 в 16:14, admin, рубрики: big data, data mining, data science, data science digest, machine learning

Обзор наиболее интересных материалов по анализу данных и машинному обучению №32 (19 — 25 января 2015) - 1
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Читать полностью »

Визуализация многомерных данных с помощью диаграмм Эндрюса

2015-01-23 в 6:35, admin, рубрики: big data, python, Большие данные, визуализация данных

В эпоху Big Data графическое представление многомерных данных является весьма актуальной задачей. Однако результат визуализации не всегда соответствует ожиданиям. Вот пример не самого наглядного графика для изображения многомерных данных «Ирисы Фишера»:
Визуализация многомерных данных с помощью диаграмм Эндрюса - 1
Читать полностью »

Как начать работу в Kaggle: руководство для новичков в Data Science

2015-01-21 в 6:36, admin, рубрики: big data, data mining, kaggle, machine learning, nolearn, python, актуальная проблематика, анализ данных, глубокое обучение, искусственные нейронные сети, искусственный интеллект, новичкам, обучение, Питон, рython

Доброго времени суток, уважаемыее! Сегодня я хотел бы поговорить о том, как не имея особого опыта в машинном обучении, можно попробовать свои силы в соревнованиях, проводимых Kaggle.

Как вам уже, наверное, известно, Kaggle – это платформа для исследователей разных уровней, где они могут опробовать свои модели анализа данных на серьезных и актуальных задачах. Суть такого ресурса – не только в возможности получить неплохой денежный приз в случае, если именно ваша модель окажется лучшей, но и в том (а, это, пожалуй, гораздо важнее), чтобы набраться опыта и стать специалистом в области анализа данных и машинного обучения. Ведь самый важный вопрос, зачастую стоящий перед такого рода специалистами – где найти реальные задачи? Здесь их достаточно.

Мы попробуем поучаствовать в обучающем соревновании, не предусматривающем каких-либо поощрений, кроме опыта.
Читать полностью »

Опыт построения команды Big Data

2015-01-20 в 9:46, admin, рубрики: agile, big data, data mining, команда, разработка, тестирование, Тестирование IT-систем

Привет!

Опыт построения команды Big Data - 1

В последнее время все чаще слышу от своих коллег, которые работают в подразделениях Big Data в разных компаниях утверждения о том, что процесс разработки построен не очень эффективно, что зачастую делается большое количество лишних итераций, а также что есть некоторое непонимание со стороны руководителей всех тонкостей получаемых на выходе продуктов. Поэтому в этой и следующей статьях я постараюсь рассказать о своем опыте построения команды, в которой мы работали достаточно эффективно. Сразу отмечу, что это лишь наш опыт, который не претендует на правильность и полноту. Статья направлена в первую очередь на руководителей разработки и представителей бизнеса.
Читать полностью »

«Любовь и ненависть» на карте России, зима 2014-2015: четвертое исследование эмоционального состояния 35 млн пользователей социальных медиа

2015-01-19 в 13:20, admin, рубрики: big data, Блог компании PalitrumLab, Исследования и прогнозы в IT, исследования пользователей, социальные сети

Представляем новые данные Brand Analytics по эмоциональному состоянию пользователей социальных сетей в регионах России. В период с 8 по 21 декабря 2014 года было проведено четвертое измерение соотношения позитивных и негативных эмоций в публичных сообщениях российских пользователей соцмедиа. Главный вывод: несмотря на сложную политическую и экономическую ситуацию, в стране сохраняется позитивная динамика общего эмоционального фона.

Читать полностью »

Обзор наиболее интересных материалов по анализу данных и машинному обучению №31 (12 — 18 января 2015)

2015-01-18 в 15:02, admin, рубрики: big data, data mining, data science, data science digest, machine learning

Обзор наиболее интересных материалов по анализу данных и машинному обучению №31 (12 — 18 января 2015) - 1
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Читать полностью »

Искусство Feature Engineering в машинном обучении

2015-01-17 в 9:45, admin, рубрики: big data, data mining, kaggle, machine learning, python, математика

Привет!

Искусство Feature Engineering в машинном обучении - 1

В предыдущей статье (Введение в машинное обучение с помощью Python и Scikit-Learn) мы с вами познакомились с основными этапами решения задач машинного обучения. Сегодня подробнее поговорим о техниках, которые позволяют заметно увеличить качество разрабатываемых алгоритмов. Одна из таких техник — Feature Engineering. Сразу отметим, что это своего рода искусство, обучиться которому можно только прорешав огромное количество задач. Тем не менее, с опытом вырабатываются некие общие подходы, которыми хотелось бы поделиться в данной статье.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «big data» - 117

Deep learning и Caffe на новогодних праздниках

Мотивация

Кластеризация: расскажи мне, что ты покупаешь, и я скажу кто ты

Когда данных действительно много: Vowpal Wabbit

Обзор наиболее интересных материалов по анализу данных и машинному обучению №32 (19 — 25 января 2015)

Визуализация многомерных данных с помощью диаграмм Эндрюса

Как начать работу в Kaggle: руководство для новичков в Data Science

Опыт построения команды Big Data

«Любовь и ненависть» на карте России, зима 2014-2015: четвертое исследование эмоционального состояния 35 млн пользователей социальных медиа

Обзор наиболее интересных материалов по анализу данных и машинному обучению №31 (12 — 18 января 2015)

Искусство Feature Engineering в машинном обучении

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «big data» - 117

Мотивация

Новости

Актуальные темы

Архив