Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Общее
Седьмая ежегодная Летняя школа Microsoft Research. На этот раз про машинное обучение и интеллект
IBM Watson for Oncology: помощь когнитивной системы в борьбе с раком
Искусственный интеллект который может понимать, о чём видео
Русскоязычные ресурсы по статистике, машинному обучению, R
Инфографика: история Data Science
Microsoft укрепляет позиции Python и Linux в своих новых инструментах в области Big Data
Начало пути и развитие в области машинного обучения — хорошая мотивирующая статья от автора блога MachineLearningMastery.
На текущий момент Apache Spark выглядит как будущее Big Data
Deeplearning4j: Библиотека Deep Learning для Java
Data Science: список активных блогов
Microsoft анонсировал общедоступность платформы Azure Machine Learning
Как Pinterest борется со спамом
Google сделал доступной библиотеку для работы с MapReduce с помощью C/C++
Pintereset: Аналитика в реальном времени — инженеры компании Pinterest делают обзор своей архитектуры систем аналитики в реальном времени.
Чем заняться во время прогонов по обучению модели — несколько интересных идей от автора блога MachineLearningMastery о том, чем заняться во время пауз, которые могут возникнуть во время запуска процессов по обучению модели в задачах машинного обучения.
Channel 9 разработал API рекомендаций для Azure ML
Теория и алгоритмы машинного обучения, примеры кода
Машинное обучение — 1. Корреляция и регрессия. Пример: конверсия посетителей сайта
Введение в Apache Spark
Обзор алгоритмов аудиоаналитики
Бильярдный бот: история создания
Нейронные сети в Azure ML — введение в Net#
Введение в байесовские сети с использованием R
Основы распараллеливания при использовании языка программирования R
Получение данных с датчиков Arduino с помощью языка программирования R
Kayak: библиотека для работы с глубинными нейронными сетями
Пример работы иерархической кластеризации — визуализированный пример работы иерархической кластеризации, созданный с использованием языка программирования R и библиотеки визуализации Shiny.
Серия уроков по машинному обучению и обработке естественного языка. Урок 3: Теорема Байеса
Соревнования по машинному обучению
Соревнование по машинному обучению: Microsoft Malware Classification Challenge (BIG 2015)
Соревнование по машинному обучению: March Machine Learning Mania 2015
Онлайн-курсы, обучающие материалы и литература
Введение в курс «Анализ изображений и видео». Лекции от Яндекса
Онлайн-курс: D003x.1: Applications of Linear Algebra Part 1
Онлайн-курс «Model Building and Validation — Advanced Techniques for Analyzing Data»
Обзор книги: Data Mining for Managers
Интервью с автором книги «R Machine Learning Essentials»
Видеоматериалы, подкасты
Apache Spark — SDK для всех Big Data платформ — интересный доклад, посвященный Apache Spark. В данном выступлении Pat McDonough рассказывает о развитии Apache Spark и возможности использования данного продукта в области обработки и анализа данных.
DataFrame в Apache Spark для масштабирования задач Data Science — видео с недавнего митапа в дополнение новости о том, что в Apache Spark 1.3 появится новая возможность использования DataFrame. Собственно в данном видео Reynold Xin и расскажет о данной новой функциональности в Apache Spark.
Введение в Deep Learning с использованием Python
Data engineering
Microsoft делает Apache Storm общедоступным в своей облачной платформе Azure
Недавние улучшения производительности Apache Spark — Reynold Xin рассказывает о последних значительных улучшениях производительности Apache Spark.
Анонс DataFrame в Apache Spark — в Apache Spark версии 1.3 появится возможность использования DataFrame, данная статья расскажет о деталях реализации и использования DataFrame в Apache Spark.
Расширение возможностей аналитики в MemSQL с помощью Apache Spark
Обзоры
Интересное из мира R (9-15 февраля 2015 г.)
Лучшие материалы за неделю от KDnuggets.com (8 — 14 февраля)
Новости Data Science от MyDataMine.com (21 февраля)
Новости Big Data от MyDataMine.com (18 февраля)
Еженедельный дайджест от DataScienceCentral (23 февраля)
Еженедельный дайджест от DataScienceCentral (16 февраля)
Лучшие ресурсы за неделю от Data Elixir (№23)
Еженедельный сборник лучших материалов от R1Soft (20 февраля)
Наиболее интересные материалы по High Scalability (20 февраля)
Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №35 (9 — 15 февраля 2015)
Автор: moat