Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Общее
- Седьмая ежегодная Летняя школа Microsoft Research. На этот раз про машинное обучение и интеллект
- IBM Watson for Oncology: помощь когнитивной системы в борьбе с раком
- Искусственный интеллект который может понимать, о чём видео
- Русскоязычные ресурсы по статистике, машинному обучению, R
- Инфографика: история Data Science
- Microsoft укрепляет позиции Python и Linux в своих новых инструментах в области Big Data
- Начало пути и развитие в области машинного обучения — хорошая мотивирующая статья от автора блога MachineLearningMastery.
- На текущий момент Apache Spark выглядит как будущее Big Data
- Deeplearning4j: Библиотека Deep Learning для Java
- Data Science: список активных блогов
- Microsoft анонсировал общедоступность платформы Azure Machine Learning
- Как Pinterest борется со спамом
- Google сделал доступной библиотеку для работы с MapReduce с помощью C/C++
- Pintereset: Аналитика в реальном времени — инженеры компании Pinterest делают обзор своей архитектуры систем аналитики в реальном времени.
- Чем заняться во время прогонов по обучению модели — несколько интересных идей от автора блога MachineLearningMastery о том, чем заняться во время пауз, которые могут возникнуть во время запуска процессов по обучению модели в задачах машинного обучения.
- Channel 9 разработал API рекомендаций для Azure ML
Теория и алгоритмы машинного обучения, примеры кода
- Машинное обучение — 1. Корреляция и регрессия. Пример: конверсия посетителей сайта
- Введение в Apache Spark
- Обзор алгоритмов аудиоаналитики
- Бильярдный бот: история создания
- Нейронные сети в Azure ML — введение в Net#
- Введение в байесовские сети с использованием R
- Основы распараллеливания при использовании языка программирования R
- Получение данных с датчиков Arduino с помощью языка программирования R
- Kayak: библиотека для работы с глубинными нейронными сетями
- Пример работы иерархической кластеризации — визуализированный пример работы иерархической кластеризации, созданный с использованием языка программирования R и библиотеки визуализации Shiny.
- Серия уроков по машинному обучению и обработке естественного языка. Урок 3: Теорема Байеса
Соревнования по машинному обучению
- Соревнование по машинному обучению: Microsoft Malware Classification Challenge (BIG 2015)
- Соревнование по машинному обучению: March Machine Learning Mania 2015
Онлайн-курсы, обучающие материалы и литература
- Введение в курс «Анализ изображений и видео». Лекции от Яндекса
- Онлайн-курс: D003x.1: Applications of Linear Algebra Part 1
- Онлайн-курс «Model Building and Validation — Advanced Techniques for Analyzing Data»
- Обзор книги: Data Mining for Managers
- Интервью с автором книги «R Machine Learning Essentials»
Видеоматериалы, подкасты
- Apache Spark — SDK для всех Big Data платформ — интересный доклад, посвященный Apache Spark. В данном выступлении Pat McDonough рассказывает о развитии Apache Spark и возможности использования данного продукта в области обработки и анализа данных.
- DataFrame в Apache Spark для масштабирования задач Data Science — видео с недавнего митапа в дополнение новости о том, что в Apache Spark 1.3 появится новая возможность использования DataFrame. Собственно в данном видео Reynold Xin и расскажет о данной новой функциональности в Apache Spark.
- Введение в Deep Learning с использованием Python
Data engineering
- Microsoft делает Apache Storm общедоступным в своей облачной платформе Azure
- Недавние улучшения производительности Apache Spark — Reynold Xin рассказывает о последних значительных улучшениях производительности Apache Spark.
- Анонс DataFrame в Apache Spark — в Apache Spark версии 1.3 появится возможность использования DataFrame, данная статья расскажет о деталях реализации и использования DataFrame в Apache Spark.
- Расширение возможностей аналитики в MemSQL с помощью Apache Spark
Обзоры
- Интересное из мира R (9-15 февраля 2015 г.)
- Лучшие материалы за неделю от KDnuggets.com (8 — 14 февраля)
- Новости Data Science от MyDataMine.com (21 февраля)
- Новости Big Data от MyDataMine.com (18 февраля)
- Еженедельный дайджест от DataScienceCentral (23 февраля)
- Еженедельный дайджест от DataScienceCentral (16 февраля)
- Лучшие ресурсы за неделю от Data Elixir (№23)
- Еженедельный сборник лучших материалов от R1Soft (20 февраля)
- Наиболее интересные материалы по High Scalability (20 февраля)
Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №35 (9 — 15 февраля 2015)
Автор: moat