Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Общее
Почему стоит изучать R, если вы решили заняться «наукой о данных»
Постер Data Science
Глубокие недостатки глубокого обучения — интересная статья с блога KDnuggets о потенциальных недостатках популярного метода машинного обучения Deep Learning.
Может ли Microsoft сделать R простым?
Большой список ресурсов по теме искусственного интеллекта — здесь есть ссылки на курсы, книги, ресурсы по программированию, примеры кода и еще масса других интересных ссылок по теме AI.
О машинном обучении простым языков — краткая статья об основах машинного обучения от авторов блога Analytics Vidhya.
Новичок в теме Deep Learning? Вот 4 простых урока от Google
Big Data: 5 ведущих компаний и их планы на 2015 год
Теория и алгоритмы машинного обучения, примеры кода
Линейная регрессия на R — в данной публикации описаны 4 способа использования линейной регрессии в языке программирования R.
Когда данных действительно много: Vowpal Wabbit
Deep learning и Caffe на новогодних праздниках
Word2Vec в примерах
Проект Providence: Использование машинного обучения в работе Stack Exchange
Создание предсказательной модели в Azure ML — пошаговый пример создания предсказательной модели в набирающем популярность облачном продукте Microsoft Azure Machine Learning.
Слежение за объектом в реальном времени с дрона с использованием Python и OpenCV
Eigenfaces: создание призрачных образов из набора лиц — достаточно интересная статья, посвященная одному из теоретических аспектов распознавания лиц.
Статистический взгляд Deep Learning (часть 1): рекурсивные обобщенные линейные модели (Recursive GLMs)
Пример реализации комитета алгоритмов с помощью scikit-learn — очередная хорошая статья от Sebastian Raschka, в данном случае это пример реализации комитета алгоритмов, а именно Weighted Majority Rule Ensemble Classifier с использованием библиотеки scikit-learn.
Пример предсказательной модели в R: кластеризация по сходству тэгов — небольшой пример кода на R по кластеризации данных от автора библиотеки Caret.
spaCy: современная библиотека для обработки естественного языка — интересная библиотека для NLP с использованием Python.
Параллельное программирование с использованием GPU и R
Введение в потоковый метод k-средних в Apache Spark 1.2
Краткое введение в линейную регрессию
Использование Apache Hadoop для предсказания задержек авиарейсов (часть 3) — третья часть серии статей с блога компании Hortonworks о практическом использовании Apache Hadoop для предсказания задержек авиарейсов.
Deep learning для обработки естественного языка: подборка недавних публикаций
Что такое обучение с учителем (Supervised learning) и обучение без учителя (Unsupervised learning)
Соревнования по машинному обучению
Интервью с победителями соренования «American Epilepsy Society Seizure Prediction Challenge» на Kaggle
Обучаемый персептрон в соревнованиях по машинному обучению
Онлайн-курсы, обучающие материалы и литература
Начало курса «Линейная алгебра» на Coursera — 2 февраля на Coursera начнется русскоязычный курс, посвященный линейной алгебре и представленный НИУ «Высшая школа экономики».
DataQuest: онлайн-обучение машинному обучению — не так давно запущенная англоязычная бесплатная платформа для изучения Data Science с использованием Python.
Стартовал онлайн-курс «Linear Algebra — Foundations to Frontiers» — 28 января на edX начался курс по основам линейной алгебры от «The University of Texas at Austin: Linear Algebra — Foundations to Frontiers».
Coding the Matrix на Coursera — и еще один курс, посвященный линейной алгебре, начнется в ближайшие дни на Coursera: «Coding the Matrix: Linear Algebra through Computer Science Applications».
Обзор книги: Getting started with data science in the cloud
Книга: Beginning Data Science with R
Видеоматериалы, подкасты
Введение в Deep Learning от Nando de Freitas — интересное видео от Dr. Nando de Freitas (Adjunct Professor at UBC Computer Science, Full-time Professor at Oxford). В данном случае это лекция по основам Deep Learning.
Talking Machines: Эпизод 3: Интервью с Kevin Murphy — третий эпизод «Talking Machines», в данном случае это интервью с Kevin Murphy (Research Scientist, Google), в данном эпизоде затронуты такие темы, как использование Torch, PyMC, Weka, Theano, Caffe и другие.
Введение в Microsoft Azure Machine Learning — видеолекция об основах Microsoft Azure Machine Learning с портала Microsoft Virtual Academy.
Data engineering
Обзоры
Лучшие материалы за неделю от KDnuggets.com (18 — 24 января)
Новости Data Science от MyDataMine.com (29 января)
Новости Big Data от MyDataMine.com (26 января)
Еженедельный дайджест от DataScienceCentral (5 февраля)
Лучшие ресурсы за неделю от Data Elixir (№20)
Еженедельный сборник лучших материалов от R1Soft (30 января)
Наиболее интересные материалы по High Scalability (30 января)
Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №32 (19 — 25 января 2015)
Автор: moat