Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Общее
- Почему стоит изучать R, если вы решили заняться «наукой о данных»
- Постер Data Science
- Глубокие недостатки глубокого обучения — интересная статья с блога KDnuggets о потенциальных недостатках популярного метода машинного обучения Deep Learning.
- Может ли Microsoft сделать R простым?
- Большой список ресурсов по теме искусственного интеллекта — здесь есть ссылки на курсы, книги, ресурсы по программированию, примеры кода и еще масса других интересных ссылок по теме AI.
- О машинном обучении простым языков — краткая статья об основах машинного обучения от авторов блога Analytics Vidhya.
- Новичок в теме Deep Learning? Вот 4 простых урока от Google
- Big Data: 5 ведущих компаний и их планы на 2015 год
Теория и алгоритмы машинного обучения, примеры кода
- Линейная регрессия на R — в данной публикации описаны 4 способа использования линейной регрессии в языке программирования R.
- Когда данных действительно много: Vowpal Wabbit
- Deep learning и Caffe на новогодних праздниках
- Word2Vec в примерах
- Проект Providence: Использование машинного обучения в работе Stack Exchange
- Создание предсказательной модели в Azure ML — пошаговый пример создания предсказательной модели в набирающем популярность облачном продукте Microsoft Azure Machine Learning.
- Слежение за объектом в реальном времени с дрона с использованием Python и OpenCV
- Eigenfaces: создание призрачных образов из набора лиц — достаточно интересная статья, посвященная одному из теоретических аспектов распознавания лиц.
- Статистический взгляд Deep Learning (часть 1): рекурсивные обобщенные линейные модели (Recursive GLMs)
- Пример реализации комитета алгоритмов с помощью scikit-learn — очередная хорошая статья от Sebastian Raschka, в данном случае это пример реализации комитета алгоритмов, а именно Weighted Majority Rule Ensemble Classifier с использованием библиотеки scikit-learn.
- Пример предсказательной модели в R: кластеризация по сходству тэгов — небольшой пример кода на R по кластеризации данных от автора библиотеки Caret.
- spaCy: современная библиотека для обработки естественного языка — интересная библиотека для NLP с использованием Python.
- Параллельное программирование с использованием GPU и R
- Введение в потоковый метод k-средних в Apache Spark 1.2
- Краткое введение в линейную регрессию
- Использование Apache Hadoop для предсказания задержек авиарейсов (часть 3) — третья часть серии статей с блога компании Hortonworks о практическом использовании Apache Hadoop для предсказания задержек авиарейсов.
- Deep learning для обработки естественного языка: подборка недавних публикаций
- Что такое обучение с учителем (Supervised learning) и обучение без учителя (Unsupervised learning)
Соревнования по машинному обучению
- Интервью с победителями соренования «American Epilepsy Society Seizure Prediction Challenge» на Kaggle
- Обучаемый персептрон в соревнованиях по машинному обучению
Онлайн-курсы, обучающие материалы и литература
- Начало курса «Линейная алгебра» на Coursera — 2 февраля на Coursera начнется русскоязычный курс, посвященный линейной алгебре и представленный НИУ «Высшая школа экономики».
- DataQuest: онлайн-обучение машинному обучению — не так давно запущенная англоязычная бесплатная платформа для изучения Data Science с использованием Python.
- Стартовал онлайн-курс «Linear Algebra — Foundations to Frontiers» — 28 января на edX начался курс по основам линейной алгебры от «The University of Texas at Austin: Linear Algebra — Foundations to Frontiers».
- Coding the Matrix на Coursera — и еще один курс, посвященный линейной алгебре, начнется в ближайшие дни на Coursera: «Coding the Matrix: Linear Algebra through Computer Science Applications».
- Обзор книги: Getting started with data science in the cloud
- Книга: Beginning Data Science with R
Видеоматериалы, подкасты
- Введение в Deep Learning от Nando de Freitas — интересное видео от Dr. Nando de Freitas (Adjunct Professor at UBC Computer Science, Full-time Professor at Oxford). В данном случае это лекция по основам Deep Learning.
- Talking Machines: Эпизод 3: Интервью с Kevin Murphy — третий эпизод «Talking Machines», в данном случае это интервью с Kevin Murphy (Research Scientist, Google), в данном эпизоде затронуты такие темы, как использование Torch, PyMC, Weka, Theano, Caffe и другие.
- Введение в Microsoft Azure Machine Learning — видеолекция об основах Microsoft Azure Machine Learning с портала Microsoft Virtual Academy.
Data engineering
Обзоры
- Лучшие материалы за неделю от KDnuggets.com (18 — 24 января)
- Новости Data Science от MyDataMine.com (29 января)
- Новости Big Data от MyDataMine.com (26 января)
- Еженедельный дайджест от DataScienceCentral (5 февраля)
- Лучшие ресурсы за неделю от Data Elixir (№20)
- Еженедельный сборник лучших материалов от R1Soft (30 января)
- Наиболее интересные материалы по High Scalability (30 января)
Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №32 (19 — 25 января 2015)
Автор: moat