Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Общее
- Пять наиболее важных событий в мире R по итогам 2014 г.
- Как Deep Learning может в будущем быть использован в различных сферах жизнедеятельности
- Список ресурсов по машинному обучению — отличный список ресурсов по машинному обучению разбитый на несколько тематических категорий (Deep Learning, Online Learning, Ensemble Methods, Kernel Machines, GPU Learning, NLP и др.)
- Анонс Spark Packages — анонс Spark Packages: сборник различных библиотек с открытым исходным кодом для Apache Spark.
- Интерактивная трехмерная визуализация различных наборов данных в браузере с помощью data-projector
- Прогнозы на 2015 год: что случится с Big Data и Data Science? — еще один прогноз на наступающий год от популярного портала KDnuggets.com.
- 7 лучших ресурсов 2014 года по Big Data от SmartData Collective
- 8 предсказаний по теме Big Data на 2015 год от SmartData Collective
- 4 шага к успеху в области Big Data в 2015 году
- 10 лучших статей 2014 года по теме Data Science с блога Analytics Vidhya
Теория и алгоритмы машинного обучения, примеры кода
- Руководство хакера по нейронным сетям. Глава 2: Машинное обучение. Бинарная классификация
- Руководство хакера по нейронным сетям. Глава 2: Машинное обучение. Обучение сети на основе метода опорных векторов (SVM)
- Обзор алгоритмов сжатия графов
- InterSystems iKnow. Загружаем данные из Вконтакте
- Линейная алгебра в машинном обучении — автор блога MachineLearningMastery рассказывает о том, какие аспекты линейной алгебры полезно знать для лучшего понимания алгоритмов машинного обучения.
- Сбор и анализ данных бейсбольной статистики с помощью R
- Деревья принятия решений: наращивание и отсечение ветвей
- Использование метода опорных компонент (Principal Component Analysis) при работе с изображениями
- Распознавание рукописных цифр с помощью R (часть 1)
- Сравнение работы с Dataframe в Python, R и Julia
- Пример создания предсказательных моделей с помощью библиотеки caret — пример использования популярной библиотеки caret для языка программирования R для создания предсказательных моделей.
- Расширенная версия шпаргалки по scikit-learn
- Набор для машинного обучения — большой полезный набор различных ссылок на материалы по машинному обучению (в том числе и на русском языке).
- Визуализация данных с помощью GAE Python, D3.js и Google BigQuery (часть 1)
- Визуализация данных с помощью GAE Python, D3.js и Google BigQuery (часть 2)
- Визуализация данных с помощью GAE Python, D3.js и Google BigQuery (часть 3)
- Пример использования Spark (часть 3): очистка и сортировка номеров Social Security
- Пример кода: применение функции к каждой строке в data.frame
Соревнования по машинному обучению
- Как подходить к решению проблем на Kaggle — набор простых советов от автора блога Analytics Vidhya, которые помогут стать успешным участником соревнований по машинному обучению на Kaggle.
- Интервью с Yann LeCun: сверточные сети и CIFAR-10 — интересное интервью с Yann LeCunn (Director of AI Research, Professor at New York University), посвященное вопросам использования сверточных сетей и обсуждению недавно завершившегося соревнования по машинному обучению CIFAR-10 на Kaggle, которое было посвящено вопросам распознавания изображений.
- Анализ данных Kaggle с помощью R — интересный анализ данных соревнований по машинному обучению на Kaggle, проведенный с помощью языка программирования R.
Онлайн-курсы, обучающие материалы и литература
- Анонс нового онлайн-курса «Statistics and R for the Life Sciences» — интересный курс под названием «Statistics and R for the Life Sciences» от Harvard University анонсирован на edX.
- Материалы курса «Convex Optimization» от Carnegie Mellon University
- Набор лекций с курса «Principles of Distributed Computing» (ETH Zürich)
Видеоматериалы
- Основные ловушки проектов машинного обучения — интересное выступление «Machine Learning Gremlins» Ben Hammer и комментарии от автора блога MachineLearningMastery.
- Машинное обучение с помощью статистических и казуальных методов — ссылка на видео выступления «Statistical and causal approaches to machine learning» от Bernhard Scholkopf и комментарии автора блога MachineLearningMastery к нему.
Data engineering
Обзоры
- Дайджест лучших ресурсов от DataScienceCentral (29 декабря)
- Лучшие материалы за неделю от KDnuggets.com (14 — 20 декабря)
- Еженедельный сборник лучших материалов от R1Soft (26 декабря)
- Лучшие ресурсы за неделю от Data Elixir (№15)
- Наиболее интересные материалы от Freakonometrics №195
- Наиболее интересные материалы от Freakonometrics №196
- Наиболее интересные материалы от Freakonometrics №197
Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №27 (15 — 21 декабря 2014)
Автор: moat
ScholarsPro is a prominent name in the online training industry, known for its world-class training and consulting solutions for internationally recognized certifications and leading technologies such as Big Data Hadoop, SAS, Python, Data Science, ITIL, PRINCE2, Scrum, PMP, and many more. With a powerful team comprising of international scholars, certified trainers, and industry experts, ScholarsPro stands strong in the training and consulting sector, assisting professionals from diverse industry domains from all over the world, fulfill their professional development endeavors.
URL: https:www.scholarspro.com