Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Общее
- Обзорные онлайн-курсы по математике
- Как отследить каждый бросок в НБА?
- Data Scientist в 2015 году — занимательная инфографика.
- Системы компьютерного зрения Microsoft превосходят результаты человека — исследователи из Microsoft не так давно выпустили публикацию, в которой они описывают разработанную систему, которая превосходит результаты человека в области распознавания изображений на популярном наборе данных ImageNet.
- Deep learning модули с открытым исходным кодом для библиотеки Torch от Facebook
- 10 вещей полезных при анализе данных, которым нас научила статистика
- Data Science: использование Python, R и SQL
- Torch против Theano — сравнение производительности двух популярных библиотек для Deep Learning.
- Два основных инструмента анализа данных для задач сравнения различных наборов данных
Теория и алгоритмы машинного обучения, примеры кода
- Чтобы распознавать картинки, не нужно распознавать картинки
- Как начать развиваться с сфере анализа данных — данная статья с блога популярного портала онлайн обучения Udacity может помочь новичкам в своем развитии в области анализа данных.
- Введение в анализ данных на Python
- Обработка данных с помощью R — неплохое введение в анализ данных с помощью языка программирования R.
- Введение в обучение с учителем (Supervised Learning) — слайды с доклада Sebastian Raschka: «An Introduction to Supervised Machine Learning and Pattern Classification: The Big Picture».
- Создание веб-сервиса с помощью R и Azure Machine Learning
- Визуализация работы метода главных компонент
- Иллюстрация работы метода главных компонент (PCA)
- Нейронная сеть при помощи NumPy
- R для распределенных вычислений — отчет о недавно прошедшем семинаре, который был посвящен теме использования языка программрования R для распределенных вычислений.
- Краткое введение в Weka
- Deep learning для распознавания речи — список публикаций, посвященных использованию Deep learning для расознавания речи.
- Серия уроков по машинному обучению и обработке естественного языка. Урок 2: Вероятность
Онлайн-курсы, обучающие материалы и литература
- Основы статистики: просто о сложных формулах
- Data Mining Specialization на Coursera — 9 февраля Coursera совместно с University of Illinois at Urbana-Champaign запустили новую специализацию под названием «Data Mining Specialization».
- Artficial Intelligence от UC Berkley — 6 февраля начался на edX очень интересный курс, посвященный теме искусственного интеллекта: CS188: Introduction to Artificial Intelligence. Курс представлен университетом UC Berkley.
- Начался онлайн-курс «Introduction to Probability — The Science of Uncertainty» от MIT — 3 февраля на edX началась очередная сессия курса, посвященного теории вероятностей, и представленного Massachusetts Institute of Technology: Introduction to Probability — The Science of Uncertainty.
- Книга: Learning Spark
Видеоматериалы, подкасты
- Внутреннее устройство Apache Spark — интересное видео по теме Apache Spark, Dean Chen (Software engineer, eBay) рассказывает о внутреннем устройстве Apache Spark.
- Что ждет Apache Spark в 2015 году — интересное видео с недавнего митапа «What's coming for Spark in 2015», прошедшего в офисе компании Databricks в Сан-Франциско, в котором Patrick Wendell из Databricks рассказал о ближайших планах развития Apache Spark.
- Использование Deep Learning для обработки текста
- Talking Machines: Эпизод 4: Интервью с Hanna Wallach — четвертый эпизод серии подкастов «Talking Machines», в данном случае это интервью с Hanna Wallach (Microsoft Research и Professor, Department of Computer Science, University of Massachusetts Amherst), в данном эпизоде затронуты такие темы, как масштабирование, размер наборов данных и другие.
- Машинное обучение с использованием F# — в очередном выпуске подкаста «The F# Show» Richard Minerich расскажет о своем опыте машинное обучения с использованием функционального языка программирования F#.
Data engineering
- Apache Spark продолжает развиваться за пределами экосистемы Hadoop
- Couchdoop: совместная работа Couchbase и Hadoop
Обзоры
- Новости Data Science от MyDataMine.com (13 февраля)
- Новости Big Data от MyDataMine.com (10 февраля)
- Лучшие ресурсы за неделю от Data Elixir (№22)
- Еженедельный сборник лучших материалов от R1Soft (13 февраля)
- Наиболее интересные материалы по High Scalability (13 февраля)
Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №34 (2 — 8 февраля 2015)
Автор: moat