Обзор наиболее интересных материалов по анализу данных и машинному обучению №15 (22 — 28 сентября 2014)

в 14:32, , рубрики: big data, data mining, data science, data science digest, machine learning, высокая производительность

Обзор наиболее интересных материалов по анализу данных и машинному обучению №15 (22 — 28 сентября 2014)
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.

Общее

Соревнования по машинному обучению

  • EN Python Опыт от участия в «Display Advertising Challenge»
    Интересная статья про опыт, полученный от участия в соревновании по машинному обучению «Display Advertising Challenge» на Kaggle, которое закончилось совсем недавно.
  • EN R Использование R, H2O и Domino на Kaggle
    Интересная статья про использование языка программирования R совместно с Domino и H2O в соревновании по машинному обучению под названием «Africa Soil Property Prediction Challenge» на Kaggle.

Онлайн-курсы и обучающие материалы

  • EN Онлайн-курс «Statistical Learning»
    В январе 2014 Стэнфордский университет провел онлайн-курс, основанный на новой книге «An Introduction to Statistical Learning with Applications in R» (ISLR). В данном посте будут представлены видеоматериалы и презентации с данного курса.
  • EN Онлайн-курс «The Caltech-JPL Summer School on Big Data Analytics»
    Достаточно необычный онлайн-курс стартовал в середине сентября на Coursera. По сути, это набор видеолекций и материалов с летней школы машинного обучения от California Institute of Technology.
  • EN Онлайн-курс «Learning From Data»
    На днях на edX стартовала новая сессия данного очень популярного курса по машинному обучению от California Institute of Technology и профессора Yaser Abu-Mostafa в качестве основного инструктора.

Литература

  • EN Обзор книги «Frequent Pattern Mining»
    Обзор книги «Frequent Pattern Mining», вышедшей в 2014 году, от портала KDnuggets.
  • EN Книга «R for Cloud Computing»
    Анонс очень любопытной книги по облачным вычислениям с использованием языка программирования R, которая достаточно скоро появится в продаже.

Теория и алгоритмы машинного обучения, примеры кода

  • EN Что такое Feature Engineering
    Отличная статья от автора блога MachineLearningMastery о процессе Feature Engineering в машинном обучении.
  • EN Динамическое обучение и Sub-Linear Debugging
    Очередная статья с блога Microsoft Technet Machine Learning. На этот раз в статье будет затронута тема динамического обучения (Online Learning) и Sub-Linear Debugging.
  • EN Теория Введение в метод опорных векторов
    Очень простое и краткое введение в метод опорных веторов (Support Vector Machines).
  • EN Для новичков Python Обработка данных с помощью Python
    Данная статья с блога Analytics Vidhya расскажет об обработке данных с помощью языка программирования Python и библиотеки Pandas.
  • EN R Сравнение и выбор обучающих моделей с помощью R Caret
    Очередная статья от автора блога MachineLearningMastery, посвященная возможностям библиотеки машинного обучения Caret для языка программирования R. В данном случае речь пойдет о сравнении обучающих моделей и выборе наиболее эффективной.
  • EN R Как опубликовать графики ggplot2
    Полезная статья, рассказывающая о том, как опубликовать графики, сделанные с помощью библиотеки ggplot2 для языка программирования R, в виде веб-страницы.
  • EN R Работа с Twitter через REST API и R
    Неплохая статья, описывающая возможность работы с данными Twitter через REST API с помощью библиотеки RTwitterAPI для языка программирования R.
  • EN R Выбор параметров с помощью R Caret
    Автор блога MachineLearningMastery рассказывает о функциональности по выбору признаков (Feature Selection) в популярной библиотеке по машинному обучению Caret для языка программирования R.
  • EN R Факторы не являются объектами первого класса в R
    Достаточно большая статья, описывающая тонкости и возможные проблемы в работе с факторами в языке программирования R.
  • EN R Управление зависимостями в R
    Интересная статья про управления зависимостями между библиотеками в языке программирования R, а также о визуализации этих данных о зависимостях между библиотеками.

Видеоматериалы

Data engineering

Обзоры

Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №14 (15 — 21 сентября 2014)

Автор: moat

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js