Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Общее
Корпорация IBM открыла доступ к Watson Analytics для всех
Искусственный интеллект нам не угроза
Начните использовать машинное обучение сегодня — хороший пост от автора блога MachineLearningMastery, который поможет новичкам достаточно быстро освоить базовые вещи из области машинного обучения и начать использование алгоритмов машинного обучения на практике.
Компания Baidu аносировала прорыв в области распознавания речи и утверждает, что обошла в этом вопросе Google и Apple
10 лучших Big Data стартапов в 2014 году
5 Deep Learning стартапов, за которыми стоит следить в 2015 году
IBM Watson Analytics против Microsoft Azure Machine Learning (часть 1) — сравнение двух аналитических систем от авторов блога KDnuggets.com.
Data Mining (и Statistical Analysis) наиболее востребованные навыки по данным LinkedIn за 2014 год
Наиболее востребованные навыки в Data Science и Data Mining — интересное исследование от авторов блога KDnuggets.com.
Список инструментов по машинному обучению с открытым исходным кодом от KDnuggets.com
Лучшие проекты по визуализации данных в 2014 году
22 ключевых термина в области больших данных, которые должен понимать каждый
Инфографика от IBM Big Data & Analytics Hub: четыре V в области больших данных
Прогнозы на 2015 год в области Big Data от Big Data Analytics News
Список ресурсов по R за 2014 год от Revolution Analytics
Что каждая библиотека машинного обучения может позаимствовать у Vowpal Wabbit
Основные тенденции машинного обучения в 2014 году на основе результатов прошедшей конференции «Neural Information Processing Systems (NIPS) 2014»
Список полезных ресурсов по R от DZone.com
Прогнозы на 2015 год в области Big Data
6 прогнозов в сфере Big Data на 2015 год от Information Week
Основные тендеции Data Science на 2015 год от Analytics Vidhya
Анонс новой версии BabelNet — статья о выходе версии 3.0 популярного многоязыкового словаря и семантической сети BabelNet, в которой присутствует также и русский язык.
Анонс Apache Spark 1.2
Htmlwidgets for R: библиотека для визуализациии данных в R с помощью JavaScript
Научный подход к решению проблем анализа данных
Теория и алгоритмы машинного обучения, примеры кода
Руководство хакера по нейронным сетям. Схемы реальных значений. Шаблоны в «обратном» потоке. Пример «Один нейрон»
Нефтяные ряды в R
Сканеры безопасности: автоматическая валидация уязвимостей с помощью нечетких множеств и нейронных сетей
Реализация линейной регрессии на Python
Анализ тональности текста (Sentiment Analysis) с помощью kimono и MonkeyLearn
Оптимизация использования памяти в R — полезная статья с популярного блога Yhat, посвященная оптимизации использования оперативной памяти в языке программирования R.
Иерархическая кластеризация с помощью R (с использованием D3.js и Shiny)
Ask a Data Scientist: Ensemble Methods — очередная статья с популярного портала insideBIGDATA из цикла «Ask a Data Scientist», в данном выпуске речь пойдет о таком понятии как Ensemble Methods.
Соревнования по машинному обучению
Онлайн-курсы, обучающие материалы и литература
Онлайн-курс Stepic: Основы статистики — курс знакомит слушателей с основными понятиями и методами математической статистики.
Data Analyst Nanodegree от Udacity — краткий обзор программы Data Analyst Nanodegree от Udacity.
Курс по визуализации данных с помощью D3.js — не так давно на сайте онлайн-обучения Udacity появился новый достаточно любопытный курс, созданный совместно с Zipfian Academy и посвященный теме визуализации данных и использованию популярной библиотеки визуализации D3.js.
Список книг по практическому машинному обучению — хороший список книг по практического машинному обучению от автора блога MachineLearningMastery.
14 лучших книг по Big Data в 2014 году
Обзор книги «Introduction to Data Science with R»
Обзор книги «Data Science at the Command Line»
Бесплатная электронная книга «Big Data Basics»
Бесплатная электронная книга «Big Data Analytics for Dummies»
Бесплатная электронная книга «Practical Machine Learning: Innovations in Recommendation»
Видеоматериалы
Видео докладов Badoo с конференции Highload 2014
Моделирование данных в NoSQL — в данном видео Jan Steemann (Senior Developer, triAGENS) расскажет о том, как правильно моделировать данные в NoSQL хранилищах и представит несколько наглядных практических примеров.
Apache Cassandra для новичков — в данном посте представлено две видеолекции, которые помогут разобраться в базовых концепциях Apache Cassandra.
IBM Watson в действии
Data engineering
Обработка данных NBA за 30 лет с помощью MongoDB Aggregation
Краткое введение в экосистему Hadoop
10 прогнозов по экосистеме Hadoop на 2015 год
Почему 2015 будет годом NoSQL
SparkOnHBase от Cloudera — статья про интересный проект от компании Cloudera под названием SparkOnHBase с примерами использования.
16 NoSQL хранилищ, за которыми стоит следить — полезный список из 16 NoSQL хранилищ с небольшим описанием каждого с блога KDnuggets.com.
Введение в NoSQL — неплохой краткий рассказ про NoSQL хранилища от автора блога Analytics Vidhya.
Прогнозы на 2015 год в области хранилищ данных от DataVersity
10 лучших постов с блога Cloudera в 2014 году
Обзоры
Интересное из мира R (15-21 декабря 2014 г.)
Еженедельный дайджест от DataScienceCentral (22 декабря)
Лучшие материалы за неделю от KDnuggets.com (7 — 14 декабря)
Еженедельный сборник лучших материалов от R1Soft (19 декабря)
Лучшие ресурсы за неделю от Data Elixir (№14)
Наиболее интересные материалы от Freakonometrics №193
Наиболее интересные материалы от Freakonometrics №194
Наиболее интересные материалы по High Scalability (19 декабря)
Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №26 (8 — 14 декабря 2014)
Автор: moat