Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Общее
- Корпорация IBM открыла доступ к Watson Analytics для всех
- Искусственный интеллект нам не угроза
- Начните использовать машинное обучение сегодня — хороший пост от автора блога MachineLearningMastery, который поможет новичкам достаточно быстро освоить базовые вещи из области машинного обучения и начать использование алгоритмов машинного обучения на практике.
- Компания Baidu аносировала прорыв в области распознавания речи и утверждает, что обошла в этом вопросе Google и Apple
- 10 лучших Big Data стартапов в 2014 году
- 5 Deep Learning стартапов, за которыми стоит следить в 2015 году
- IBM Watson Analytics против Microsoft Azure Machine Learning (часть 1) — сравнение двух аналитических систем от авторов блога KDnuggets.com.
- Data Mining (и Statistical Analysis) наиболее востребованные навыки по данным LinkedIn за 2014 год
- Наиболее востребованные навыки в Data Science и Data Mining — интересное исследование от авторов блога KDnuggets.com.
- Список инструментов по машинному обучению с открытым исходным кодом от KDnuggets.com
- Лучшие проекты по визуализации данных в 2014 году
- 22 ключевых термина в области больших данных, которые должен понимать каждый
- Инфографика от IBM Big Data & Analytics Hub: четыре V в области больших данных
- Прогнозы на 2015 год в области Big Data от Big Data Analytics News
- Список ресурсов по R за 2014 год от Revolution Analytics
- Что каждая библиотека машинного обучения может позаимствовать у Vowpal Wabbit
- Основные тенденции машинного обучения в 2014 году на основе результатов прошедшей конференции «Neural Information Processing Systems (NIPS) 2014»
- Список полезных ресурсов по R от DZone.com
- Прогнозы на 2015 год в области Big Data
- 6 прогнозов в сфере Big Data на 2015 год от Information Week
- Основные тендеции Data Science на 2015 год от Analytics Vidhya
- Анонс новой версии BabelNet — статья о выходе версии 3.0 популярного многоязыкового словаря и семантической сети BabelNet, в которой присутствует также и русский язык.
- Анонс Apache Spark 1.2
- Htmlwidgets for R: библиотека для визуализациии данных в R с помощью JavaScript
- Научный подход к решению проблем анализа данных
Теория и алгоритмы машинного обучения, примеры кода
- Руководство хакера по нейронным сетям. Схемы реальных значений. Шаблоны в «обратном» потоке. Пример «Один нейрон»
- Нефтяные ряды в R
- Сканеры безопасности: автоматическая валидация уязвимостей с помощью нечетких множеств и нейронных сетей
- Реализация линейной регрессии на Python
- Анализ тональности текста (Sentiment Analysis) с помощью kimono и MonkeyLearn
- Оптимизация использования памяти в R — полезная статья с популярного блога Yhat, посвященная оптимизации использования оперативной памяти в языке программирования R.
- Иерархическая кластеризация с помощью R (с использованием D3.js и Shiny)
- Ask a Data Scientist: Ensemble Methods — очередная статья с популярного портала insideBIGDATA из цикла «Ask a Data Scientist», в данном выпуске речь пойдет о таком понятии как Ensemble Methods.
Соревнования по машинному обучению
Онлайн-курсы, обучающие материалы и литература
- Онлайн-курс Stepic: Основы статистики — курс знакомит слушателей с основными понятиями и методами математической статистики.
- Data Analyst Nanodegree от Udacity — краткий обзор программы Data Analyst Nanodegree от Udacity.
- Курс по визуализации данных с помощью D3.js — не так давно на сайте онлайн-обучения Udacity появился новый достаточно любопытный курс, созданный совместно с Zipfian Academy и посвященный теме визуализации данных и использованию популярной библиотеки визуализации D3.js.
- Список книг по практическому машинному обучению — хороший список книг по практического машинному обучению от автора блога MachineLearningMastery.
- 14 лучших книг по Big Data в 2014 году
- Обзор книги «Introduction to Data Science with R»
- Обзор книги «Data Science at the Command Line»
Бесплатная электронная книга «Big Data Basics»
Бесплатная электронная книга «Big Data Analytics for Dummies»
Бесплатная электронная книга «Practical Machine Learning: Innovations in Recommendation»
Видеоматериалы
- Видео докладов Badoo с конференции Highload 2014
- Моделирование данных в NoSQL — в данном видео Jan Steemann (Senior Developer, triAGENS) расскажет о том, как правильно моделировать данные в NoSQL хранилищах и представит несколько наглядных практических примеров.
- Apache Cassandra для новичков — в данном посте представлено две видеолекции, которые помогут разобраться в базовых концепциях Apache Cassandra.
- IBM Watson в действии
Data engineering
- Обработка данных NBA за 30 лет с помощью MongoDB Aggregation
- Краткое введение в экосистему Hadoop
- 10 прогнозов по экосистеме Hadoop на 2015 год
- Почему 2015 будет годом NoSQL
- SparkOnHBase от Cloudera — статья про интересный проект от компании Cloudera под названием SparkOnHBase с примерами использования.
- 16 NoSQL хранилищ, за которыми стоит следить — полезный список из 16 NoSQL хранилищ с небольшим описанием каждого с блога KDnuggets.com.
- Введение в NoSQL — неплохой краткий рассказ про NoSQL хранилища от автора блога Analytics Vidhya.
- Прогнозы на 2015 год в области хранилищ данных от DataVersity
- 10 лучших постов с блога Cloudera в 2014 году
Обзоры
- Интересное из мира R (15-21 декабря 2014 г.)
- Еженедельный дайджест от DataScienceCentral (22 декабря)
- Лучшие материалы за неделю от KDnuggets.com (7 — 14 декабря)
- Еженедельный сборник лучших материалов от R1Soft (19 декабря)
- Лучшие ресурсы за неделю от Data Elixir (№14)
- Наиболее интересные материалы от Freakonometrics №193
- Наиболее интересные материалы от Freakonometrics №194
- Наиболее интересные материалы по High Scalability (19 декабря)
Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №26 (8 — 14 декабря 2014)
Автор: moat