Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Общее
Как говорить на языке «Data Science»
Бонд. Джеймс Бонд. Роботизированная подделка почерка для маркетологов и социальных инженеров
Седьмая ежегодная Летняя школа Microsoft Research по машинному обучению и интеллекту — сотрудничество с ACM Europe
Google хочет измерять важность сайтов по фактам, а не ссылкам
Wargaming и «Яндекс» сотрудничают в области Big Data
Кто собирается заработать на грядущем буме систем искусственного интеллекта?
EBay выпустила инструмент с открытым программным кодом Pulsar для укрощения больших данных
Лицензирование доступа к Big Data как средство монетизации Twitter
Почему Apache Spark меняет Кремниевую долину
Как стать специалистом в области машинного обучения — несколько полезных советов новичкам в области машинного обучения от автора блога MachineLearningMastery, которые помогут тем кто хочет построить карьеру в данной области, но не знает с чего начать.
8 причин популярности Apache Spark
Три технологии, которые изменят интернет — несколько слов о популряных сейчас технологиях, основанных на использовании машинного обучения: распознавание речи, поиск изображений и анализ видео.
Как PayPal использует Deep Learning для борьбы с мошенничеством
IBM приобретает Deep Learning стартап AlchemyAPI
Три ключевых шага для построения предсказательных приложений на основе машинного обучения
Библиотека spragunr: Реализация алгоритма Deep Q-learning на базе библиотеки Theano
Теория и алгоритмы машинного обучения, примеры кода
Поиск текстов, не соответствующих тематике и нахождение похожих статей
Social Network Analysis: Spark GraphX
Создание карты музыкальных композиций — интересный пример визуальной классификации музыкальных композиций с помощью машинного обучения и использования языка программирования Python.
Факторный анализ
R: Построение графиков с помощью встроенной функциональности визуализации — при упоминании темы визуализации с помощью языка программирования R часто говорят о библиотеке ggplot, но не стоит забывать о встроенных возможностях визуализации Base R Plots.
Ловушки машинного обучения. Измерение эффективности модели (Часть 1) — обсуждение безусловно важной темы измерения эффективности работы вашей предсказательной модели.
Тренировка модели методом градиентного спуска с использованием C#
Обработка естественного языка с помощью глубинных нейронных сетей и библиотеки Torch
Интерактивные визуализации с помощью D3.js, DC.js, Python и MongoDB
Пример расчета PageRank с помощью Apache Hadoop
Онлайн-курсы, обучающие материалы и литература
Онлайн-курс от Stanford University: Deep Learning for Natural Language Processing
Онлайн-курс от MIT на edX: Introduction to Computational Thinking and Data Science
Онлайн-курс от MIT на edX: The Analytics Edge
Онлайн-курс на Coursera: Data Analysis and Statistical Inference
Обзор книг «Time Series Databases» и «New look at Anomaly detection»
Бесплатная онлайн-книга: Kalman and Bayesian Filters in Python
Обзор бесплатной книги: The Data Analytics Handbook: Big Data Edition
Видеоматериалы, подкасты
Data engineering
Использование Apache Storm для аналитики в реальном времени
Использование MongoDb с Hadoop и Spark: Часть 2 — пример работы с Hive
Использование MongoDb с Hadoop и Spark: Часть 3 — пример работы со Spark и ключевые выводы
Обзоры
Интересное из мира R (2-8 марта 2015 г.)
Лучшие материалы за неделю от KDnuggets.com (22-28 февраля)
Лучшие материалы за февраль от KDnuggets.com
Еженедельный дайджест от DataScienceCentral (9 марта)
Новости Data Science от MyDataMine.com (8 марта)
Новости Big Data от MyDataMine.com (8 марта)
Лучшие ресурсы за неделю от Data Elixir (№25)
Еженедельный сборник лучших материалов от R1Soft (6 марта)
Этот месяц в экосистеме Hadoop (февраль 2015)
Новости экосистемы Hadoop от MyDataMine.com (3 марта)
Наиболее интересные материалы по High Scalability (6 марта)
Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №37 (23 февраля — 1 марта 2015)
Автор: moat