Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Общее
Анализ Вконтакте на примере книжных предпочтений участников культурных сообществ
Список ресурсов по Deep Learning — хороший список ссылок на различные полезные ресурсы по теме Deep Learning.
Защита вашего онлайн-сервиса с помщью машинного обучения и больших данных
Talking Machines — интересный сайт под названием «Talking Machines», на котором регулярно будут публиковаться интервью с известными экспертами в области машинного обучения.
7 лучших постов с блога «Beautiful Data» за 2014 год
Прогнозы на рынок труда в области Big Data в 2015 году
5 тенденций Big Data, на которые стоит обратить внимание в 2015 году
Прогнозы на 2015 в сфере Big Data от Big Data Analytics News
10 лучших статей за год с блога «Microsoft Technet Machine Learning»
Лучшие материалы за год: NoSQL Zone
Теория и алгоритмы машинного обучения, примеры кода
Руководство хакера по нейронным сетям. Глава 2: Машинное обучение. Обобщаем SVM до нейронной сети
Руководство хакера по нейронным сетям. Глава 2: Машинное обучение. Более традиционный подход: Функции потерь
Играем с генетическими алгоритмами
Анализ тональности текста в Excel с помощью Azure Machine Learning и Power Query
Ask a Data Scientist: Как стать Data Scientist — очередная статья с популярного портала insideBIGDATA из цикла «Ask a Data Scientist», в данном выпуске речь о том, как стать Data Scientist и какую деятельность подразумевает у профессия с таким названием.
Краткое введение в Deep Learning
Краткое введение в R — небольшая презентация по основам языка программирования R.
Построение детектора языка с помощью Python и scikit-learn
Шпаргалка по матричным операциям — хорошая шпаргалка по операциям с матрицами в MATLAB, Python, R и Julia.
11 видов переобучения (Overfitting) и советы по тому как их избегать
Классификация методом логистической регрессии и оптимизации методом роя частиц — статья из свежего выпуска MSDN Magazine — интересный пример классификации методом логистической регрессии с использованием оптимизации одного из подвида метода роя частиц, а именно Multi-Swarm Optimization (MSO). Примеры кода представлены на языке программирования C#.
Стохастический градиентный бустинг: выбор оптимального количества итераций
Визуализация данных с помощью GAE Python, D3.js и Google BigQuery (часть 4)
LambdaNet: библиотека AI на Haskell
Работа с Pivot Table в Pandas
Основы работы с изображениями в Python
Соревнования по машинному обучению
Вариант решения для соревнования по прогнозированию временных рядов — автор блога Wiekvoet в данном посте описывает один из вариантов решения для соревнования по машинному обучению, посвященного анализу временных рядов от Rob J Hyndman.
Интервью с победителями соревнования CIFAR-10 — еще одно интервью с участниками недавно завершившегося соревнования по машинному обучению CIFAR-10 на Kaggle, которое было посвящено вопросам распознавания изображений, в данном случае это интервью с победителями данного соревнования.
Онлайн-курсы, обучающие материалы и литература
Список литературы по машинному обучению от Michael I. Jordan (Berkley)
Обзор книги «Applied Predictive Analytics»
Список рекомендуемой литературы по эконометрике — очередной список литературы по эконометрике, которые советует к прочтению профессор Dave Giles.
Видеоматериалы
Демистификация нейронных сетей — cерия коротких обучающих видео по теме нейронных сетей.
Несколько интересных видео по теме Deep Learning — в данном посте представлена небольшая подборка из нескольких интересных видеоматериалов по теме Deep Learning.
Data engineering
Тенденции NoSQL в 2015 году от DataVersity
10 лучших статей за год по теме Hadoop с блога Hortonworks
Обзоры
Еженедельный дайджест от DataScienceCentral (5 января)
Лучшие материалы за неделю от KDnuggets.com (21 — 27 декабря)
Еженедельный сборник лучших материалов от R1Soft (2 января)
Лучшие ресурсы за неделю от Data Elixir (№16)
Новости Data Mining от MyDataMine.com (30 декабря)
Новости Big Data от MyDataMine.com (1 января)
Наиболее интересные материалы от Freakonometrics №198
Наиболее интересные материалы от Freakonometrics №199
Наиболее интересные материалы от Freakonometrics №200
Наиболее интересные материалы по High Scalability (2 января)
Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №28 (22 — 28 декабря 2014)
Автор: moat