Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Общее
Машинное обучение в сфере онлайн знакомств
Искусственный интеллект может смотреть видео и описывать то, что видит — любопытный пост с коротким видео о стартапе Clarify, который специализируется в области искусственного интеллекта и разрабатывает продукт, который может описывать то, что происходит в предложенных видеороликах, на основе использования алгоритмов Deep Learning.
Четыре отличных визуализации данных
6 советов, которые помогут стать отличным специалистом в области Data Science
Один из создателей Google Brain рассказывает, почему он в данный момент работает над созданием китайских нейронных сетей — интересное интервью с Andrew Ng.
Почему многие специалисты в области анализа данных выбирают Python? — интересный вопрос, заданный на Quora, и несколько полезных ответов.
Data Science: Должен ли я изучать Python или R?
Почему сейчас самое время изучать язык программирования R
Теория и алгоритмы машинного обучения, примеры кода
Пример Feature Engineering в машинном обучении
Система автоматической оценки возраста по изображениям лиц
Как работает алгоритм распознавания музыки Shazam
Практический Data Science с помощью Python
Серия уроков по машинному обучению и обработке естественного языка. Урок 1: Работа с текстом
Понимание текста с нуля — публикация от Xiang Zhang и Yann LeCun на тему использования сверточных нейронных сетей для анализа текста.
Пара слов о Shiny — небольшой пост, который расскажет о популярной библиотеке визуализации Shiny для языка программирования R и возможностях публикации своих Shiny-приложений на портале Shinyapps.io.
Quickcheck: рандомизированное юнит-тестирование для R — короткий пост об интересной библиотеке юнит-тестирования для языка программирования R.
Анализ данных с помощью Pandas — небольшой пример использования библиотеки Pandas, написанной для языка программирования Python, для анализа данных.
Результат машинного обучения
Онлайн-курсы, обучающие материалы и литература
Видеоматериалы, подкасты
Partially Derivative: Эпизод 12: Partially Deflated — очередной эпизод популярного подкаста «Partially Derivative».
Data engineering
Google снова зафиксировал наибольшие квартальные траты на дата-центры
Сможет ли Microsoft Cosmos составить конкуренцию Hadoop
Использование Apache Crunch для обработки данных в Spotify — интересная статья, для тех кто использует MapReduce еще не готов использовать Apache Spark, но хочет получить схожие функции.
Опубликован Apache Hive 1.0.0
Обзоры
Интересное из мира R (2-8 февраля 2015 г.)
Интересное из мира R (26 января — 1 февраля 2015 г.)
Лучшие материалы за январь от KDnuggets.com
Лучшие материалы за неделю от KDnuggets.com (25 — 31 декабря)
Дайджест лучших ресурсов от DataScienceCentral (5 февраля)
Новости Data Science от MyDataMine.com (6 февраля)
Новости Big Data от MyDataMine.com (3 февраля)
Еженедельный сборник лучших материалов от R1Soft (6 февраля)
Лучшие ресурсы за неделю от Data Elixir (№21)
Этот месяц в экосистеме Hadoop (январь 2015)
Наиболее интересные материалы по High Scalability (6 февраля)
Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №33 (26 января — 1 февраля 2015)
Автор: moat