Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Общее
- Машинное обучение в сфере онлайн знакомств
- Искусственный интеллект может смотреть видео и описывать то, что видит — любопытный пост с коротким видео о стартапе Clarify, который специализируется в области искусственного интеллекта и разрабатывает продукт, который может описывать то, что происходит в предложенных видеороликах, на основе использования алгоритмов Deep Learning.
- Четыре отличных визуализации данных
- 6 советов, которые помогут стать отличным специалистом в области Data Science
- Один из создателей Google Brain рассказывает, почему он в данный момент работает над созданием китайских нейронных сетей — интересное интервью с Andrew Ng.
- Почему многие специалисты в области анализа данных выбирают Python? — интересный вопрос, заданный на Quora, и несколько полезных ответов.
- Data Science: Должен ли я изучать Python или R?
- Почему сейчас самое время изучать язык программирования R
Теория и алгоритмы машинного обучения, примеры кода
- Пример Feature Engineering в машинном обучении
- Система автоматической оценки возраста по изображениям лиц
- Как работает алгоритм распознавания музыки Shazam
- Практический Data Science с помощью Python
- Серия уроков по машинному обучению и обработке естественного языка. Урок 1: Работа с текстом
- Понимание текста с нуля — публикация от Xiang Zhang и Yann LeCun на тему использования сверточных нейронных сетей для анализа текста.
- Пара слов о Shiny — небольшой пост, который расскажет о популярной библиотеке визуализации Shiny для языка программирования R и возможностях публикации своих Shiny-приложений на портале Shinyapps.io.
- Quickcheck: рандомизированное юнит-тестирование для R — короткий пост об интересной библиотеке юнит-тестирования для языка программирования R.
- Анализ данных с помощью Pandas — небольшой пример использования библиотеки Pandas, написанной для языка программирования Python, для анализа данных.
- Результат машинного обучения
Онлайн-курсы, обучающие материалы и литература
Видеоматериалы, подкасты
- Partially Derivative: Эпизод 12: Partially Deflated — очередной эпизод популярного подкаста «Partially Derivative».
Data engineering
- Google снова зафиксировал наибольшие квартальные траты на дата-центры
- Сможет ли Microsoft Cosmos составить конкуренцию Hadoop
- Использование Apache Crunch для обработки данных в Spotify — интересная статья, для тех кто использует MapReduce еще не готов использовать Apache Spark, но хочет получить схожие функции.
- Опубликован Apache Hive 1.0.0
Обзоры
- Интересное из мира R (2-8 февраля 2015 г.)
- Интересное из мира R (26 января — 1 февраля 2015 г.)
- Лучшие материалы за январь от KDnuggets.com
- Лучшие материалы за неделю от KDnuggets.com (25 — 31 декабря)
- Дайджест лучших ресурсов от DataScienceCentral (5 февраля)
- Новости Data Science от MyDataMine.com (6 февраля)
- Новости Big Data от MyDataMine.com (3 февраля)
- Еженедельный сборник лучших материалов от R1Soft (6 февраля)
- Лучшие ресурсы за неделю от Data Elixir (№21)
- Этот месяц в экосистеме Hadoop (январь 2015)
- Наиболее интересные материалы по High Scalability (6 февраля)
Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №33 (26 января — 1 февраля 2015)
Автор: moat