- PVSM.RU - https://www.pvsm.ru -

Обзор наиболее интересных материалов по анализу данных и машинному обучению №37 (23 февраля — 1 марта 2015)

Обзор наиболее интересных материалов по анализу данных и машинному обучению №37 (23 февраля — 1 марта 2015) - 1
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.

Общее

Теория и алгоритмы машинного обучения, примеры кода

Соревнования по машинному обучению

Онлайн-курсы, обучающие материалы и литература

Видеоматериалы, подкасты

Data engineering

Обзоры

Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №36 (16 — 22 февраля 2015) [45]

Автор: moat

Источник [46]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/data-mining/84324

Ссылки в тексте:

[1] Как мы готовим будущих специалистов по большим данным: http://habrahabr.ru/company/npl/blog/251675/

[2] Визуализация шаблонов Data Science: http://datascience.computingpatterns.com/

[3] Новые возможности RStudio (v0.99 Preview): Code Completion: http://blog.rstudio.org/2015/02/23/rstudio-v0-99-preview-code-completion/

[4] IPython: выпущена версия 3.0: http://ipython.org/ipython-doc/3/whatsnew/version3.html

[5] Pulsar: фреймворк для анализа данных в режиме реального времени от eBay: https://gigaom.com/2015/02/23/ebays-new-pulsar-framework-will-analyze-your-data-in-real-time/

[6] Deep learning без больших затрат: http://highscalability.com/blog/2015/2/25/deep-learning-without-deep-pockets.html

[7] Библиотеки машинного обучения: http://www.mln.io/resources/periodic-table/

[8] Обучение на больших данных: Spark MLlib: http://habrahabr.ru/post/251471/

[9] Необычные модели Playboy, или про обнаружение выбросов в данных c помощью Scikit-learn: http://habrahabr.ru/post/251225/

[10] ИИ от Google самостоятельно освоил 49 старых игр Atari: http://geektimes.ru/post/246444/

[11] Ошибки, которых стоит избегать при использовании машинного обучения: https://medium.com/@nomadic_mind/new-to-machine-learning-avoid-these-three-mistakes-73258b3848a4

[12] Изучение пользователей через анализ данных Twitter и машинное обучение: https://blog.twitter.com/2015/guest-post-understanding-users-through-twitter-data-and-machine-learning

[13] Ошибки машинного обучения: http://ml.posthaven.com/machine-learning-done-wrong

[14] Стандарты оформления R кода от Google (Google's R Style Guide): http://google-styleguide.googlecode.com/svn/trunk/Rguide.xml

[15] Помогает ли балансировка классов улучшить результаты работы классификатора?: http://www.win-vector.com/blog/2015/02/does-balancing-classes-improve-classifier-performance/

[16] Алгоритм предсказания K в алгоритме кластеризации методом k-средних: http://blog.bigml.com/2015/02/24/divining-the-k-in-k-means-clustering/

[17] Deep Speech: точное распознавание речи с помощью Deep Learning и GPU: http://devblogs.nvidia.com/parallelforall/deep-speech-accurate-speech-recognition-gpu-accelerated-deep-learning/

[18] Визуализация кластеров с помощью R: http://freakonometrics.hypotheses.org/19180

[19] Сравнение алгоритмов обучения с учителем (Supervised learning): http://www.dataschool.io/comparing-supervised-learning-algorithms/

[20] Серия уроков по машинному обучению и обработке естественного языка. Урок 4: Наивный байесовский классификатор: http://www.thoughtly.co/blog/naive-bayes-classifier/

[21] Дневник участников соренования по машинному обучению «Avazu Kaggle Challenge»: https://medium.com/@chris_bour/our-avazu-kaggle-challenge-logbook-b522ccb1ed21

[22] Соревнование по машинному обучению: Diabetic Retinopathy Detection: https://www.kaggle.com/c/diabetic-retinopathy-detection

[23] Анонс нового курса: Introduction to Data Science: http://www.win-vector.com/blog/2015/02/announcing-introduction-to-data-science-video-course/

[24] Обзор книги: Mastering Scientific Computing with R: http://r-nold.blogspot.ru/2015/03/book-review-mastering-scientific.html

[25] Бесплатная электронная книга: Hadoop for Dummies: http://insidebigdata.com/2015/02/25/free-book-hadoop-dummies/

[26] Бесплатная электронная книга: Software Defined Storage for Dummies: http://insidebigdata.com/2015/02/27/free-ebook-software-defined-storage-dummies/

[27] Интервью с Andrew Ng на конференции Deep Learning Summit в Сан-Франциско: http://insidebigdata.com/2015/02/23/data-science-101-fireside-chat-andrew-ng/

[28] Масштабирование машинного обучения с помощью R и библиотеки H2O: http://datascience.vegas/scalable-machine-learning-for-big-data-using-r-and-h2o/#sthash.JnGPq55J.t56TB8v4.dpbs

[29] Talking Machines: Эпизод 4: Интервью с Geoffrey Hinton, Yoshua Bengio и Yann LeCun: История машинного обучения изнутри: http://www.thetalkingmachines.com/blog/2015/2/26/the-history-of-machine-learning-from-the-inside-out

[30] Apache Spark: что там под капотом?: http://habrahabr.ru/post/251507/

[31] Анализ логов в режиме реального времени с помощью Apache Kafka, Cloudera Search и Hue: http://blog.cloudera.com/blog/2015/02/how-to-do-real-time-log-analytics-with-apache-kafka-cloudera-search-and-hue/

[32] Потоковая обработка больших данных: Storm, Spark и Samza: https://tsicilian.wordpress.com/2015/02/16/streaming-big-data-storm-spark-and-samza/

[33] Обработка больших данных в Apache Spark: http://horicky.blogspot.ru/2015/02/big-data-processing-in-spark.html

[34] Использование MongoDb с Hadoop и Spark: Часть 1 — основы и настройка: http://www.mongodb.com/blog/post/using-mongodb-hadoop-spark-part-1-introduction-setup

[35] Начало новой эры: Релиз Apache HBase версии 1.0: https://blogs.apache.org/hbase/entry/start_of_a_new_era

[36] Появилась возможность скачать бета версию Hive-on-Spark: http://blog.cloudera.com/blog/2015/02/download-the-hive-on-spark-beta/

[37] Интересное из мира R (23 февраля — 1 марта 2015 г.): http://r-analytics.blogspot.ru/2015/03/r-23-1-2015.html#.VPLebS4_xoM

[38] Лучшие материалы за неделю от KDnuggets.com (15-21 февраля): http://www.kdnuggets.com/2015/02/top-news-week-feb-15.html

[39] Еженедельный дайджест от DataScienceCentral (2 марта): http://www.datasciencecentral.com/profiles/blogs/weekly-digest-march-2

[40] Новости Data Science от MyDataMine.com (27 февраля): http://mydatamine.com/2015/02/data-science-news-27-feb-2015/

[41] Новости Big Data от MyDataMine.com (24 февраля): http://mydatamine.com/2015/02/big-data-news-24-feb-2015/

[42] Лучшие ресурсы за неделю от Data Elixir (№24): http://dataelixir.com/issues/24

[43] Еженедельный сборник лучших материалов от R1Soft (27 февраля): http://www.r1soft.com/blog/this-week-in-data-february-27-2015

[44] Наиболее интересные материалы по High Scalability (27 февраля): http://highscalability.com/blog/2015/2/27/stuff-the-internet-says-on-scalability-for-february-27th-201.html

[45] Обзор наиболее интересных материалов по анализу данных и машинному обучению №36 (16 — 22 февраля 2015): http://habrahabr.ru/post/251191/

[46] Источник: http://habrahabr.ru/post/251829/