- PVSM.RU - https://www.pvsm.ru -

Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Как мы готовим будущих специалистов по большим данным [1]
Визуализация шаблонов Data Science [2] — наглядная и интересная инфографика.
Новые возможности RStudio (v0.99 Preview): Code Completion [3]
IPython: выпущена версия 3.0 [4]
Pulsar: фреймворк для анализа данных в режиме реального времени от eBay [5]
Deep learning без больших затрат [6] — небольшая статья с портала HighScalability.com, которая расскажет о том, что вы можете начать свои эксперименты с Deep Learning уже сейчас без каких-либо больших финансовых вложений.
Библиотеки машинного обучения [7] — большой список библиотек машинного обучения, представленный в виде периодической таблицы и разбитый на несколько категорий: Big Data, Lua/JS/Clojure, Computer Vision, NLP, C/C++, R/Julia, Java, Scala, Python.
Обучение на больших данных: Spark MLlib [8]
Необычные модели Playboy, или про обнаружение выбросов в данных c помощью Scikit-learn [9]
ИИ от Google самостоятельно освоил 49 старых игр Atari [10]
Ошибки, которых стоит избегать при использовании машинного обучения [11]
Изучение пользователей через анализ данных Twitter и машинное обучение [12]
Ошибки машинного обучения [13] — автор данной публикации описывает несколько типичных ошибок, с которыми сталкиваются те кто использует алгоритмы машинного обучения при решении своих задач.
Стандарты оформления R кода от Google (Google's R Style Guide) [14]
Помогает ли балансировка классов улучшить результаты работы классификатора? [15]
Алгоритм предсказания K в алгоритме кластеризации методом k-средних [16] — интересная возможность в библиотеке BigML.
Deep Speech: точное распознавание речи с помощью Deep Learning и GPU [17]
Визуализация кластеров с помощью R [18]
Сравнение алгоритмов обучения с учителем (Supervised learning) [19]
Серия уроков по машинному обучению и обработке естественного языка. Урок 4: Наивный байесовский классификатор [20]
Дневник участников соренования по машинному обучению «Avazu Kaggle Challenge» [21]
Соревнование по машинному обучению: Diabetic Retinopathy Detection [22]
Анонс нового курса: Introduction to Data Science [23] — стоит отметить, что курс платный.
Обзор книги: Mastering Scientific Computing with R [24]
Бесплатная электронная книга: Hadoop for Dummies [25]
Бесплатная электронная книга: Software Defined Storage for Dummies [26]
Интервью с Andrew Ng на конференции Deep Learning Summit в Сан-Франциско [27]
Масштабирование машинного обучения с помощью R и библиотеки H2O [28]
Talking Machines: Эпизод 4: Интервью с Geoffrey Hinton, Yoshua Bengio и Yann LeCun: История машинного обучения изнутри [29] — пятый эпизод серии подкастов «Talking Machines», в данном случае это сессия общения с такими зубрами, как Geoffrey Hinton (Google, University of Toronto), Yoshua Bengio (University of Montreal) и Yann LeCun (Facebook, NYU).
Apache Spark: что там под капотом? [30]
Анализ логов в режиме реального времени с помощью Apache Kafka, Cloudera Search и Hue [31]
Потоковая обработка больших данных: Storm, Spark и Samza [32]
Обработка больших данных в Apache Spark [33]
Использование MongoDb с Hadoop и Spark: Часть 1 — основы и настройка [34]
Начало новой эры: Релиз Apache HBase версии 1.0 [35]
Появилась возможность скачать бета версию Hive-on-Spark [36]
Интересное из мира R (23 февраля — 1 марта 2015 г.) [37]
Лучшие материалы за неделю от KDnuggets.com (15-21 февраля) [38]
Еженедельный дайджест от DataScienceCentral (2 марта) [39]
Новости Data Science от MyDataMine.com (27 февраля) [40]
Новости Big Data от MyDataMine.com (24 февраля) [41]
Лучшие ресурсы за неделю от Data Elixir (№24) [42]
Еженедельный сборник лучших материалов от R1Soft (27 февраля) [43]
Наиболее интересные материалы по High Scalability (27 февраля) [44]Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №36 (16 — 22 февраля 2015) [45]
Автор: moat
Источник [46]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/data-mining/84324
Ссылки в тексте:
[1] Как мы готовим будущих специалистов по большим данным: http://habrahabr.ru/company/npl/blog/251675/
[2] Визуализация шаблонов Data Science: http://datascience.computingpatterns.com/
[3] Новые возможности RStudio (v0.99 Preview): Code Completion: http://blog.rstudio.org/2015/02/23/rstudio-v0-99-preview-code-completion/
[4] IPython: выпущена версия 3.0: http://ipython.org/ipython-doc/3/whatsnew/version3.html
[5] Pulsar: фреймворк для анализа данных в режиме реального времени от eBay: https://gigaom.com/2015/02/23/ebays-new-pulsar-framework-will-analyze-your-data-in-real-time/
[6] Deep learning без больших затрат: http://highscalability.com/blog/2015/2/25/deep-learning-without-deep-pockets.html
[7] Библиотеки машинного обучения: http://www.mln.io/resources/periodic-table/
[8] Обучение на больших данных: Spark MLlib: http://habrahabr.ru/post/251471/
[9] Необычные модели Playboy, или про обнаружение выбросов в данных c помощью Scikit-learn: http://habrahabr.ru/post/251225/
[10] ИИ от Google самостоятельно освоил 49 старых игр Atari: http://geektimes.ru/post/246444/
[11] Ошибки, которых стоит избегать при использовании машинного обучения: https://medium.com/@nomadic_mind/new-to-machine-learning-avoid-these-three-mistakes-73258b3848a4
[12] Изучение пользователей через анализ данных Twitter и машинное обучение: https://blog.twitter.com/2015/guest-post-understanding-users-through-twitter-data-and-machine-learning
[13] Ошибки машинного обучения: http://ml.posthaven.com/machine-learning-done-wrong
[14] Стандарты оформления R кода от Google (Google's R Style Guide): http://google-styleguide.googlecode.com/svn/trunk/Rguide.xml
[15] Помогает ли балансировка классов улучшить результаты работы классификатора?: http://www.win-vector.com/blog/2015/02/does-balancing-classes-improve-classifier-performance/
[16] Алгоритм предсказания K в алгоритме кластеризации методом k-средних: http://blog.bigml.com/2015/02/24/divining-the-k-in-k-means-clustering/
[17] Deep Speech: точное распознавание речи с помощью Deep Learning и GPU: http://devblogs.nvidia.com/parallelforall/deep-speech-accurate-speech-recognition-gpu-accelerated-deep-learning/
[18] Визуализация кластеров с помощью R: http://freakonometrics.hypotheses.org/19180
[19] Сравнение алгоритмов обучения с учителем (Supervised learning): http://www.dataschool.io/comparing-supervised-learning-algorithms/
[20] Серия уроков по машинному обучению и обработке естественного языка. Урок 4: Наивный байесовский классификатор: http://www.thoughtly.co/blog/naive-bayes-classifier/
[21] Дневник участников соренования по машинному обучению «Avazu Kaggle Challenge»: https://medium.com/@chris_bour/our-avazu-kaggle-challenge-logbook-b522ccb1ed21
[22] Соревнование по машинному обучению: Diabetic Retinopathy Detection: https://www.kaggle.com/c/diabetic-retinopathy-detection
[23] Анонс нового курса: Introduction to Data Science: http://www.win-vector.com/blog/2015/02/announcing-introduction-to-data-science-video-course/
[24] Обзор книги: Mastering Scientific Computing with R: http://r-nold.blogspot.ru/2015/03/book-review-mastering-scientific.html
[25] Бесплатная электронная книга: Hadoop for Dummies: http://insidebigdata.com/2015/02/25/free-book-hadoop-dummies/
[26] Бесплатная электронная книга: Software Defined Storage for Dummies: http://insidebigdata.com/2015/02/27/free-ebook-software-defined-storage-dummies/
[27] Интервью с Andrew Ng на конференции Deep Learning Summit в Сан-Франциско: http://insidebigdata.com/2015/02/23/data-science-101-fireside-chat-andrew-ng/
[28] Масштабирование машинного обучения с помощью R и библиотеки H2O: http://datascience.vegas/scalable-machine-learning-for-big-data-using-r-and-h2o/#sthash.JnGPq55J.t56TB8v4.dpbs
[29] Talking Machines: Эпизод 4: Интервью с Geoffrey Hinton, Yoshua Bengio и Yann LeCun: История машинного обучения изнутри: http://www.thetalkingmachines.com/blog/2015/2/26/the-history-of-machine-learning-from-the-inside-out
[30] Apache Spark: что там под капотом?: http://habrahabr.ru/post/251507/
[31] Анализ логов в режиме реального времени с помощью Apache Kafka, Cloudera Search и Hue: http://blog.cloudera.com/blog/2015/02/how-to-do-real-time-log-analytics-with-apache-kafka-cloudera-search-and-hue/
[32] Потоковая обработка больших данных: Storm, Spark и Samza: https://tsicilian.wordpress.com/2015/02/16/streaming-big-data-storm-spark-and-samza/
[33] Обработка больших данных в Apache Spark: http://horicky.blogspot.ru/2015/02/big-data-processing-in-spark.html
[34] Использование MongoDb с Hadoop и Spark: Часть 1 — основы и настройка: http://www.mongodb.com/blog/post/using-mongodb-hadoop-spark-part-1-introduction-setup
[35] Начало новой эры: Релиз Apache HBase версии 1.0: https://blogs.apache.org/hbase/entry/start_of_a_new_era
[36] Появилась возможность скачать бета версию Hive-on-Spark: http://blog.cloudera.com/blog/2015/02/download-the-hive-on-spark-beta/
[37] Интересное из мира R (23 февраля — 1 марта 2015 г.): http://r-analytics.blogspot.ru/2015/03/r-23-1-2015.html#.VPLebS4_xoM
[38] Лучшие материалы за неделю от KDnuggets.com (15-21 февраля): http://www.kdnuggets.com/2015/02/top-news-week-feb-15.html
[39] Еженедельный дайджест от DataScienceCentral (2 марта): http://www.datasciencecentral.com/profiles/blogs/weekly-digest-march-2
[40] Новости Data Science от MyDataMine.com (27 февраля): http://mydatamine.com/2015/02/data-science-news-27-feb-2015/
[41] Новости Big Data от MyDataMine.com (24 февраля): http://mydatamine.com/2015/02/big-data-news-24-feb-2015/
[42] Лучшие ресурсы за неделю от Data Elixir (№24): http://dataelixir.com/issues/24
[43] Еженедельный сборник лучших материалов от R1Soft (27 февраля): http://www.r1soft.com/blog/this-week-in-data-february-27-2015
[44] Наиболее интересные материалы по High Scalability (27 февраля): http://highscalability.com/blog/2015/2/27/stuff-the-internet-says-on-scalability-for-february-27th-201.html
[45] Обзор наиболее интересных материалов по анализу данных и машинному обучению №36 (16 — 22 февраля 2015): http://habrahabr.ru/post/251191/
[46] Источник: http://habrahabr.ru/post/251829/
Нажмите здесь для печати.