- PVSM.RU - https://www.pvsm.ru -

Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Моделирование пандемий с помощью языка Wolfram Language (системы Mathematica 10) на примере лихорадки Эбола [1]
Интересное из мира R (10-16 ноября 2014) [2]
DataTalks 25.10.14: первая встреча [3]
IBM запускает совместные магистерские программы в области Больших Данных с ведущими российскими университетами [4]
Почему Twitter является легкой целью для социальной аналитики [5]
Google и Stanford строят нейронную сеть, способную описывать фотографии [6]
9 навыков необходимых для того, чтобы стать Data Scientist [7]
Еще немного материалов с Highload++ 2014 [8] — последняя партия слайдов с различных выступлений с конференции разработчиков высоконагруженных систем HighLoad++ 2014. Не все из них связаны с машинным обучением и анализом данных, но многие могут быть интересны.
Apache Mahout против Weka [9] — небольшое сравнение двух популярных продуктов.
Введение в обучение без учителя (Unsupervised learning) с помощью scikit-learn [10]
Эффективная очистка текста с использованием Python [11]
Введение в Deep Learning на Python [12]
Обзор библиотек для анализа данных с использованием Python [13]
Факторный анализа против метода главных компонент [14]
Пример кода: dplyr — динамическая группировка по полю [15]
Пример кода: объединение нескольких data.frame в R [16]
Одномерная линейная регрессия [17] — неплохая статья про одномерную линейную регрессию.
Использование разведочного анализа данных для лучшего понимания проблемы и улучшения результата [18] — очередная интересная статья от автора блога MachineLearningMastery. В данном случае речь пойдет об использовании разведочного анализа данных (Exploratory Data Analysis).
Ask a Data Scientist: Обучение без учителя [19] — очередная статья с популярного портала insideBIGDATA из цикла «Ask a Data Scientist», в данном выпуске речь пойдет об обучении без учителя (Unsupervised learning).
Визуализация форкастинга [20] — неплохая статья, посвященная возможности различных визуализаций форкастинга с использованием языка программирования R.
Основы анализа данных с использованием R [21] — хороший набор слайдов с доклада, посвященного основам анализа данных с использованием языка программирования R.
Книга «Statistical Inference for Everyone» [22] — ссылка на бесплатную версию книги «Statistical Inference for Everyone» и ссылки на дополнительные материалы, которые могут быть полезны при работе с книгой.
Введение в Revolution R Open и Deploy R Open [23]
Видеолекции с летней школы программирования (Machine Learning Summer School 2014, Reykjavik) [24]
Введение в метод опорных векторов [25] — хорошая лекция по основам метода опорных векторов (Support vector machines) с одного из курсов MIT.
Введение в обучение с подкреплением [26] — неплохой вводный материал по теме подкрепления с обучением (Reinforcement learning).
Использование полнотекстового индексирования и поиска в PostgreSQL [27]
Как и для чего Яндекс отключает собственные дата-центры [28]
Apache Hadoop — не только MapReduce [29] — небольшая статья с блога Analytics Vidhya про возможности, которые есть в Apache Hadoop помимо MapReduce.
Apache Hive на Apache Spark [30] — статья с блога компании Cloudera — демонстрация работы Apache Hive на Apache Spark, который все очевиднее становится наследник MapReduce при работе с Apache Hadoop.
Big Data 101: Разделение [31] — продолжение дискуссии об основах распределенных вычислений и хранения данных, в данном случае речь пойдет о разделении (Partitioning).
Еженедельный дайджест от DataScienceCentral (24 ноября) [32]
Лучшие материалы за неделю от KDnuggets.com (9 — 15 ноября) [33]
Новости Data Mining от MyDataMine.com (19 ноября) [34]
Дайджест лучших ресурсов от DataScienceCentral (17 ноября) [35]
Наиболее интересные материалы от Freakonometrics №186 [36]
Наиболее интересные материалы от Freakonometrics №185 [37]
Наиболее интересные материалы от Freakonometrics №184 [38]
Лучшие ресурсы за неделю от Data Elixir (№11) [39]
Лучшие материалы: NoSQL Zone (7 — 14 ноября) [40]
Еженедельный сборник лучших материалов от R1Soft (21 ноября) [41]
Наиболее интересные материалы по High Scalability (21 ноября) [42]Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №22 (10 — 16 ноября 2014) [43]
Автор: moat
Источник [44]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/data-mining/75265
Ссылки в тексте:
[1] Моделирование пандемий с помощью языка Wolfram Language (системы Mathematica 10) на примере лихорадки Эбола: http://habrahabr.ru/post/243913/
[2] Интересное из мира R (10-16 ноября 2014): http://r-analytics.blogspot.ru/2014/11/r-10-16-2014.html
[3] DataTalks 25.10.14: первая встреча: http://habrahabr.ru/company/wargaming/blog/243755/
[4] IBM запускает совместные магистерские программы в области Больших Данных с ведущими российскими университетами: http://habrahabr.ru/company/ibm/blog/243577/
[5] Почему Twitter является легкой целью для социальной аналитики: http://www.datanami.com/2014/11/19/twitter-low-hanging-fruit-social-analytics/?utm_source=feedly&utm_reader=feedly&utm_medium=rss&utm_campaign=twitter-low-hanging-fruit-social-analytics
[6] Google и Stanford строят нейронную сеть, способную описывать фотографии: https://gigaom.com/2014/11/18/google-stanford-build-hybrid-neural-networks-that-can-explain-photos/
[7] 9 навыков необходимых для того, чтобы стать Data Scientist: http://www.kdnuggets.com/2014/11/9-must-have-skills-data-scientist.html
[8] Еще немного материалов с Highload++ 2014: http://igorsubbotin.blogspot.ru/2014/11/highload-2014-new-slides-2.html
[9] Apache Mahout против Weka: http://blog.algorithmia.com/post/103009975044/machine-learning-showdown-apache-mahout-vs-weka
[10] Введение в обучение без учителя (Unsupervised learning) с помощью scikit-learn: http://bugra.github.io/work/notes/2014-11-16/an-introduction-to-unsupervised-learning-scikit-learn/
[11] Эффективная очистка текста с использованием Python: http://www.analyticsvidhya.com/blog/2014/11/text-data-cleaning-steps-python/
[12] Введение в Deep Learning на Python: http://www.pyimagesearch.com/2014/09/22/getting-started-deep-learning-python/
[13] Обзор библиотек для анализа данных с использованием Python: http://dataaspirant.wordpress.com/2014/11/01/python-packages-for-datamining/
[14] Факторный анализа против метода главных компонент: http://honglangwang.wordpress.com/2014/11/21/factor-analysis-vs-principal-component-analysis/
[15] Пример кода: dplyr — динамическая группировка по полю: http://www.markhneedham.com/blog/2014/11/08/r-dplyr-group-by-field-dynamically-regroup-is-deprecated-no-applicable-method-for-as-lazy-applied-to-an-object-of-class-list/
[16] Пример кода: объединение нескольких data.frame в R: http://www.markhneedham.com/blog/2014/11/07/r-joining-multiple-data-frames/
[17] Одномерная линейная регрессия: http://wingshore.wordpress.com/2014/11/07/linear-regression-with-one-variable-model-representation/
[18] Использование разведочного анализа данных для лучшего понимания проблемы и улучшения результата: http://machinelearningmastery.com/understand-problem-get-better-results-using-exploratory-data-analysis/
[19] Ask a Data Scientist: Обучение без учителя: http://insidebigdata.com/2014/11/19/ask-data-scientist-unsupervised-learning/
[20] Визуализация форкастинга: http://robjhyndman.com/hyndsight/visualization-of-probabilistic-forecasts/
[21] Основы анализа данных с использованием R: http://decisionstats.com/2014/11/22/basics-of-analyzing-data-rstats-social-sma/
[22] Книга «Statistical Inference for Everyone»: http://web.bryant.edu/~bblais/statistical-inference-for-everyone-sie.html
[23] Введение в Revolution R Open и Deploy R Open: http://blog.revolutionanalytics.com/2014/11/video-presentation-on-revolution-r-open-and-deployr-open.html
[24] Видеолекции с летней школы программирования (Machine Learning Summer School 2014, Reykjavik): https://www.youtube.com/playlist?list=PLqdbxUnkqOw2nKn7VxYqIrKWcqRkQYOsF
[25] Введение в метод опорных векторов: http://insidebigdata.com/2014/11/19/data-sciences-101-support-vector-machines/
[26] Введение в обучение с подкреплением: https://www.hakkalabs.co/articles/introduction-reinforcement-learning
[27] Использование полнотекстового индексирования и поиска в PostgreSQL: http://habrahabr.ru/post/243911/
[28] Как и для чего Яндекс отключает собственные дата-центры: http://habrahabr.ru/company/yandex/blog/243033/
[29] Apache Hadoop — не только MapReduce: http://www.analyticsvidhya.com/blog/2014/11/hadoop-mapreduce/
[30] Apache Hive на Apache Spark: http://blog.cloudera.com/blog/2014/11/apache-hive-on-apache-spark-the-first-demo/
[31] Big Data 101: Разделение: http://cloudvane.com/2014/11/19/big-data-101-partitioning/
[32] Еженедельный дайджест от DataScienceCentral (24 ноября): http://www.datasciencecentral.com/profiles/blogs/weekly-digest-november-24
[33] Лучшие материалы за неделю от KDnuggets.com (9 — 15 ноября): http://www.kdnuggets.com/2014/11/top-news-week-nov-9.html
[34] Новости Data Mining от MyDataMine.com (19 ноября): http://mydatamine.com/data-mining-news-november-19-2014/
[35] Дайджест лучших ресурсов от DataScienceCentral (17 ноября): http://www.datasciencecentral.com/profiles/blogs/selection-of-resources-and-articles-from-thought-leaders-november
[36] Наиболее интересные материалы от Freakonometrics №186: http://freakonometrics.hypotheses.org/18001
[37] Наиболее интересные материалы от Freakonometrics №185: http://freakonometrics.hypotheses.org/17964
[38] Наиболее интересные материалы от Freakonometrics №184: http://freakonometrics.hypotheses.org/17938
[39] Лучшие ресурсы за неделю от Data Elixir (№11): http://dataelixir.com/issues/11
[40] Лучшие материалы: NoSQL Zone (7 — 14 ноября): http://java.dzone.com/articles/best-week-nov-07-nosql-zone
[41] Еженедельный сборник лучших материалов от R1Soft (21 ноября): http://www.r1soft.com/blog/this-week-in-data-november-21-2014
[42] Наиболее интересные материалы по High Scalability (21 ноября): http://highscalability.com/blog/2014/11/21/stuff-the-internet-says-on-scalability-for-november-21st-201.html
[43] Обзор наиболее интересных материалов по анализу данных и машинному обучению №22 (10 — 16 ноября 2014): http://habrahabr.ru/post/243339/
[44] Источник: http://habrahabr.ru/post/243967/
Нажмите здесь для печати.