- PVSM.RU - https://www.pvsm.ru -

Обзор наиболее интересных материалов по анализу данных и машинному обучению №3 (обзор онлайн курсов)

Данный выпуск обзора наиболее интересных материалов по анализу данных и машинному обучению полностью посвящен онлайн-курсам по тематике Data Science. В прошлом выпуске [1] был представлен список онлайн-курсов, стартующих в ближайшее время. В данном выпуске я постарался собрать наиболее интересные онлайн-курсы по теме анализа данных. Стоит отметить, что некоторые курсы уже закончились, но у большинства таких курсов можно посмотреть архив всех учебных материалов.
Начинается обзор с набора курсов от Johns Hopkins University на Coursera, которые объединены в одной специализации «Data Science Specialization», поэтому имеет смысл рассмотреть их отдельно от остальных курсов. Это 9 официальных курсов специализации и два дополнительных Mathematical Biostatistics Boot Camp 1 и 2, которые официально не входят в специализацию. Важно отметить, что весь набор данных курсов регулярно начинается заново и в общем-то можно достаточно гибко построить свой график продвижения по специализации. Большинство курсов длятся 4 недели. Язык R является основным языком программирования в данном наборе курсов. Далее идет список курсов из специализации Data Science от Johns Hopkins University:

  • The Data Scientist’s Toolbox [2] — базовый курс в специализации и посвящен обзору различных инструментов специалиста по анализу данных. Количество материалов невелико и курс может быть пройден за 3-4 часа.
  • R Programming [3] — базовый курс в специализации и посвящен основам работы с язык программирования R.
  • Getting and Cleaning Data [4] — также является базовым курсом в специализации и посвящен очень важной теме подготовки и обработки сырых входных данных к дальнейшему анализу.
  • Exploratory Data Analysis [5] — курс посвящен исследовательскому анализу данных и визуализации данных с помощью языка R и таких популярных пакетов для визуализации как lattice и ggplot2.
  • Reproducible Research [6] — курс рассказывает о такой важной теме в анализе данных как Reproducible Research. Рассматриваются пакет knitlr для языка R, а также язык разметки R Markdown.
  • Statistical Inference [7] — формально курс посвящен теме статистического вывода, но по сути является курсом по основам статистики и теории вероятностей. Подано все в очень скомканной и сумбурной форме. Один из самых неоднозначных курсов в данной специализации. Надеюсь, что в будущих версиях курс будет серьезно переработан.
  • Regression Models [8] — курс посвящен теме регрессионного анализа. К курсу также есть вопросы по теме проработанности материала и надежда, что создатели курса обратят внимание на комментарии студентов и серьезно переработают курс в будущем.
  • Practical Machine Learning [9] — курс посвящен основам машинного обучения.
  • Developing Data Products [10] — курс посвящен разработке современных продуктов в теме анализа данных. Рассматриваются такие популярные фреймворки как Shiny и Slidify.
  • Mathematical Biostatistics Boot Camp 1 [11] — первая часть курса по биостатистике от Johns Hopkins University, является неофициальным дополнением к специализации Data Science, хорошо покрывает основы статистики и теории вероятностей.
  • Mathematical Biostatistics Boot Camp 2 [12] — вторая часть курса по биостатистике от Johns Hopkins University, является неофициальным дополнением к специализации Data Science, хорошо покрывает основы статистики и теории вероятностей.

Далее рассмотрим курсы, которые помогут улучшить общие навыки, необходимые для специалиста по анализу данных:

  • Intro to Hadoop and MapReduce [13] (Udacity) — курс посвящен основам работы с Hadoop и большими наборами данных.
  • Data Wrangling with MongoDB [14] (Udacity) — речь в данном курсе пойдет о работе с данными в такой популярной сейчас NoSQL базе данных как MongoDB.
  • Programming Foundations with Python [15] (Udacity) — курс посвящен основам языка программирования Python, который стремительно набирает популярность среди специалистов по анализу данных.
  • Introduction to Databases [16] (Coursera — Stanford University) — курс рассказывает о работе с реляционными источниками данных, а также о работе с другими популярными форматами хранения данных (XML, JSON)

Теперь перейдем к курсам, которые посвящены теории вероятностей и статистике. Безусловно знание данных дисциплин будет полезно каждому, кто претендует на звание специалиста по анализу данных. В некоторых случаях разделение курсов на категории достаточно условно, так как многие курсы охватывают различные аспекты, связанные с анализом данных. Далее представлен список курсов в данной категории:

  • Probabilty and Statistics [17] (Khan Academy) — отличный набор базовых вещей по статистике и теории вероятностей от Khan Academy.
  • Case-Based Introduction to Biostatistics [18] (Coursera — Johns Hopkins University) — курс прдеставляет в доступной форме основы статистики и теории вероятностей с примерами из биостатистики.
  • Probabilistic Graphical Models [19] (Coursera — Stanford University) — небольшой курс по теории вероятностей.
  • Statistics: Making Sense of Data [20] (Coursera — University of Toronto) — еще один курс по основам статистики.
  • Data Analysis and Statistical Inference [21] (Coursera — Duke University) — отличный курс по анализу данных, в котором доступно рассказывается об основах теории вероятностей и статистики.
  • Statistics One [22] (Coursera — Princeton University) — неплохой курс по основам статистики. Материал подается на доступном уровне и не требует от слушателя специальных знаний для усвоения материала.
  • Statistics in Medicine [23] (Stanford Online) — основы статистики на основе примеров из медицины.
  • Statistics for Medical Professionals (CME) [24] (Stanford Online) — основы статистики на основе примеров из медицины.
  • Stat_2.1x — Introduction to Statistics: Descriptive Statistics [25] (edX — BerkleyX) — первая часть из серии курсов по статистике и теории вероятностей. Первая часть посвящена описательной статистике.
  • Stat_2.2x — Introduction to Statistics: Probability [26] (edX — BerkleyX) — вторая часть из серии курсов по статистике и теории вероятностей. Вторая часть посвящена основам теории вероятностей.
  • Stat_2.3x — Introduction to Statistics: Inference [27] (edX — BerkleyX) — третья часть из серии курсов по статистике и теории вероятностей. Третья часть посвящена теме статистического вывода.
  • 6.041x Introduction to Probability — The Science of Uncertainty [28] (edX — MITx) — курс по теории вероятностей от MIT.
  • Explore Statistics with R [29] (edX — KIx) — новый курс по работе со статистическим языком программирования R. Первая сессия данного курса начинается 9 сентября 2014 года.
  • Intro to Statistics [30] (Udacity) — еще один курс по основам статистики.
  • Statistics [31] (Udacity) — достаточно простой курс по теории вероятностей и статистике.

Далее следует список курсов, которые посвящены различным аспектам темы анализа данных, таким как машинное обучение, обработка естественного языка, нейронным сетям, рекомендательным системам, анализу социальных сетей, искусственному интеллекту и другим:

  • Data Analysis [32] (Coursera — Johns Hopkins University) — курс по анализу данных с использованием языка R длительностью 8 недель.
  • Introduction to Data Science [33] (Coursera — University of Washington) — курс длится 8 недель. Один из наиболее популярных онлайн-курсов по основам Data Science.
  • Machine Learning [34] (Coursera — University of Washington) — отличный курс, который длится 10 недель по машинному обучению от University of Washington.
  • Machine Learning [35] (Coursera — Stanford University) — один из наиболее известных курсов по Machine Learning, ведет его профессор Стэнфордского Университета Andrew Ng. Курс длится 10 недель. Курс достаточно простой и понятный, не требует каких-то специальных знаний для его успешного прохождения, при этом охватывает достаточно много направлений Machine Learning.
  • Natural Language Processing [36] (Coursera — Stanford University) — один из самых популярных онлайн-курсов по обработке естественного языка от Стэнфордского Университета.
  • Introduction to Recommender Systems [37] (Coursera — University of Minnesota) — введение в рекомендательные системы. Нельзя сказать, что курс тщательно проработан, но курсов по данной не так много, так что он может быть интересен тем, кто занимается тематикой рекомендательных систем.
  • Neural Networks for Machine Learning [38] (Coursera — University of Toronto) — курс по применению нейронных сетей в машинном обучении.
  • Natural Language Processing [39] (Coursera — Columbia University) — еще один курс, посвященный теме обработки естественного языка.
  • Social Network Analysis [40] (Coursera — University of Michigan) — курс посвящен популярной теме анализа данных социальных сетей.
  • Statistical Learning [41] (Stanford Online) — курс, посвященный основам обучения с учителем (Supervised learning) в машинном обучении.
  • SABR101x Sabremetrics: Introduction to Baseball Analytics [42] (edX — BUx-Boston University) — в курсе объясняются многие аспекты Data Science и Big Data на основе анализа спортивной статистики (в данном случае бейсбола).
  • PH525x Data Analysis for Genomics [43] (edX — HarvardX) — достаточно простой курс по теме анализа данных.
  • 15.071x The Analytics Edge [44] (edX — MITx) — курс с отличным материалом по теме анализа данных и машинному обучению.
  • Learning From Data [45] (edX — CaltechX) — один из лучших курсов по машинному обучению. Доступно раскрываются многие темы машинного обучения.
  • CS188.1x Artificial Intelligence [46] (edX — BerkleyX) — наверное один из самых интересных онлайн-курсов по теме искусственного интеллекта. В курсе используется язык программирования Python.
  • Intro to Data Science [47] (Udacity) — введение в Data Science от Udacity.
  • Machine Learning 1—Supervised Learning [48] (Udacity) — первая часть из серии курсов по машинному обучению от Udacity. Первая часть посвящена теме обучения с учителем (Supervised learning).
  • Machine Learning 2—Unsupervised Learning [49] (Udacity) — вторая часть из серии курсов по машинному обучению от Udacity. Вторая часть посвящена теме обучения без учителя (Unsupervised learning).
  • Machine Learning 3—Reinforcement Learning [50] (Udacity) — третья часть из серии курсов по машинному обучению от Udacity. Третья часть посвящена популярной методике машинного обучения Reinforcement Learning.
  • Exploratory Data Analysis [51] (Udacity) — курс по визуализации данных с использованием языка R.
  • Artificial Intelligence for Robotics [52] (Udacity) — введение в тему программирования искусственного интеллекта на примере беспилотного автомобиля.
  • Intro to Artificial Intelligence [53] (Udacity) — курс по основам искусственного интеллекта.
  • CS109 Data Science [54] (Harvard) — видеолекции курса по основам Data Science от Harvard Extension School

Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №2 (16 — 23 июня 2014) [55]

Автор: moat

Источник [56]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/data-mining/63772

Ссылки в тексте:

[1] выпуске: http://habrahabr.ru/post/227293/

[2] The Data Scientist’s Toolbox: https://www.coursera.org/course/datascitoolbox

[3] R Programming: https://www.coursera.org/course/rprog

[4] Getting and Cleaning Data: https://www.coursera.org/course/getdata

[5] Exploratory Data Analysis: https://www.coursera.org/course/exdata

[6] Reproducible Research: https://www.coursera.org/course/repdata

[7] Statistical Inference: https://www.coursera.org/course/statinference

[8] Regression Models: https://www.coursera.org/course/regmods

[9] Practical Machine Learning: https://www.coursera.org/course/predmachlearn

[10] Developing Data Products: https://www.coursera.org/course/devdataprod

[11] Mathematical Biostatistics Boot Camp 1: https://www.coursera.org/course/biostats

[12] Mathematical Biostatistics Boot Camp 2: https://www.coursera.org/course/biostats2

[13] Intro to Hadoop and MapReduce: https://www.udacity.com/course/ud617

[14] Data Wrangling with MongoDB: https://www.udacity.com/course/ud032

[15] Programming Foundations with Python: https://www.udacity.com/course/ud036

[16] Introduction to Databases: https://www.coursera.org/course/db

[17] Probabilty and Statistics: https://www.khanacademy.org/math/probability

[18] Case-Based Introduction to Biostatistics: https://www.coursera.org/course/casebasedbiostat

[19] Probabilistic Graphical Models: https://www.coursera.org/course/pgm

[20] Statistics: Making Sense of Data: https://www.coursera.org/course/introstats

[21] Data Analysis and Statistical Inference: https://www.coursera.org/course/statistics

[22] Statistics One: https://www.coursera.org/course/stats1

[23] Statistics in Medicine: http://online.stanford.edu/course/statistics-medicine-Summer-2014

[24] Statistics for Medical Professionals (CME): http://online.stanford.edu/course/statistics-medicine-cme-sp2014

[25] Stat_2.1x — Introduction to Statistics: Descriptive Statistics: https://courses.edx.org/courses/BerkeleyX/Stat_2.1x/1T2014/info

[26] Stat_2.2x — Introduction to Statistics: Probability: https://courses.edx.org/courses/BerkeleyX/Stat_2.2x/1T2014/info

[27] Stat_2.3x — Introduction to Statistics: Inference: https://courses.edx.org/courses/BerkeleyX/Stat_2.3x/2T2014/info

[28] 6.041x Introduction to Probability — The Science of Uncertainty: https://courses.edx.org/courses/MITx/6.041x/1T2014/info

[29] Explore Statistics with R: https://www.edx.org/course/kix/kix-kiexplorx-explore-statistics-r-1524

[30] Intro to Statistics: https://www.udacity.com/course/st101

[31] Statistics: https://www.udacity.com/course/st095

[32] Data Analysis: https://www.coursera.org/course/dataanalysis

[33] Introduction to Data Science: https://www.coursera.org/course/datasci

[34] Machine Learning: https://www.coursera.org/course/machlearning

[35] Machine Learning: https://www.coursera.org/course/ml

[36] Natural Language Processing: https://www.coursera.org/course/nlp

[37] Introduction to Recommender Systems: https://www.coursera.org/course/recsys

[38] Neural Networks for Machine Learning: https://www.coursera.org/course/neuralnets

[39] Natural Language Processing: https://www.coursera.org/course/nlangp

[40] Social Network Analysis: https://www.coursera.org/course/sna

[41] Statistical Learning: http://online.stanford.edu/course/statistical-learning-winter-2014

[42] SABR101x Sabremetrics: Introduction to Baseball Analytics: https://courses.edx.org/courses/BUx/SABR101x/2T2014/info

[43] PH525x Data Analysis for Genomics: https://courses.edx.org/courses/HarvardX/PH525x/1T2014/info

[44] 15.071x The Analytics Edge: https://courses.edx.org/courses/MITx/15.071x/1T2014/info

[45] Learning From Data: https://www.edx.org/course/caltechx/caltechx-cs1156x-learning-data-2516

[46] CS188.1x Artificial Intelligence: https://courses.edx.org/courses/BerkeleyX/CS188.1x/2012_Fall/info

[47] Intro to Data Science: https://www.udacity.com/course/ud359

[48] Machine Learning 1—Supervised Learning: https://www.udacity.com/course/ud675

[49] Machine Learning 2—Unsupervised Learning: https://www.udacity.com/course/ud741

[50] Machine Learning 3—Reinforcement Learning: https://www.udacity.com/course/ud820

[51] Exploratory Data Analysis: https://www.udacity.com/course/ud651

[52] Artificial Intelligence for Robotics: https://www.udacity.com/course/cs373

[53] Intro to Artificial Intelligence: https://www.udacity.com/course/cs271

[54] CS109 Data Science: http://cm.dce.harvard.edu/2014/01/14328/publicationListing.shtml

[55] Обзор наиболее интересных материалов по анализу данных и машинному обучению №2 (16 — 23 июня 2014): http://habrahabr.ru/post/227293

[56] Источник: http://habrahabr.ru/post/228187/