Написал пост, который идет строго в закладки, он со списком полезнейших книг по анализу данных, математике, data science и machine learning. Они будут полезны как новичкам, так и профессионалам. Для удобства можете читать здесь или использовать удобный google docs, в нем книги разбиты по столбцам и категориям. Пользуйтесь и прокачивайте скиллы сами + делитесь с коллегами.
Конечно, весь список книг неполный. Поэтому добавляйте в комментарии свои полезные ссылки на крутые книги, самые топовые из них я добавлю в список.
Книги по анализу данных, математике, data science и machine learning:
Машинное обучение — тем, кто только начинает, пригодятся главы с первой по пятую: там описаны процессы подготовки и исследования данных, моделирование и оценка моделей. Дальше практика. Плюс продвинутые темы: проектирование признаков и оптимизация.
Верховный алгоритм — автор знакомит читателей с пятью основными школами машинного обучения и показывает, как они используют идеи из нейробиологии, эволюционной биологии, физики и статистики, чтобы создавать алгоритмы, помогающие людям.
Introduction to machine learning — эта книга не является практическим пособием или сборником теоретических доказательств. Это — промежуточное звено между теорией и практикой.
Машинное обучение — Наука и искусство построения алгоритмов, которые извлекают знания из данных. Один из самых интересных учебников по машинному обучению. Автор рассказывает о методах построения моделей и алгоритмов.
Обучение с подкреплением — книга не о машинном обучение, а об одном из способов изучения. Обучение с подкреплением это метод, в ходе которого человек обучается, взаимодействуя с некоторой средой.
Bayesian Reasoning and Machine Learning — книга для более профессионального уровня. Информация последовательно распределена по ходу всей книги от легкого к сложному.
Neural Network Design — в книге вы найдете ясный и подробный обзор основных типов архитектуры нейросетей, узнаете все о методах и правилах их обучения, а также о применении на практике.
Deep Learning — книга рассказывает о глубоком обучении — о том, как иерархия понятий позволяет искусственному интеллекту изучать сложные концепции, строя их из более простых.
Make Your Own Neural Network — очень годное и в то же время очень простое для понимание руководство по нейросетям. К концу книги вы научитесь программировать на Python и сможете создать собственную нейросеть.
Mahout in Action — Mahout — это java-библиотека, и в книге есть куча примеров, как ее можно использовать для решения реальных задач.
Машинное обучение — наука и искусство построения алгоритмов, которые извлекают знания из данных. В книге описан широкий круг логических, геометрических и статистических моделей, затрагиваются и такие находящиеся на переднем крае науки темы, как матричная факторизация и анализ РХП.
Python для сложных задач. Наука о данных и машинное обучение — книга «Python для сложных задач: наука о данных и машинное обучение» – это подробное руководство по самым разным вычислительным и статистическим методам, без которых немыслима любая интенсивная обработка данных, научные исследования и передовые разработки.
Глубокое обучение — описываются приемы глубокого обучения, применяемые на практике, в том числе глубокие сети прямого распространения, регуляризация, алгоритмы оптимизации, сверточные сети, моделирование последовательностей и др.
Машинное обучение с использованием библиотеки Н2О — эта книга научит вас использовать алгоритмы машинного обучения, реализованные в Н2О, с упором на наиболее важные для продуктивной работы аспекты.
Введение в статистическое обучение с примерами на языке R — книга представляет собой доступно изложенное введение в статистическое обучение – незаменимый набор инструментов, позволяющих извлечь полезную информацию из больших и сложных наборов данных, которые начали возникать в последние 20 лет в таких областях, как биология, экономика, маркетинг, физика и др.
Теоретический минимум по Big Data. Всё что нужно знать о больших данных — неважно, кто вы – деловой человек, работающий с аналитикой, начинающий программист или разработчик, «Теоретический минимум по Big Data» позволит не утонуть в бушующем океане современных технологий и разобраться в основах новой и стремительно развивающейся отрасли обработки больших данных.
Библиотека Keras – инструмент глубокого обучения — реализация нейронных сетей с помощью библиотек Theano и TensorFlow. Книга представляет собой краткое, но обстоятельное введение в современные нейронные сети, искусственный интеллект и технологии глубокого обучения.
Машинное обучение и TensorFlow — от обзора концепций машинного обучения и принципов работы с TensorFlow вы перейдете к базовым алгоритмам, изучите нейронные сети и сможете самостоятельно решать задачи классификации, кластеризации, регрессии и прогнозирования.
Глубокое обучение на Python — в данной книге о глубоком обучении рассказывает Франсуа Шолле, который создал Keras — самую мощную библиотеку для работы с нейронными сетями.
Построение систем машинного обучения на языке Python — книга начинается с краткого введения в предмет машинного обучения и знакомства с библиотеками NumPy, SciPy, scikit-learn. Но довольно быстро авторы переходят к более серьезным проектам с реальными наборами данных, в частности, тематическому моделированию, анализу корзины покупок, облачным вычислениям и др.
Прагматичный ИИ. Машинное обучение и облачные технологии — тщательно изучив эту незаменимую книгу от Ноя Гифта, легендарного эксперта по языку Python, вы легко научитесь писать облачные приложения с использованием средств искусственного интеллекта и машинного обучения, решать реалистичные задачи из таких востребованных и актуальных областей, как спортивный маркетинг, управление проектами, ценообразование, сделки с недвижимостью.
Глубокое обучение на R — книга написана для людей с опытом программирования на R, желающих быстро познакомиться с глубоким обучением на практике.
Программирование искусственного интеллекта в приложениях — данная книга посвящена вопросам искусственного интеллекта (ИИ), то есть методам и технологиям, призванным сделать ПО более умным и полезным. Рассмотренные алгоритмы в основном предназначены для встраивания в другое программное обеспечение, что позволяет создавать программы, гибко подстраивающиеся под требования и привычки пользователя.
Распознавание образов и машинное восприятие — в книге подробно рассмотрен принцип минимальной длины описания, являющийся следствием теоретико-информационного подхода к построению моделей и выбору гипотез.
Python и анализ данных — книгу можно рассматривать как современное практическое введение в разработку научных приложений на Python, ориентированных на обработку данных.
Дискретная математика для программистов — книга будет полезна студентам, изучающим курс дискретной математики, а также всем желающим проникнуть в технику написания и проверки корректности алгоритмов, включая программистов-практиков.
Data Science. Наука о данных с нуля — книга позволяет изучить науку о данных (Data Science) и применить полученные знания на практике. Она написана так, что способствует погружению в Data Science аналитика, фактически не обладающего глубокими знаниями в этой прикладной дисциплине.
Data Science For Dummies — data Science For Dummies is the perfect starting point for IT professionals and students who want a quick primer on all areas of the expansive data science space.
Аналитика и Data Science — когда люди не инженерных специальностей слышат аналитика и Data Science, то представляют разное. Кто-то видит таблицы и графики. Кто-то неподъемно сложные математические формулы. Кто-то программирование и искусственный интеллект. Но истоки этих понятий из области статистики, которая делится на описательную и аналитическую. И эта кажущаяся непостижимой аналитика — на самом деле нескучная, интересная и простая вещь.
Аналитическая культура. От сбора данных до бизнес-результатов — это практическое пошаговое руководство по внедрению в вашей организации управления на основе данных. Карл Андерсон, директор по аналитике в компании Warby Parker, провел интервью с ведущими аналитиками и учеными и собрал кейсы, которые и легли в основу данной книги.
Создаем нейронную сеть — эта книга представляет собой введение в теорию и практику создания нейронных сетей. Она предназначена для тех, кто хочет узнать, что такое нейронные сети, где они применяются и как самому создать такую сеть, не имея опыта работы в данной области.
Искусственный интеллект. Современный подход — помимо сугубо теоретической части, представлено множество примеров алгоритмов, версии которых, реализованные на различных языках программирования, можно найти на сопровождающем книгу интернет-ресурсе.
Нейронные сети. Полный курс — в книге рассматриваются основные парадигмы искусственных нейронных сетей. Представленный материал содержит строгое математическое обоснование всех нейросетевых парадигм, иллюстрируется примерами, описанием компьютерных экспериментов, содержит множество практических задач.
Введение в анализ данных. Учебник и практикум — в данном учебнике, подготовленном на основе большого международного опыта исследований и преподавания, излагаются основные методы анализа данных, относящихся прежде всего к одному или двум изучаемым признакам.
Анализ данных. Учебник — рассмотрены основные методы систематизации, обработки и анализа статистических данных, включающие описательные методы анализа данных, особенности и основные понятия вероятностно-статистического подхода к анализу данных.
Прикладные методы анализа данных и знаний — в книге отражены оригинальные результаты, полученные автором и его сотрудниками. Большая часть приведенных в ней алгоритмов давно и широко применяется при решении прикладных задач из области геологии, медицины, экономики, океанологии, речевой технологии и многих других.
Анализ данных и регрессия — в книге исследуются проблемы границ применимости статистических методов к анализу реального мира, проблемы качества статистических выводов — что в них существенно и что несущественно.
R в действии. Анализ и визуализация данных на языке R — «R в действии» — это руководство по обучению этому языку с особым вниманием к практическим задачам. В данной книге представлены полезные примеры статистической обработки данных и описаны изящные методы работы с запутанными и неполными данными, а также с данными, распределение которых отлично от нормального и с которыми трудно справиться обычными методами.
Удовольствие от x. — увлекательная экскурсия в мир математики от одного из лучших преподавателей в мире. «Математика пронизывает все в этом мире, включая нас самих, но, к сожалению, мало кто понимает этот универсальный язык настолько хорошо, чтобы по достоинству оценить его мудрость и красоту. Стивен Строгац — тот самый учитель математики, о котором вы мечтали в школе. Учитель, который способен зажечь искру интереса и привить любовь к своему предмету на всю жизнь. В этой невероятно легкой и увлекательной книге, он дает всем нам второй шанс познакомиться с математикой.
Введение в современную математику. Начальные понятия — в книге систематически описываются начальные понятия математики „множество“, „кортеж“, „соответствие“, „функция“, „отношение“. Даются определения некоторых „школьных“ терминов и обозначений (»числовые неравенства", «абсолютная величина», «факториал» и др.)
Конкретная математика. Математические основы информатики — назначение данной книги — обеспечить читателя техникой оперирования с дискретными объектами, что совершенно необходимо для математиков, работающих в области информатики. Книга ориентирована в первую очередь на практиков (хотя и теоретики найдут в ней много полезного), и изобилует массой конкретных примеров и упражнений.
Математика без формул. Книга первая — в живой и доходчивой форме рассказывается о теоремах, аксиомах и определениях, множествах и отображениях, отношениях, последовательностях и рядах, функциях и их свойствах, дифференциальном и интегральном исчислении.
Математика без формул. Книга вторая — сведения о функциональных рядах, линейном и метрическом пространствах, аффинных преобразованиях и группах преобразований, а также об элементах математической логики.
Азбука математического анализа. Беседы об основных понятиях. Учебное пособие — в настоящей книге рассматриваются основные понятия и определения математического анализа, изучаемого в средней школе: бесконечная числовая последовательность, предел последовательности, функция и предел функции, дифференцирование и дифференциальные уравнения, интегралы, производные и первообразные. Изложение построено в форме диалога между автором и читателем, являясь одновременно обстоятельным и доступным. Книга предназначена для всех, кто изучает математический анализ, в том числе самостоятельно.
Лекции по высшей математике — книгу можно использовать как при прохождении курса в институте, так и при самообразовании, ее можно читать в том или ином объеме в зависимости от потребностей. Важной особенностью книги является ее нацеленность на воспитание прикладного математического мышления и облегчение дальнейшего применения математики в общеинженерных и специальных дисциплинах.
Что такое математика? — книга предназначена для школьников, студентов, преподавателей, а также для всех интересующихся развитием математики и ее структурой.
Основы математического анализа — «основы математического анализа» задуманы как учебник анализа для студентов первого и второго курсов математических отделений университетов.
«Распознавание образов: Введение в методы статистического обучения» — предлагаемая книга посвящена общим методам статистического обучения, в частности задаче распознавания. В ней предпринята попытка компактно и единообразно изложить основные современные универсальные методы распознавания и используемый в них математический аппарат.
Машинное обучение и анализ данных. Избранные статьи — настоящее издание представляет собой сборник избранных статей Яковлева Евгения Аркадьевича, экстраординарного специалиста в области информационных технологий, советника Российской Академии Естествознания, представленного к многочисленным наградам. В нем собраны, по мнению автора, наиболее интересные и имеющие невероятную научную и практическую ценность работы. Книга адресована широкому кругу читателей-специалистов, в чьи интересы входит машинное обучение.
Apache Kafka. Потоковая обработка и анализ данных — при работе любого enterprise-приложения образуются данные: это файлы логов, метрики, информация об активности пользователей, исходящие сообщения и т. п. Правильные манипуляции над всеми этими данными не менее важны, чем сами данные.
Статистический анализ и визуализация данных с помощью R — книга адресована студентам, аспирантам, а также молодым и состоявшимся ученым, желающим освоить классические и современные методы анализа данных с использованием языка R.
Метрический анализ и обработка данных — основная цель книги – ознакомить читателя с наиболее эффективными и апробированными классическими и новыми стохастическими и детерминированными методами оценки и прогнозирования, научить использовать эти методы при решении конкретных задач обработки данных.
Методы и алгоритмы анализа данных и их моделирование в MATLAB — рассматриваются модели, методы и алгоритмы анализа данных, используемые в современных системах обработки информации. Приводятся основные понятия и определения общей теории информационных систем, анализируется типовая структура систем извлечения информации и систем обработки информации, рассматриваются типовые задачи анализа данных в системах обработки информации и базовые подходы для их решения.
Анализ данных на компьютере. Учебное пособие — в учебном пособии без лишнего формализма излагаются основные идеи и понятия математической статистики, необходимые на практике для анализа данных. На примерах подробно рассмотрены важнейшие постановки статистических задач и методы их решения, включая расчеты на компьютере в пакете SPSS.
Статистические методы анализа данных. Учебник — в учебнике рассмотрены основные темы курса статистики, включенные в образовательный стандарт бакалавриата по направлению «Экономика». Каждая глава включает перечень компетенций, теоретический материал, сопровожденный числовыми примерами на условных и фактических данных, контрольные вопросы, тесты и задания, упражнения компьютерного практикума, которые предназначены для самостоятельной работы студентов, а также для работы в ходе практических занятий.
Регрессионный анализ данных в пакете Mathcad — книга содержит основные теоретические положения по следующим разделам регрессионного анализа экспериментальных данных: регрессионные модели и регрессионное моделирование, парный и множественный регрессионный анализ, построение регрессионных моделей на практике.
Основы компьютерной математики с использованием системы MATLAB — в настоящем учебном пособии представлено описание методики изучения одного из важнейших разделов математики — «Линейная алгебра и аналитическая геометрия» — с использованием системы компьютерной математики MATLAB. В учебное пособие включено более 170 примеров и упражнений, около 200 индивидуальных заданий и более 100 контрольных вопросов.
Глубокое обучение с точки зрения практика — эта книга не только содержит практически полезную информацию о предмете, но и поможет приступить к созданию эффективных сетей глубокого обучения.
Конвейер реального времени. Потоковая обработка данных — эта книга содержит все необходимое для понимания потоковой обработки. Эта насыщенная идеями книга научит вас думать об эффективном взаимодействии с быстрыми потоками данных. В ней выдержан идеальный баланс между широкой картиной и деталями реализации.
Элегантный SciPy — если вы — ученый, который программирует на Python, то это практическое руководство для вас! Оно не только познакомит вас с основополагающими компонентами библиотеки SciPy и другими связанными с ней библиотеками, но и даст вам ощущение красоты и удобочитаемости программного кода, который вы сможете применять на практике. Вы научитесь писать элегантный программный код, который ясен, краток и эффективен при исполнении решаемой задачи.
Секреты Python. 59 рекомендаций по написанию эффективного кода — опираясь на свой многолетний опыт создания инфраструктурных проектов для компании Google, автор раскрывает секреты малоизвестных аспектов и идиом Python, радикально влияющих на поведение и производительность кода.
Язык R в задачах науки о данных. Импорт, подготовка, обработка, визуализация и моделирование данных — эта книга задумана как введение в вычислительную среду R, среду разработки RStudio и библиотеку tidyverse — коллекцию пакетов, совместное использование которых обеспечивает быстроту и легкость анализа данных. Книга ориентирована на читателей, не имеющих предварительного опыта программирования, и предназначена для того, чтобы помочь им в как можно более короткие сроки начать решать задачи науки о данных.
Построение систем машинного обучения на языке Python — книга рассчитана на программистов, пишущих на Python и желающих узнать о построении систем машинного обучения с помощью библиотек с открытым исходным кодом.
Big Data простым языком — но насколько глубока кроличья нора? Каждому предстоит разобраться в этом самому. Эта книга поможет донести основные принципы проектирования и создания таких интерфейсов управления бизнесом, обществом и окружающим нас миром посредством Больших данных. Читайте, наслаждайтесь и помните: сожжение книг противозаконно.
Чистый Python. Тонкости программирования для профи — чтобы освоить Python, нужно не только понимать теоретические аспекты языка. Для достижения этой цели придется понять и принять общие правила и самые лучшие практические приемы, используемые сообществом. Книга Дэна поможет вам в этом путешествии. Я убеждена, что, прочитав ее, вы почувствуете себя увереннее.
Стандартная библиотека Python 3. Справочник с примерами — к книге имеются готовые примеры кода, предназначенного для работы с текстом, структурами данных, значениями даты и времени, файловой системой, процессами, потоками, электронной почтой, пакетами и другими ресурсами.
На этом наша короткая подборка подошла к концу. Больше информации о машинном обучении и Data Science вы узнаете подписавшись на мой аккаунт на Хабре и на мой Telegram-канал Нейрон. Не пропускайте будущих статей. Если у вас есть, книги, которыми вы можете поделиться — добавляйте ссылки на них в комментарии, самые крутые я добавлю в список.