В течение нескольких месяцев мы собирали памятки по искусственному интеллекту, которыми периодически делились с друзьями и коллегами. В последнее время сложилась целая коллекция, и мы добавили к памяткам описания и/или цитаты, чтобы было интереснее читать. А в конце вас ждёт подборка по сложности «О большое» (Big-O). Наслаждайтесь.
Нейронные сети
Памятка по нейронным сетям
Графы нейронных сетей
Памятка по графикам нейронных сетей
Памятка по нейронным сетям
Обзор по машинному обучению
Памятка по машинному обучению
Алгоритм Scikit-learn
Эта памятка по машинному обучению поможет найти подходящий алгоритм для оценки, что является наиболее сложной частью работы. Блок-схема поможет проверить документацию и задаст общее направление по каждому алгоритму. Это позволит лучше понять стоящие перед вами проблемы и способы их решения.
Scikit-learn (ранее известная как scikits.learn) — это бесплатная библиотека машинного обучения для Python. В нее входят различные виды классификации, регрессии и алгоритмы кластеризации, включающие метод опорных векторов, алгоритм Random forest («случайный лес»), градиентный бустинг, метод k-средних и DBSCAN. Scikit-learn предназначена для взаимодействия с вычислительными и научными библиотеками Python NumPy и SciPy.
Памятка по Scikit-learn
Памятка по алгоритмам машинного обучения
Эта памятка от Microsoft Azure поможет с выбором подходящих алгоритмов машинного обучения для вашего предсказательного аналитического решения. Вначале памятка спросит о природе данных, а затем посоветует наилучший алгоритм.
Python для Data Science
Памятка по Python для Data Science
Памятка по большим данным
TensorFlow
В мае 2017 года Google анонсировал TPU второго поколения, а также их доступность в Google Compute Engine. TPU второго поколения обладают производительностью до 180 терафлопов, а при кластеризации по 64 TPU — до 11,5 петафлопов.
Памятка по TensorFlow
Keras
В 2017 году команда TensorFlow в Google решила внедрить поддержку Keras в основную библиотеку TensorFlow. Шолле (Chollet) объяснил, что Keras является, скорее, интерфейсом, чем сквозной системой машинного обучения. Он предоставляет высокоуровневый, более интуитивный набор абстракций, который упрощает конфигурирование нейронных сетей, вне зависимости от используемой в бэкенде библиотеки научных вычислений
NumPy
NumPy предназначен для Cpython, эталонной реализации Python, которая является не оптимизирующим интерпретатором байт-кода. Математические алгоритмы, написанные для этой версии Python, часто работают гораздо медленнее скомпилированных аналогов. Библиотека NumPy частично решает проблему скорости за счет многомерных массивов, а также функций и операторов, оптимизированных для работы с массивами. Необходимо будет переписать часть кода с использованием NumPy, в основном внутренние циклы.
Памятка по NumPy
Pandas
Название «Pandas» происходит от эконометрического термина "panel data", который применяется для многомерных структурированных наборов данных.
Памятка по Pandas
Data Wrangling
Data Wrangling («выпас» данных, первичная обработка данных) — этот термин начинает проникать в поп-культуру. В фильме 2017 «Конг: Остров черепа» один из героев представлен как «Стив Вудвард, наш data wrangler».
Памятка по Data Wrangling
Памятка по Pandas Data Wrangling
Data Wrangling с помощью dplyr и tidyr
Памятка по Data Wrangling с dplyr и tidyr
Памятка по Data Wrangling с dplyr и tidyr
SciPy
В основе SciPy лежит объект-массив NumPy. Эта библиотека является частью стека NumPy, который включает такие инструменты, как Matplotlib, Pandas и SymPy, а также расширяющийся набор библиотек для научных вычислений. У стека NumPy и приложений MATLAB, GNU Octave и Scilab одна и та же аудитория пользователей. Стек NumPy также иногда называют стеком SciPy.
Памятка по SciPy
Matplotlib
Matplotlib — это библиотека для построения графиков для Python и его вычислительного математического расширения NumPy. Она предоставляет объектно-ориентированный API для встраивания графиков в приложения с использованием универсальных GUI-инструментов, таких как Tkinter, wxPython, Qt, или GTK+. Существует также процедурный интерфейс «pylab» на основе конечного автомата (например, OpenGL), разработанный так, чтобы походить MATLAB, хотя его использование не рекомендуется. SciPy использует matplotlib.
Pyplot — это модуль matplotlib, который предоставляет интерфейс наподобие MATLAB. Matplotlib применяется так же, как и MATLAB, позволяет использовать Python, и к тому же бесплатен.
Памятка по Matplotlib
Визуализация данных
Памятка по визуализации данных
Памятка по ggplot
PySpark
Памятка по PySpark
«О большое» (Big-O)
Памятка по сложности алгоритмов
Памятка по сложности алгоритмов
Памятка по сложности операций со структурами данных в алгоритмах
Памятка по сложности алгоритмов сортировки массива
Источники
Памятка по сложности алгоритмов
Памятка по Bokeh
Памятка по Data Science
Памятка по Data Wrangling
Памятка по Ggplot
Памятка по Keras
Памятка по машинному обучению
Памятка по машинному обучению
Памятка по машинному обучению
Памятка по Matplotlib
Памятка по нейросетям
Памятка по графам нейросетей
Нейросети
Памятка по Numpy
Памятка по Pandas
Памятка по Pandas
Памятка по Pyspark
Памятка по Scikit
Памятка по Scikit-learn
Памятка по Scipy
Памятка по TensorFlow
Автор: NIX_Solutions