Частенько читаю Хабр и заметил что в последнее время появились Дайджесты новостей по многим тематикам, таким как веб-разработка на php, разработка на Python, мобильные приложения, но не встретил ни одного подборки по популярному сейчас направлению, а именно анализу данных и big data.
Ниже я решил собрать небольшую подборку материалов по данной теме. Т.к. на русском материалов не так много, в данный дайджест попали в основном англоязычные статьи.
Кого заинтересовала данная тема прошу подкат. А также жду замечаний, пожеланий и дополнений, буду очень рад обратной связи.
Теория
- Алгоритм ранжирования и NFL (Часть 1)
- Архитектура хранилищ данных
- С чего начать изучение анализа данных
- Что должен знать аналитик о вычислениях с плавающей точкой
- Как обнаружить ложные корреляции и найти верные
- Пример использования Map-Reduce на реальных данных
Книги
Практика использования различных инструментов
- Реализация сверхточной нейронной сети на Python
- Использование AQL для анализа Twitter
- Чтение и запись по протоколу Redis с помощью Go
- Hive vs Pig. На что мне столько ETL?
- Превосходные возможности plot.ly
Обучающие видео
Разные статьи по теме
- Автоматическая определение криминальных сайтов с использованием методов кластеризации
- Мини-исследование: 4 функциональных группы специалистов по анализу
- 50 образцовых компаний использующих «большие данные»
- Можно ли строить искусственный сверхразум без полного копирования человеческого мозга
- Потенциал для «больших данных» для изучения Вселенной
- 6 категорий специалистов по данным
- 66 вопросов для собеседования со специалистом по анализу данных
- Что прогнозная аналитика?
- Можем ли мы придумать показатель, лучше R-квадрат?
- История статистики
- Подборка статей по SQL, BI, анализу и визуализации данных ()
- «Большие данные» нужны аналитикам, но аналитики не нужны им
- 50 новых инструментов для анализа и визуализации данных
Автор: kuznetsovin