Добрый день, уважаемые читатели.
Пролетели 2 недели и я представляю Вам новую подборку материалов на тему анализа данных. В этот раз материала получилось довольно не много, но от этого статьи и заметки попавшие в дайджест не становятся менее интересными.
Итак, из сегодняшней подборки вы узнаете как классифицировать текст с помощью наивного Байеса, узнаете как увеличить скорость градиентного спуска. Кроме этого будет очередная статья о том, чем должен пользоваться аналитик и какими навыками обладать и еще много чего интересного
Теория
- Кластерный анализ (на примере сегментации потребителей) часть 1 (RU) (спасибо great_boba за перевод)
- Классификация текста с помощью байсевского классификатора (EN)
Инструкция по применению наивного байсевского классификатора к тексту - Как банки могут повысить значимость клиентских данных (EN)
Довольно интересная презентация на указанную тему. - Анализ среды функционирования (EN)
Небольшая инструкция по методологии сравнительного анализа деятельности сложных технических, экономических и социальных систем. - Тюнинг скорость обучения в градиентного спуска (EN)
- Современные аспекты представления текстов при анализе естественного языка: классические и альтернативные подходы (RU)
- Hard and Soft навыки аналитика данных (EN)
Еще одна заметка о том, какими навыками должен обладать аналитик - 7 уроков анализа данных от McGraw-Hill (EN)
Полезные советы от гуру анализа - Используем методы отбора компонент для классификации текста (EN)
Практика использования различных инструментов
- Разработка наивного байесовского классификатора на JAVA (EN)
- Развертывание скорринговой системы для прогнозирования (EN)
Развертывание системы с помощью OpenCPU и R - Анализ данных Google Analytics c помощью Big Query и R (EN)
Обучающие видео
Разные статьи по теме
- Если вы думаете, что большие данные является числовыми, подумайте еще раз (EN)
- Трансформация анализа данных в науку о данных (EN)
Рассуждения на тему, что включает в себя понятие Data Science - Визуализация поможет разобраться в «грязных» данных (EN)
О том, как различные инструменты визуализации помогут разобраться в зашумленных данных. - Большой вызов для больших данных: изменение климата (EN)
Заметка о том как большие данные применяются при прогнозировании погоды - Что такое машинное обучение? Это зависит от того, кого вы спрашиваете (EN)
Что люди могут понимать под термином «машинное обучение» - Использование больших данных для оптимизации цифрового маркетинга (EN)
- Как большие данные могут улучшить ваши отношения с клиентами (EN)
В статье на ряд вопрос по обозначенной теме отвечает CEO SugarCRM - Как работать с Big Data. 10 правил (RU)
- Эффективная оценка медианы (RU)
Автор: kuznetsovin