Публикация по выступлению на секции R meetup @ Moscow Data Science Major (Spring 2019).
Вся презентация в pdf формате.
Почему этот вопрос актуален?
Бизнес-кейсы различны, техническая суть одинакова
- Аналитика работы колл-центра
- Аналитика продаж, включая прогнозы
- Антифрод системы
- Business process mining
- Различные аудиты (технические, финансовые)
- Складские и логистические задачи
- Activity-based costing
- Business-process monitoring
- Log-based аналитика
- Capacity management
- Текстовая аналитика (e-mail, service-desk)
- "Гибкие" дашборды и отчеты
- "интеллектуальные шины" между учетными системами (1С, СКУД, SAP, ...) и исполнительными
- ...
Является продолжением предыдущих публикаций.
Практические наблюдения
- очень многие подобные задачи сводятся к математической манипуляции с данными (CRUD системы за рамками, рассматриваем именно разнообразный процессинг и преобразование);
- 80% задач по манипуляции данными могут быть быстро и эффективно решены "под ключ" путем применения инструментария R;
- в бизнесе, как правило, задачи и требования быстро корректируются, в т.ч. из-за внешних факторов или полученных промежуточных результатов;
- "модульные" технологии хорошо приживаются и в ИТ; строительство "монолита" может занять 2-3 года, что сопоставимо со сроком жизни небольшого решения. Гораздо эффективнее быстро собрать "модульную" конструкцию, накопить практического опыта и через 2-3 года скомпоновать новое решение с учетом полученных знаний и прошедших изменений в ИТ и бизнесе.
Типичные “городские легенды” про R
- R медленный
- R трудночитаемый
- R предназначен для стат. расчетов по сложных алгоритмам
- R предназначен для интерактивной работы
Все это возникает из-за поверхностного изучения темы и используемых инструментов.
Городские легенды — заблуждения из "90-х"
- R — полноценный язык программирования, а не консольный калькулятор.
- R хорошо выступает в качестве универсального “клея” между различными платформами и C компонентами — считает быстро!
- Читаемость кода зависит от опыта разработчика. Современный стиль R — метапрограммирование. Код компактен и быстр.
- R — это экосистема, позволяет реализовать полный цикл обработки данных от импорта данных до предоставления АРМ и подготовки презентаций.
Предыдущая публикация — «Использование вычислительных возможностей R для проверки гипотезы о равенстве средних».
Автор: i_shutov