Расскажу я вам о способах визуализации данных, которые помогают бизнесу быстро оценивать информацию и принимать обоснованные решения. Постараюсь объяснить теоретические аспекты и продемонстрировать на практическом примере. Донести плюсы и минусы этих визуализаций.
В работе часто сталкиваюсь с нежеланием включать в дашборды визуализации сложней линейных, столбиковых, круговых диаграмм. Из аргументов приводят непонятность таких визуализаций стейкхолдерами и пользователями продукта и как следствие низкую продуктовую ценность, увеличение затрат на разработку и поддержку. С увеличением затрат соглашусь, но поразмышляю в статье и опровергну низкую продуктовую ценность.
Эти материалы задумывались как раз как подспорье в объяснении позиции на работе. Надеюсь, будут полезны для работы или как ликбез в визуализации данных.
Не бойтесь пузырьков! Как использовать Bubble Chart для бизнеса
Пузырьковая диаграмма (Bubble Chart) — это инструмент, который помогает объединить множество переменных в одном графике, позволяя увидеть важные зависимости и сделать выводы быстрее, чем при анализе таблиц. В этой статье я расскажу, как использовать пузырьковую диаграмму для анализа складского учёта и повышения эффективности бизнес-процессов.
Этот тип диаграмм, позволяет визуализировать три и более переменных одновременно. Две переменные отображаются по осям X и Y, в то время как размер пузырьков представляет третью переменную. Дополнительные данные могут быть переданы через цвет, форму или другие визуальные атрибуты пузырьков, что делает эту диаграмму мощным инструментом для отображения многомерных данных.
Каким образом показываем переменные
-
Положение в пространстве — две переменные отображаются по осям X и Y, определяют положение объекта в двухмерном пространстве.
-
Размер пузырька — отображаем количественную переменную.
-
Часть от целого — выделяем из этой количественной переменной важную часть.
-
Цвет — разделяем объекты на группы.
-
Сегментация — разделение графика на зоны для анализа.
-
Динамика во времени — отслеживание изменений переменных.
Практический пример
Ситуация:
Мы продаём товары на маркетплейсе и используем склады этого маркетплейса. Нам надо визуализировать складской учёт для оптимизации бизнес-процессов.
Товары заказывают из нескольких регионов (кластеров), на которые разделил маркетплейс. Мы стремимся, чтоб наш товар доставляли к покупателю внутри региона. Например, покупатель заказал в Москве и доставляли ему со склада в Москве, где мы предварительно сформировали запасы. Если в Москве вашего товара на складе нет, а есть в другом регионе то товар оттуда перебросят в Москву и доставят покупателю. Казалось бы хорошо, но нет )))
Есть несколько минусов, из очевидных увеличится время доставки, и от товара могут отказаться в пользу более быстрой доставки, конкуренция. Увеличится оплата за логистику. И упадет показатель локальных заказов, который в свою очередь влияет на стоимость логистики и отображения товаров в поиске, во как!
Хочется этого избежать и понимать в каком регионе на товар спрос. Куда делать и увеличивать поставки, чтобы поднять число локальных заказов.
У нас есть такая таблица со статданными
-
Регионы — куда привозится и где продаётся наш товар.
-
Заказы и выкупы — количество заказов и сколько из них выкупили.
-
Процент локальных заказов — это отношение заказов в регионе склада ко всем заказам. Высокий уровень локальных заказов, один из показателей влияющий на отображение товаров в поиске и на стоимость логистики.
-
Коэффициент территориального распределения (КТР) — как раз влияет на логистику, стоимость логистики умножают на этот коэффициент. Чем меньше локальных заказов, тем выше КТР.
-
Количество товара на складе — остатки на текущий момент.
-
Среднее время доставки — оно и есть, считается в днях и часах.
Ну, погнали!
1.
По X откладываем процент локальных заказов, по Y среднее время доставки и распределяем регионы на пересечении координат.
Кстати, интересный факт! )
Такой тип графиков, в которых используется только две переменных и не используется объем пузырьков называется Диаграмма рассеяния (Scatter plot) и используется для большого количества точек.
2.
Добавим размер пузырьков для отображения общего числа заказов.
3.
Внутри пузырьков отобразим долю выкупленных заказов.
4.
И дополним сегментами. Разделим график на три зоны по коэффициенту территориального распределения, когда платим повышенную логистику, обычную и пониженную.
5.
А «Где карта Билли?», как же наши цифры, без цифр то какая аналитика, так давайте добавим тултип.
По итогу, что можно «прочитать», по этой визуализации:
-
«Урал» много продаёт товаров, но 80% товаров везут из других регионов. Надо посмотреть, что продают, запланировать увеличение остатков. Этим снизятся затраты на логистику и повысится скорость доставки, что в свою очередь повысит показы в поиске, и заказы. Звучит заморочено, но это так.
-
В «Сибири» надо понять почему так много отказываются, тратим много денег на логистику, а выкупы подводят.
-
В «Центре» большое время доставки, можно сократить за счет формирования остатков, 60% туда возят из других регионов.
Но это еще не всё!
Мы смотрели по всем товарам, там допустим и платья разные и отвертки, и блендеры. Данные у нас получаются усреднённые, сразу по всем товарам. С помощью фильтрации такая визуализация станет очень конкретной! Например, отфильтровать по одному артикулу и понять, в какой регион его везти, везти больше, а с какого перебросить в другой.
Корнер-кейсы
Например, когда все параметры очень близки друг к другу будет мешанина на диаграмме. Но это не плохо, а показывает, что наши склады имеют общие проблемы или приемущества и стратегия решений общая для всех.
Как интерфейсно решить по отображению и наслоению, расскажу во второй итерации этой статьи.
Не рассмотрел здесь разделение по цветам и отображение динамики во времени. То же во вторую итерацию.
Плюсы и минусы
Плюсы
-
Главный плюс — мы начинаем видеть картинку целиком, все объекты друг относительно друга в одной системе. Визуализация воспринимается целостно и обрабатываются параллельно, в отличии от таблицы, в которой требуется последовательное чтение и сравнение. При должном опыте быстро передаёт сложную информацию с меньшей когнитивной нагрузкой.
-
Делать поверхностные (в позитивном смысле) выводы быстро, а потом идти разбираться конкретно с цифрами.
-
Многомерная визуализация позволяет отображать три и более переменных на одном графике, что упрощает анализ сложных наборов данных.
-
Возможность добавлять атрибуты (цвет, размер) для передачи дополнительной информации.
Минусы
-
Сложность восприятия — необходимо обучение для «чтения» таких графиков.
-
Проблемы с наслоением — пузырьки могут перекрывать друг друга при близких значениях. Но это решаемо!
-
Создание и поддержка диаграммы требуют ресурсов.
Итог
Что в итоге, была у нас таблица:
А стала такая Пузырьковая диаграмма:
Я не предлагаю уйти от табличного отображения данных, таблица полезна, структурирует информацию.
Пузырьковая диаграмма — мощный инструмент для визуализации сложных данных. Она позволяет увидеть общую картину и определить узкие места в бизнес-процессах. Однако для максимальной эффективности важно дополнять её таблицами и обучать пользователей. Используйте фильтры для анализа отдельных категорий товаров, а также динамические графики для отслеживания изменений во времени.
Спасибо, что уделили время этой статье! Рад, что вы дошли до конца, и надеюсь, что материал был полезен и вдохновляющим. Визуализация данных — это мощный инструмент, который, правильно применённый, может изменить подход к анализу и принятию решений.
Мне важно узнать ваше мнение! Поделитесь в комментариях.
И до встречи в следующей части! 🚀
Автор: VitTurov