Среднее арифметическое: физический смысл и визуализация

в 12:24, , рубрики: визуализация данных, визуальное восприятие, гистограмма, среднее арифметичексое

Переменная величина – атрибут (свойство) системы, меняющий свое числовое значение. Множество значений переменой величины может иметь вид:

65, 59, 62, 63, ...

Человек анализирует числовые данные такого рода и принимает решения. Знание температуры воздуха помогает правильно одеться. Курс валюты говорит покупать ее или продавать.

Когда значений одно или несколько, то никаких трудностей не возникает. Но когда значений десятки или сотни, то человеку сложно сразу понять, что означают полученные данные. На помощь приходят интегральные характеристики множеств значений и визуализация.

Одна из интегральных характеристик множества значений переменной величины – среднее арифметическое. Посмотрим на него с точки зрения статистики, физики (механики) и эстетики.

Три точки зрения на числовые данные

Среднее арифметическое двух чисел

Начнем с минимального набора чисел, для которых можно подсчитать среднее арифметическое. Вот два числа:

5 и 11

Их среднее арифметическое:

(5 + 11) / 2 = 8

Два наблюдения:

  • Среднее арифметическое находится посередине двух чисел (больше меньшего, но меньше большего).
  • Среднее арифметическое не всегда входит в анализируемый набор чисел (не равно ни одному из двух чисел).

Физический смысл среднего арифметического

Изобразим два исходных числа и их среднее арифметическое на числовой оси:

Числовая ось как весы

Числа помечены черными кружками, а среднее арифметическое красным треугольником. Полученная конструкция – это весы. Для весов в равновесии правило рычага требует, чтобы моменты сил были равны. Весы не наклоняются ни в одну, ни в другую сторону, так как крутящий момент отсутствует.

M1 == M2

В механике момент силы – это произведение силы F на расстояние l:

M = F * l

На плечи весов действует сила, создаваемая весом точек-"грузов". Обозначив расстояния от грузов до точки опоры l1 и l2, получим:

w1 * l1 == w2 * l2

Точки-"грузы" отличаются только координатой на оси. Будем считать их вес одинаковым. Тогда:

l1 == l2

Обозначив m координату точки опоры весов, получим:

m - x1 == x2 - m

m = (x1 + x2) / 2 = (5 + 11) / 2 = 8

Аналогично из формулы равенства моментов для произвольного количества N точек-"грузов" с одинаковым весом w выводится формула среднего арифметического. Равенство моментов для обоих плеч весов:

w * l1 + w * l2 + ... == w * lk + ... + wlN

Координата опоры весов m:

(m - x1) + (m - x2) + ... == (xk - m) + ... + (xN - m)

m * N == x1 + x2 + ... + xk + ... xN

m = sum (x1 + x2 + ... + xk + ... xN) / N

Формула среднего арифметического дает координату точки опоры весов, находящихся в равновесии.

Визуальное восприятие равновесия

Равновесие в изобразительном искусстве играет важнейшую роль. Если при создании картины не достигнуто равновесие ее элементов, то произведение не будет законченным. В каждой картине художник создает равновесие различных визуальных сил.

Рудольф Арнхейм отмечает, что человеческое зрение способно обнаруживать малейшие отклонения от центра равновесия в изображении:

Центр квадрата и круг

На приведенном примере слева круг находится в состоянии равновесия, а справа нет. Несмотря на то, что точка равновесия (центр квадрата) никак не отмечена на рисунке, человек с большой точностью может определить, находится ли круг в этой точке или нет.

Несмотря на то, что точка равновесия может быть не изображена, человек воспринимает ее как часть визуальной структуры:

Невидимый центр квадрата воспринимается как существующий

Аналогично и среднее арифметическое: необязательно входит в набор чисел, но значимо для его восприятия и оценки.

Математическое ожидание случайной величины

Для случайной величины аналогом среднего арифметического служит математическое ожидание. Вероятность при этом можно считать весом точки-"груза". Формула равенства моментов с разными весами:

w1 * l1 + w2 * l2 + ... == wk * lk + ... + wN * lN

Теперь точка опоры весов в равновесии это mu:

w1 * (mu - x1) + w2 * (mu - x2 ) + ... == wk * (xk - mu) + ... + wN * (xN - mu)

w1 * mu - w1 * x1 + w2 * mu - w2 * x2 + ... == wk * xk - wk * mu + ... + wN * xN - wN * mu

mu * (w1 + w2 + ... + wk + wN) == w1 * x1 + w2 * x2 + ... + wk * xk + ... + xN * wN

Сумма всех вероятностей равна 1. Следовательно, и сумма весов равна 1. Тогда формула координаты точки весов в равновесии равна:

mu = w1 * x1 + w2 * x2 + ... + wk * xk + ... + xN * wN

Это и есть формула матетатического ожидания.

Гистограмма

Гистограмма – это визуализация (геометрическое изображение) значений переменной величины с учетом вероятностей. Гистограмма показывает для выборки значений, какие из них появляются часто, какие реже, а какие совсем редко.

На гистограмме возможные значения откладываются по горизонтальной оси, а веса – по вертикальной. Диапазон значений по вертикали очевиден – от 0 до 1 (значения вероятности). По горизонтали диапазон должен включать ожидаемые значения переменной.

Гистограмма представляет собой простую картину (экземпляр изобразительного искусства). Зритель ожидает, что точка равновесия множества значений будет ровно посередине гистограммы:

Ожидаемая точка среднего для распределения в центре гистограммы

Исходя из этого должен подбираться диапазон значений для горизонтальной оси гистограммы. Тогда сразу будет видно отклонение свойств выборки значений от ожидаемых:

Полученное среднее выборки смещено относительно ожидаемого

Такого рода отклонение может быть вызвано выбросами. Выбросы – это значения, сильно отличающиеся от остальных. Благодаря правилу рычага, даже небольшое количество выбросов меняет точку равновесия и среднее арифметическое:

Дайте мне точку опоры, и я переверну Землю. Архимед

Выводы

  • Среднее арифметическое – интегральная характеристика набора числовых данных (выборки). Применяется как описательная характеристика в совокупности с другими.
  • Нормально, что среднее значение не входит в набор данных. Среднее арифметическое не может заменить полное описание полученной выборки.
  • Интервал значений гистограммы должен быть подобран таким образом, чтобы ожидаемое среднее арифметическое было посередине. Тогда будет сразу видно отклонение параметров выборки от ожидаемых значений.
  • Среднее арифметическое подвержено влиянию выбросов – значений, сильно отличающихся от остальных значений переменной величины.

Ссылки

Автор: vmalino

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js