Эмпирическая взаимосвязь между средним, медианным и модой

Внутри наборов данных существует множество описательных статистических данных. Среднее значение, медиана и мода – все это меры центра данных, но они рассчитывают это по-разному:

  • Среднее значение равно вычисляется путем сложения всех значений данных вместе, а затем деления на общее количество значений.
  • Медиана рассчитывается путем перечисления значений данных в порядке возрастания с последующим нахождением среднего значения в списке.
  • Режим рассчитывается путем подсчета того, сколько раз встречается каждое значение. Наиболее часто встречающееся значение – это режим.

На первый взгляд может показаться, что между этими тремя числами нет связи . Однако оказывается, что существует эмпирическая взаимосвязь между этими мерами центра.

Теоретические и эмпирические

Прежде чем мы Далее, важно понимать, о чем мы говорим, когда говорим об эмпирических отношениях, и противопоставляем это теоретическим исследованиям. Некоторые результаты в статистике и других областях знаний можно теоретически вывести из некоторых предыдущих утверждений. Мы начинаем с того, что знаем, а затем используем логику, математику и дедуктивное мышление и смотрим, к чему это нас приведет. Результат является прямым следствием других известных фактов.

Противоречие с теоретическим – это эмпирический способ приобретения знаний. Вместо того, чтобы исходить из уже установленных принципов, мы можем наблюдать за миром вокруг нас. На основании этих наблюдений мы можем сформулировать объяснение увиденного. Так делается большая часть науки. Эксперименты дают нам эмпирические данные. Затем цель состоит в том, чтобы сформулировать объяснение, которое подходит для всех данных.

Эмпирическая взаимосвязь

В статистике существует эмпирически обоснованная взаимосвязь между средним, медианой и модой. Наблюдения за бесчисленными наборами данных показали, что в большинстве случаев разница между средним значением и модой в три раза превышает разницу между средним и медианным значением. Это соотношение в форме уравнения выглядит следующим образом:

Среднее – Режим = 3 (Среднее – Медиана).

Пример

Чтобы увидеть вышеупомянутую взаимосвязь с данными из реального мира, давайте взглянем на население штатов США в 2010 году. Численность населения в миллионах была следующей: Калифорния – 36,4, Техас – 23,5. , Нью-Йорк – 19,3, Флорида – 18,1, Иллинойс – 12,8, Пенсильвания – 12,4, Огайо – 11,5, Мичиган – 10,1, Джорджия – 9,4, Северная Каролина – 8,9, Нью-Джерси – 8,7, Вирджиния – 7,6, Массачусетс – 6,4, Вашингтон – 6,4, Индиана – 6,3, Аризона – 6,2, Теннесси – 6,0, Миссури – 5,8, Мэриленд – 5,6, Висконсин – 5,6, Миннесота – 5,2, Колорадо – 4,8, Алабама – 4,6, Южная Каролина – 4,3, Луизиана – 4,3, Кентукки – 4,2 , Орегон – 3,7, Оклахома – 3,6, Коннектикут – 3,5, Айова – 3,0, Миссисипи – 2,9, Арканзас – 2,8, Канзас – 2,8, Юта – 2,6, Невада – 2,5, Нью-Мексико – 2,0, Западная Вирджиния – 1. 8, Небраска – 1,8, Айдахо – 1,5, Мэн – 1,3, Нью-Гэмпшир – 1,3, Гавайи – 1,3, Род-Айленд – 1,1, Монтана – 0,9, Делавэр – 0,9, Южная Дакота – 0,8, Аляска – 0,7, север Дакота – 0,6, Вермонт – 0,6, Вайоминг – 0,5

Средняя численность населения составляет 6,0 миллиона человек. Средняя численность населения составляет 4,25 миллиона человек. Режим 1,3 миллиона. Теперь мы рассчитаем отличия от приведенного выше:

  • Среднее – Режим = 6,0 миллиона – 1,3 миллиона = 4,7 миллиона.
  • 3 (Среднее – Медиана) = 3 (6,0 миллиона – 4,25 миллиона) = 3 (1,75 миллиона) = 5,25 миллиона.

Хотя эти два числа различий не совпадают в точности, они относительно близки друг к другу.

Применение

Есть пара приложений по вышеуказанной формуле. Предположим, что у нас нет списка значений данных, но мы знаем любые два из среднего, медианы или моды. Вышеупомянутая формула может использоваться для оценки третьей неизвестной величины.

Например, если мы знаем, что у нас есть среднее значение 10, режим 4, какова медиана нашего набора данных? Поскольку Среднее – Режим = 3 (Среднее – Медиана), мы можем сказать, что 10 – 4 = 3 (10 – Медиана). С помощью некоторой алгебры мы видим, что 2 = (10 – Медиана), и поэтому медиана наших данных равна 8.

Еще одно применение приведенной выше формулы: при расчете перекоса. Поскольку асимметрия измеряет разницу между средним значением и модой, мы могли бы вместо этого вычислить 3 (Среднее – Режим). Чтобы сделать это количество безразмерным, мы можем разделить его на стандартное отклонение, чтобы получить альтернативный способ вычисления асимметрии, кроме использования моментов в статистике.

Слово о Внимание

Как видно выше, указанное выше не является точным соотношением. Вместо этого это хорошее практическое правило, аналогичное правилу диапазона, которое устанавливает приблизительную связь между стандартным отклонением и диапазоном. Среднее значение, медиана и мода могут не точно соответствовать указанным выше эмпирическим отношениям, но есть большая вероятность, что они будут достаточно близкими.

Оцените статью
recture.ru
Добавить комментарий