Что такое медиана?

Полуночный показ новейшего популярного фильма. Люди выстраиваются в очередь возле театра, ожидая входа. Предположим, вас просят найти центр очереди. Как бы вы это сделали?

Есть несколько разных способов решения этой проблемы. В конце концов, вам нужно будет вычислить, сколько человек было в очереди, а затем взять половину этого числа. Если общее количество четное, то центр линии будет между двумя людьми. Если общее число нечетное, то центром будет один человек.

Вы можете спросить: «Что нужно делать при нахождении центра линии? со статистикой? » Идея поиска центра — именно то, что используется при вычислении медианы набора данных.

Что такое медиана?

Медиана — это один из трех основных способов найти среднее значение статистических данных. Расчет сложнее, чем в режиме, но не так трудоемок, как расчет среднего значения. Это центр во многом так же, как нахождение центра в ряду людей. После перечисления значений данных в порядке возрастания медиана — это значение данных с одинаковым количеством значений данных над ним и под ним.

Случай первый: An Нечетное количество значений

Одиннадцать батарей проверяются, чтобы узнать, на сколько их хватит. Их время жизни в часах равно 10, 99, 100, 103, 103, 105, 110, 111, 115, 130, 131. Каково среднее время жизни? Поскольку имеется нечетное количество значений данных, это соответствует строке с нечетным количеством людей. Центр будет средним значением.

Имеется одиннадцать значений данных, поэтому шестое находится в центре. Таким образом, среднее время автономной работы — шестое значение в этом списке, или 105 часов. Обратите внимание, что медиана — это одно из значений данных.

Случай второй: четное число значений

Взвешено двадцать кошек . Их вес в фунтах равен 4, 5, 5, 5, 6, 6, 6, 7, 7, 7, 8, 8, 9, 10, 10, 10, 11, 12, 12, 13. Что это средний вес кошки? Поскольку имеется четное количество значений данных, это соответствует строке с четным числом людей. Центр находится между двумя средними значениями.

В этом случае центр находится между десятым и одиннадцатым значениями данных. Чтобы найти медиану, мы вычисляем среднее этих двух значений и получаем (7 + 8)/2 = 7,5. Здесь медиана не является одним из значений данных.

Есть другие случаи?

Единственные две возможности — иметь четное или нечетное количество значений данных. Таким образом, два приведенных выше примера — единственно возможные способы вычисления медианы. Либо медиана будет средним значением, либо медиана будет средним из двух средних значений. Обычно наборы данных намного больше, чем те, которые мы рассмотрели выше, но процесс поиска медианы такой же, как в этих двух примерах.

Эффект выбросов

Среднее значение и мода очень чувствительны к выбросам. Это означает, что наличие выброса резко повлияет на оба этих показателя центра. Одним из преимуществ медианы является то, что на нее не так сильно влияют выбросы.

Чтобы увидеть это, рассмотрим набор данных 3, 4, 5, 5 , 6. Среднее значение составляет (3 + 4 + 5 + 5 + 6)/5 = 4,6, а медиана равна 5. Теперь сохраните тот же набор данных, но добавьте значение 100: 3, 4, 5, 5, 6 , 100. Ясно, что 100 — это выброс, так как он намного больше, чем все другие значения. Среднее значение нового набора теперь (3 + 4 + 5 + 5 + 6 + 100)/6 = 20,5. Однако медиана нового набора равна 5. Хотя

Применение медианы

Из-за того, что мы видели выше, медиана является предпочтительной мерой среднего, когда данные содержат выбросы. Когда сообщается о доходах, обычно указывается средний доход. Это происходит потому, что средний доход искажен небольшим количеством людей с очень высокими доходами (например, Билла Гейтса и Опры).

Оцените статью
recture.ru
Добавить комментарий