Что такое первый и третий квартили?

Первый и третий квартили представляют собой описательную статистику, представляющую собой измерения положения в наборе данных. Подобно тому, как медиана обозначает среднюю точку набора данных, первый квартиль отмечает четверть или 25% -ную точку. Примерно 25% значений данных меньше или равны первому квартилю. Третий квартиль аналогичен, но для верхних 25% значений данных. Мы рассмотрим эти идеи более подробно ниже.

Медиана

Есть несколько способов измерить центр набора данных. Среднее значение, медиана, мода и средний диапазон имеют свои преимущества и ограничения при отображении середины данных. Из всех этих способов найти среднее значение медиана наиболее устойчиво к выбросам. Он отмечает середину данных в том смысле, что половина данных меньше медианы.

Первый квартиль

Нет причин останавливаться на поиске только середины. Что, если бы мы решили продолжить этот процесс? Мы могли вычислить медианное значение нижней половины наших данных. Половина 50% – это 25%. Таким образом, половина или четверть данных будут ниже этого значения. Поскольку мы имеем дело с четвертью исходного набора, эта медиана нижней половины данных называется первым квартилем и обозначается Q 1 .

Третий квартиль

Нет причин, по которым мы смотрели на нижнюю половину данных. Вместо этого мы могли бы посмотреть на верхнюю половину и выполнить те же действия, что и выше. Медиана этой половины, которую мы обозначим как Q 3 , также разбивает набор данных на кварталы. Однако это число обозначает верхнюю четверть данных. Таким образом, три четверти данных ниже нашего числа Q 3 . Вот почему мы называем Q 3 третьим квартилем.

Пример

Чтобы все прояснить, давайте рассмотрим пример. Может быть полезно сначала рассмотреть, как рассчитать медианное значение некоторых данных. Начните со следующего набора данных:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12 , 15, 15, 15, 17, 17, 18, 20

Всего в наборе двадцать точек данных. Начнем с поиска медианы. Поскольку имеется четное количество значений данных, медиана – это среднее значение десятого и одиннадцатого значений. Другими словами, медиана равна:

(7 + 8)/2 = 7,5.

Теперь посмотрим на нижнюю половину данных. Медиана этой половины находится между пятым и шестым значениями:

1, 2, 2, 3, 4, 6, 6, 7, 7 , 7

Таким образом, первый квартиль оказывается равным Q 1 = ( 4 + 6)/2 = 5

Чтобы найти третий квартиль, посмотрите на верхнюю половину исходного набора данных. Нам нужно найти медианное значение:

8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Здесь медиана (15 + 15)/2 = 15. Таким образом, третий квартиль Q 3 = 15.

Межквартильный размах и пять чисел Резюме

Квартили помогают нам составить более полное представление о нашем наборе данных в целом. Первый и третий квартили дают нам информацию о внутренней структуре наших данных. Средняя половина данных находится между первым и третьим квартилями и сосредоточена вокруг медианы. Разница между первым и третьим квартилями, называемая межквартильным размахом, показывает, как данные расположены относительно медианы. Небольшой межквартильный размах указывает на данные, которые сгруппированы относительно медианы. Больший межквартильный диапазон показывает, что данные более разбросаны.

Более подробную картину данных можно получить, зная наивысшее значение, называемое максимумом значение и наименьшее значение, называемое минимальным значением. Минимум, первый квартиль, медиана, третий квартиль и максимум – это набор из пяти значений, который называется сводкой из пяти чисел. Эффективный способ отображения этих пяти чисел называется коробчатой ​​диаграммой или графиком прямоугольников и усов.

Оцените статью
recture.ru
Добавить комментарий