Понимание межквартильного размаха в статистике

Межквартильный размах (IQR) — это разница между первым и третьим квартилями. Формула для этого:

IQR = Q 3 — Q 1

Существует множество измерений изменчивости набора данных. И диапазон, и стандартное отклонение говорят нам, насколько разбросаны наши данные. Проблема с этой описательной статистикой заключается в том, что они довольно чувствительны к выбросам. Измерением разброса набора данных, который более устойчив к наличию выбросов, является межквартильный диапазон.

Определение межквартильного размаха

Как видно выше, межквартильный размах основан на вычислении других статистических данных. Прежде чем определять межквартильный размах, нам сначала нужно знать значения первого квартиля и третьего квартиля. (Конечно, первый и третий квартили зависят от значения медианы).

После того, как мы определили значения первого и третьего квартилей, межквартильный размах вычислить очень просто. Все, что нам нужно сделать, это вычесть первый квартиль из третьего квартиля. Это объясняет использование термина межквартильный диапазон для этой статистики.

Пример

Чтобы увидеть пример расчета межквартильный диапазон, мы рассмотрим набор данных: 2, 3, 3, 4, 5, 6, 6, 7, 8, 8, 8, 9. Сводка из пяти чисел для этого набора данных:

  • Минимум 2
  • Первый квартиль 3,5
  • Медиана 6
  • Третий квартиль из 8
  • Максимум 9

Таким образом, мы видим, что интерквартиль диапазон составляет 8–3,5 = 4,5.

Значимость межквартильного размаха

Диапазон дает нам измерение того, насколько разброс из всего нашего набора данных. Межквартильный диапазон, который показывает, насколько далеко друг от друга находятся первый и третий квартили, показывает, насколько распределены средние 50% нашего набора данных.

Устойчивость к выбросам

Основное преимущество использования межквартильного диапазона, а не диапазона для измерения разброса набора данных, состоит в том, что межквартильный диапазон нечувствителен к выбросам. Чтобы убедиться в этом, мы рассмотрим пример.

Из приведенного выше набора данных у нас есть межквартильный диапазон 3,5, диапазон 9 — 2 = 7 и стандартное отклонение 2,34. Если мы заменим самое высокое значение 9 экстремальным выбросом 100, тогда стандартное отклонение станет 27,37, а диапазон — 98. Несмотря на то, что у нас есть довольно резкие сдвиги этих значений, первый и третий квартили не затронуты и, следовательно, межквартильный диапазон не меняется.

Использование межквартильного размаха

Помимо того, что это менее чувствительная мера разброса набора данных, межквартильный размах имеет еще одно важное применение. Из-за своей устойчивости к выбросам межквартильный размах полезен для определения, когда значение является выбросом..

Правило межквартильного диапазона — это то, что сообщает нам, есть ли у нас умеренный или сильный выброс. Чтобы найти выброс, мы должны смотреть ниже первого квартиля или выше третьего квартиля. Как далеко нам следует зайти, зависит от значения межквартильного диапазона.

Оцените статью
recture.ru
Добавить комментарий