Что такое сводка из пяти цифр?

Существует множество описательных статистических данных. Такие числа, как среднее значение, медиана, мода, асимметрия, эксцесс, стандартное отклонение, первый квартиль и третий квартиль, и многие другие, каждый говорит нам что-то о наших данных. Вместо того, чтобы смотреть на эти описательные статистические данные по отдельности, иногда их объединение помогает дать нам полную картину. Имея это в виду, пятизначное резюме – удобный способ объединить пять описательных статистических данных.

Какие пять чисел?

Понятно, что в нашем резюме должно быть пять чисел, но какие пять? Выбранные числа должны помочь нам узнать центр наших данных, а также степень разброса точек данных. Имея это в виду, пятизначная сводка состоит из следующего:

  • Минимум – это наименьшее значение в нашем наборе данных. .
  • Первый квартиль – это число обозначается Q 1 , и 25% наших данных находятся ниже первого квартиля.
  • Медиана – это средняя точка данных. 50% всех данных находятся ниже медианы.
  • Третий квартиль – это число обозначается Q 3 и 75% наших данных ниже третьего квартиля.
  • Максимум – это наибольшее значение в нашем наборе данных.

Среднее и стандартное отклонение также можно использовать вместе, чтобы передать центр и разброс набора данных. Однако обе эти статистические данные подвержены выбросам. Выбросы не так сильно влияют на медиана, первый квартиль и третий квартиль.

Пример

Учитывая следующий набор данных, мы сообщим сводку из пяти цифр:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8 , 11, 12, 15, 15, 15, 17, 17, 18, 20

Всего в наборе данных двадцать точек. Таким образом, медиана представляет собой среднее значение десятого и одиннадцатого значений данных или:

(7 + 8)/2 = 7,5.

Медиана нижней половины данных – это первый квартиль. Нижняя половина:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7

Таким образом, мы вычисляем Q 1 = (4 + 6)/2 = 5.

Медиана верхней половины исходного набора данных – это третий квартиль. Нам нужно найти медианное значение:

8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Таким образом, мы вычисляем Q 3 = (15 + 15)/2 = 15.

Мы собираем все вышеперечисленные результаты вместе и сообщаем, что сводка из пяти цифр для вышеуказанного набора данных равна 1, 5, 7,5, 12, 20.

Графическое представление

Пять сводок чисел можно сравнить друг с другом. Мы обнаружим, что два набора с одинаковыми средними и стандартными отклонениями могут иметь очень разные пятизначные сводки. Чтобы легко сравнить две сводки из пяти чисел с первого взгляда, мы можем использовать коробчатую диаграмму или диаграмму коробок и усов..

Оцените статью
recture.ru
Добавить комментарий