Меры центральной тенденции – это числа, которые описывают, что является средним или типичным в распределении данных. Существует три основных показателя центральной тенденции: среднее значение, медиана и мода. Хотя все они являются мерами центральной тенденции, каждый рассчитывается по-разному и измеряет что-то отличное от других.
Среднее
Среднее значение – это наиболее распространенная мера центральной тенденции, используемая исследователями и людьми самых разных профессий. Это мера центральной тенденции, которую также называют средним значением. Исследователь может использовать среднее значение для описания распределения данных переменных, измеряемых в виде интервалов или соотношений. Это переменные, которые включают численно соответствующие категории или диапазоны (например, расу, класс, пол или уровень образования), а также переменные, измеряемые численно по шкале, которая начинается с нуля (например, доход домохозяйства или количество детей в семье). .
Среднее значение очень легко вычислить. Просто нужно сложить все значения данных или «баллы», а затем разделить эту сумму на общее количество баллов в распределении данных. Например, если в пяти семьях есть 0, 2, 2, 3 и 5 детей соответственно, среднее количество детей будет (0 + 2 + 2 + 3 + 5)/5 = 12/5 = 2,4. Это означает, что в пяти домохозяйствах в среднем 2,4 ребенка.
Медиана
Медиана – это среднее значение распределения данных, когда эти данные организованы от наименьшего до наибольшего значения. Эту меру центральной тенденции можно рассчитать для переменных, которые измеряются с помощью порядковой, интервальной или пропорциональной шкалы.
Расчет медианы также довольно прост. Предположим, у нас есть следующий список чисел: 5, 7, 10, 43, 2, 69, 31, 6, 22. Сначала мы должны расположить числа в порядке от наименьшего к наибольшему. Результат следующий: 2, 5, 6, 7, 10, 22, 31, 43, 69. Медиана равна 10, потому что это точное среднее число. Есть четыре числа ниже 10 и четыре числа выше 10.
Если ваше распределение данных имеет четное количество наблюдений, что означает, что нет точной середины, вы просто немного скорректируйте диапазон данных, чтобы вычислить медиану. Например, если мы добавим число 87 в конец нашего списка чисел выше, у нас будет 10 общих чисел в нашем распределении, поэтому нет единого среднего числа. В этом случае берется среднее значение двух средних чисел. В нашем новом списке два средних числа – 10 и 22. Итак, мы берем среднее значение этих двух чисел: (10 + 22)/2 = 16. Наша медиана теперь равна 16.
Режим
Режим – это мера центральной тенденции, которая определяет категорию или оценку, которая наиболее часто встречается в распределении данных. Другими словами, это наиболее частая оценка или оценка, которая встречается наибольшее количество раз в распределении.. Режим может быть рассчитан для любого типа данных, в том числе измеренных как номинальные переменные или по имени.
Например, допустим, мы смотрим на домашних животных принадлежит 100 семьям, и распределение выглядит следующим образом:
Animal Количество семей, которым он принадлежит
- Собака: 60
- Кошка: 35
- Рыба: 17
- Хомяк: 13
- Змея: 3
Режим здесь – “собака”, так как больше семей владеют собакой, чем любым другим животным. Обратите внимание, что режим всегда выражается как категория или балл, а не частота этого балла. Например, в приведенном выше примере используется режим «собака», а не 60, что соответствует количеству появлений собаки.
В некоторых дистрибутивах нет режим у всех. Это происходит, когда каждая категория имеет одинаковую частоту. В других дистрибутивах может быть более одного режима. Например, когда распределение имеет две оценки или категории с одинаковой наивысшей частотой, его часто называют «бимодальным».