Что такое нормальное распределение?

Нормальное распределение данных – это такое распределение данных, при котором большинство точек данных относительно схожи, то есть они встречаются в небольшом диапазоне значений с меньшим количеством выбросов на верхних и нижних концах диапазона данных. .

При нормальном распределении данных их нанесение на график приводит к симметричному изображению в форме колокола, которое часто называют колоколообразной кривой. При таком распределении данных среднее значение, медиана и мода – это одно и то же значение и совпадают с пиком кривой.

Однако в социальных науках , нормальное распределение – это скорее теоретический идеал, чем обычная реальность. Концепция и применение этого как линзы для изучения данных – это полезный инструмент для выявления и визуализации норм и тенденций в наборе данных.

Свойства нормального распределения

Одной из наиболее заметных характеристик нормального распределения является его форма и идеальная симметрия. Если вы сложите изображение нормального распределения точно посередине, вы получите две равные половины, каждая из которых является зеркальным отображением другой. Это также означает, что половина наблюдений в данных приходится на обе стороны от середины распределения.

Середина нормального распределения – это точка, в которой имеет максимальную частоту, то есть число или категорию ответа с наибольшим количеством наблюдений для этой переменной. Середина нормального распределения также является точкой, в которую попадают три показателя: среднее значение, медиана и мода. В абсолютно нормальном распределении эти три меры имеют одно и то же число.

Во всех нормальных или почти нормальных распределениях существует постоянная доля площади под кривая, лежащая между средним значением и любым заданным расстоянием от среднего значения при измерении в единицах стандартного отклонения. Например, на всех нормальных кривых 99,73% всех случаев попадают в пределы трех стандартных отклонений от среднего, 95,45% всех случаев находятся в пределах двух стандартных отклонений от среднего, а 68,27% случаев находятся в пределах одного стандартного отклонения от среднего.

Нормальные распределения часто представлены в стандартных баллах или Z-баллах, которые представляют собой числа, которые говорят нам расстояние между фактическим баллом и средним значением в единицах стандартных отклонений. . Стандартное нормальное распределение имеет среднее значение 0,0 и стандартное отклонение 1,0.

Примеры и использование в социальных науках

Даже Хотя нормальное распределение является теоретическим, исследователи изучают несколько переменных, которые очень похожи на нормальную кривую. Например, стандартные результаты тестов, такие как SAT, ACT и GRE, обычно напоминают нормальное распределение. Рост, спортивные способности и многочисленные социальные и политические взгляды данного населения также обычно напоминают кривую колокола.

Идеал нормального распределения также полезен, поскольку точка сравнения, когда данные не распределяются нормально. Например, большинство людей предполагают, что распределение доходов домохозяйств в США будет нормальным и будет напоминать кривую колокола при нанесении на график. Это означало бы, что большинство граждан США зарабатывают средний доход, или, другими словами, существует здоровый средний класс. Между тем численность представителей низших экономических классов будет небольшой, как и численность высших классов. Однако реальное распределение доходов домохозяйств в США совсем не похоже на колоколообразную кривую. Большинство домохозяйств попадают в диапазон от нижнего до нижнего среднего, что означает, что больше бедных людей борются за выживание, чем людей, живущих комфортной жизнью среднего класса. В этом случае идеал нормального распределения полезен для иллюстрации неравенства доходов.

Оцените статью
recture.ru
Добавить комментарий