Кривая Белла и определение нормального распределения

Термин колоколообразная кривая используется для описания математической концепции, называемой нормальным распределением, иногда называемой распределением Гаусса. «Колоколообразная кривая» относится к форме колокола, которая создается, когда линия строится с использованием точек данных для элемента, который соответствует критериям нормального распределения.

В колоколообразной кривой центр содержит наибольшее количество значений и, следовательно, является наивысшей точкой дуги линии. Эта точка относится к среднему значению, но, говоря простым языком, это наибольшее количество вхождений элемента (с точки зрения статистики, режим).

Нормальное распределение

При нормальном распределении важно отметить, что кривая сосредоточена в центре и уменьшается с обеих сторон. Это важно, поскольку данные имеют меньшую тенденцию давать необычно экстремальные значения, называемые выбросами, по сравнению с другими распределениями. Кроме того, колоколообразная кривая означает, что данные симметричны. Это означает, что вы можете создать разумные ожидания относительно возможности того, что результат будет находиться в диапазоне слева или справа от центра, после того как вы измерили величину отклонения, содержащегося в данных. .

График колоколообразной кривой зависит от двух факторов: среднего и стандартного отклонения. Среднее значение определяет положение центра, а стандартное отклонение определяет высоту и ширину колокола. Например, большое стандартное отклонение создает короткий и широкий колокол, а небольшое стандартное отклонение создает высокую и узкую кривую.

Вероятность и стандарт колоколообразной кривой Отклонение

Чтобы понять факторы вероятности нормального распределения, вам необходимо понять следующие правила:

  1. Общая площадь под кривой равна 1 (100%).
  2. Около 68% площади под кривой находится в пределах одного стандартного отклонения.
  3. Около 95 % площади под кривой находится в пределах двух стандартных отклонений.
  4. Около 99,7% площади под кривой находится в пределах трех стандартных отклонений.

Пункты 2, 3 и 4 выше иногда называют эмпирическим правилом или правилом 68–95–99,7. Как только вы определите, что данные распределены нормально (колоколообразная форма) и вычислите среднее значение и стандартное отклонение, вы сможете определить вероятность того, что отдельная точка данных попадет в заданный диапазон возможностей.

Пример колоколообразной кривой

Хорошим примером колоколообразной кривой или нормального распределения является бросок двух кубиков. Распределение сосредоточено вокруг числа семь, и вероятность уменьшается по мере удаления от центра.

Вот процентный шанс различных результатов, когда вы бросаете два кубика.

  • Два: (1/36) 2. 78%
  • Три: (2/36) 5,56%
  • Четыре: ( 3/36) 8,33%
  • Пять: (4/36) 11,11%
  • Шесть: (5/36) 13,89%
  • Семь: (6/36) 16,67% = наиболее вероятный результат
  • Восемь: (5/36) 13,89%
  • Девять: (4/36) 11,11%
  • Десять: (3/36) 8,33%
  • Одиннадцать: (2/36) 5,56%
  • Двенадцать: (1/36) 2,78%

Нормальные распределения обладают множеством удобных свойств, поэтому во многих случаях, особенно в физике и астрономии, случайные вариации с неизвестным распределением часто считаются нормальными, что позволяет проводить вероятностные вычисления. Хотя это может быть опасным предположением, оно часто является хорошим приближением из-за неожиданного результата, известного как центральная предельная теорема .

Эта теорема утверждает, что среднее значение любого набора вариантов с любым распределением, имеющим конечное среднее значение и дисперсию, имеет тенденцию встречаться в нормальном распределении. Многие общие атрибуты, такие как результаты тестов или рост, подчиняются примерно нормальному распределению, при этом несколько элементов находятся на верхнем и нижнем концах, а многие – в середине.

Когда не следует Не используйте колоколообразную кривую

Есть некоторые типы данных, которые не соответствуют нормальному шаблону распределения. Эти наборы данных не следует заставлять пытаться соответствовать колоколообразной кривой. Классическим примером являются оценки учащихся, которые часто имеют два режима. Другие типы данных, которые не соответствуют кривой, включают доход, рост населения и механические сбои.

Оцените статью
recture.ru
Добавить комментарий