Пример доверительного интервала для дисперсии совокупности

Дисперсия генеральной совокупности показывает, как распределить набор данных. К сожалению, обычно невозможно точно узнать, что это за параметр популяции. Чтобы компенсировать недостаток знаний, мы используем тему из выводимой статистики, называемую доверительными интервалами. Мы увидим пример того, как рассчитать доверительный интервал для дисперсии генеральной совокупности.

Формула доверительного интервала

Формула для доверительного интервала (1 – α) о дисперсии генеральной совокупности. Дается следующей строкой неравенств:

[( n – 1) s 2 ]/ B 2 n – 1) s 2 ]/A.

Здесь n – размер выборки, s 2 – дисперсия выборки. Число A – это точка распределения хи-квадрат с n -1 степенями свободы, при которой ровно α/2 площади под кривой составляет слева от A . Аналогичным образом число B – это точка того же распределения хи-квадрат с точно α/2 площади под кривой справа от B .

Предварительные сведения

Мы начинаем с набора данных с 10 значениями. Этот набор значений данных был получен простой случайной выборкой:

97, 75, 124, 106, 120, 131, 94, 97,96, 102

Потребуется некоторый исследовательский анализ данных, чтобы показать, что нет никаких выбросов. Построив график ствола и листа, мы увидим, что эти данные, вероятно, получены из распределения, которое приблизительно нормально распределено. Это означает, что мы можем продолжить поиск 95% доверительного интервала для дисперсии генеральной совокупности.

Выборочная дисперсия

Нам необходимо оцените дисперсию генеральной совокупности с помощью выборочной дисперсии, обозначенной s 2 . Итак, мы начнем с расчета этой статистики. По сути, мы усредняем сумму квадратов отклонений от среднего. Однако вместо деления этой суммы на n мы делим ее на n – 1.

Мы находим, что выборочное среднее составляет 104,2. Используя это, у нас есть сумма квадратов отклонений от среднего, определяемая по формуле:

(97 – 104.2) 2 + (75 – 104,3) 2 +. . . + (96 – 104,2) 2 + (102 – 104,2) 2 = 2495,6

Мы разделим эту сумму на 10 – 1 = 9, чтобы получить выборочную дисперсию 277.

Распределение хи-квадрат

Теперь перейдем к нашему распределению хи-квадрат. Поскольку у нас есть 10 значений данных, у нас есть 9 степеней свободы. Поскольку нам нужны средние 95% нашего распределения, нам нужно по 2,5% в каждом из двух хвостов. Мы обращаемся к таблице хи-квадрат или к программному обеспечению и видим, что значения таблицы 2.7004 и 19.023 охватывают 95% площади распределения. Это числа A и B соответственно..

Теперь у нас есть все, что нам нужно, и мы готовы составить наш доверительный интервал. Формула для левой конечной точки: [( n – 1) s 2 ]/ B . Это означает, что наша левая конечная точка:

(9 x 277)/19.023 = 133

Правую конечную точку можно найти, заменив B на A:

(9 x 277)/2.7004 = 923

Итак, мы на 95% уверены, что дисперсия генеральной совокупности находится между 133 и 923.

Стандартное отклонение совокупности

Конечно, поскольку стандартное отклонение является квадратным корнем из дисперсии, этот метод можно использовать для построения доверительного интервала для стандартное отклонение населения. Все, что нам нужно сделать, это извлечь квадратные корни из конечных точек. Результатом будет 95% доверительный интервал для стандартного отклонения.

Оцените статью
recture.ru
Добавить комментарий