Пример расчета дисперсионного анализа

Однофакторный дисперсионный анализ, также известный как ANOVA, дает нам возможность проводить множественные сравнения нескольких средних значений генеральной совокупности. Вместо того, чтобы делать это попарно, мы можем одновременно рассматривать все рассматриваемые средства. Чтобы выполнить тест ANOVA, нам нужно сравнить два вида вариации: вариацию между средними значениями выборки, а также вариацию в каждой из наших выборок.

Мы объединяем все эти вариации в единую статистику, называемую статистикой F , потому что она использует F-распределение. Мы делаем это путем деления вариации между выборками на вариацию внутри каждой выборки. Обычно это делается с помощью программного обеспечения, однако есть некоторая ценность в том, чтобы увидеть, как один такой расчет выполнен.

Будет легко потеряться в дальнейшем. Вот список шагов, которые мы будем выполнять в примере ниже:

  1. Рассчитайте средние значения для каждого из наших образцов, а также среднее значение для всех выборочных данных.
  2. Вычислить сумму квадратов ошибки. Здесь в каждой выборке мы возводим в квадрат отклонение каждого значения данных от выборочного среднего. Сумма всех квадратов отклонений – это сумма квадратов ошибки, сокращенно SSE.
  3. Вычислите сумму квадратов обработки. Мы возводим в квадрат отклонение среднего значения каждого образца от общего среднего. Сумма всех этих квадратов отклонений умножается на единицу меньше, чем количество имеющихся у нас выборок. Это число представляет собой сумму квадратов обработки, сокращенно SST.
  4. Вычислите степени свободы. Общее количество степеней свободы на единицу меньше, чем общее количество точек данных в нашей выборке, или n – 1. Количество степеней свободы обработки на единицу меньше количества использованных выборок, или m – 1. Число степеней свободы ошибки – это общее количество точек данных за вычетом количества выборок или n m .
  5. Вычислить средний квадрат ошибки. Это обозначается MSE = SSE/( n m ).
  6. Вычислить средний квадрат обработки. Это обозначается MST = SST/ m – `1.
  7. Рассчитайте статистику F . Это отношение двух рассчитанных нами средних квадратов. Итак, F = MST/MSE.

Программное обеспечение делает все это довольно легко, но это хорошо чтобы знать, что происходит за кулисами. Далее мы разрабатываем пример ANOVA, следуя шагам, перечисленным выше.

Данные и выборочные средние

Предположим, мы имеют четыре независимых популяции, которые удовлетворяют условиям однофакторного дисперсионного анализа. Мы хотим проверить нулевую гипотезу H 0 : μ 1 = μ 2 = μ 3 = μ 4 . Для целей этого примера мы будем использовать выборку размером три из каждой из исследуемых популяций.. Данные из наших выборок:

  • Выборка из генеральной совокупности №1: 12, 9, 12. Среднее значение выборки равно 11.
  • Выборка из генеральной совокупности № 2: 7, 10, 13. Среднее значение выборки равно 10.
  • Выборка из генеральной совокупности № 3: 5, 8, 11. Среднее значение выборки равно 8.
  • Выборка из генеральной совокупности № 4: 5, 8, 8. Среднее значение выборки равно 7.

Среднее значение всех данных равно 9.

Сумма квадратов ошибок

Теперь мы вычисляем сумму квадратов отклонений от каждого среднего значения выборки. Это называется суммой квадратов ошибки.

  • Для выборки из генеральной совокупности №1: (12–11) 2 + (9–11) 2 + (12–11) 2 = 6
  • Для выборка из популяции №2: (7–10) 2 + (10–10) 2 + (13–10) 2 = 18
  • Для выборки из генеральной совокупности № 3: (5-8) 2 + (8-8) 2 + (11-8) 2 = 18
  • Для выборки из генеральной совокупности №4: (5-7) 2 + (8-7) 2 + (8-7) 2 = 6.

Затем мы складываем все эти суммы квадратов отклонений и получаем 6 + 18 + 18 + 6 = 48.

Сумма квадратов лечения

Теперь мы вычисляем сумму квадратов лечения. Здесь мы смотрим на квадраты отклонений среднего значения каждой выборки от общего среднего и умножаем это число на единицу меньше, чем количество популяций:

3 [( 11-9) 2 + (10-9) 2 + (8-9) 2 + (7 – 9) 2 ] = 3 [4 + 1 + 1 + 4] = 30.

Степени свободы

Прежде чем перейти к следующему шагу, нам нужны степени свободы. Есть 12 значений данных и четыре образца. Таким образом, количество степеней свободы обработки составляет 4-1 = 3. Количество степеней свободы ошибки составляет 12-4 = 8.

Среднее Квадраты

Теперь разделим нашу сумму квадратов на соответствующее количество степеней свободы, чтобы получить средние квадраты.

  • Средний квадрат для обработки составляет 30/3 = 10.
  • Средний квадрат для ошибки составляет 48/8 = 6.

F-статистика

Последний шаг – разделение среднего квадрата обработки на средний квадрат ошибки. Это F-статистика из данных. Таким образом, для нашего примера F = 10/6 = 5/3 = 1,667.

Таблицы значений или программное обеспечение можно использовать для определения вероятности получения значение F-статистики столь же экстремальное, как это значение только случайно.

Оцените статью
recture.ru
Добавить комментарий