Степени свободы переменных в двусторонней таблице

Число степеней свободы для независимости двух категориальных переменных определяется простой формулой: ( r – 1) ( c – 1). Здесь r – количество строк, а c – количество столбцов в двусторонней таблице значений категориальной переменной. Читайте дальше, чтобы узнать больше об этой теме и понять, почему эта формула дает правильное число.

Предпосылки

Один шаг за Процесс проверки многих гипотез – это определение числа степеней свободы. Это число важно, потому что для вероятностных распределений, которые включают семейство распределений, например распределение хи-квадрат, количество степеней свободы определяет точное распределение из семейства, которое мы должны использовать в нашей проверке гипотез.

Степени свободы представляют собой количество свободных выборов, которые мы можем сделать в данной ситуации. Одним из тестов гипотез, который требует от нас определения степеней свободы, является критерий хи-квадрат на независимость для двух категориальных переменных.

Тесты на независимость и два -Таблицы путей

Тест хи-квадрат на независимость требует от нас построить двустороннюю таблицу, также известную как таблица непредвиденных обстоятельств. Этот тип таблицы имеет r строк и c столбцов, представляющих уровни r одной категориальной переменной и c уровней другой категориальной переменной. Таким образом, если мы не считаем строку и столбец, в которых мы записываем итоги, в двусторонней таблице будет всего rc ячеек.

Тест хи-квадрат на независимость позволяет нам проверить гипотезу о том, что категориальные переменные независимы друг от друга. Как мы упоминали выше, строки r и c в таблице дают нам ( r – 1) ( c – 1) степени свободы. Но может быть не сразу понятно, почему это правильное число степеней свободы.

Число степеней свободы

Чтобы понять, почему ( r – 1) ( c – 1) – правильное число, мы рассмотрим эту ситуацию более подробно. Предположим, что мы знаем предельные итоги для каждого из уровней наших категориальных переменных. Другими словами, мы знаем сумму для каждой строки и сумму для каждого столбца. Для первой строки в нашей таблице есть столбцы c , поэтому есть ячейки c . Как только мы знаем значения всех этих ячеек, кроме одной, тогда, поскольку мы знаем сумму всех ячеек, определить значение оставшейся ячейки является простой задачей алгебры. Если бы мы заполняли эти ячейки нашей таблицы, мы могли бы ввести c – 1 из них свободно, но тогда оставшаяся ячейка определяется суммой строки. Таким образом, существует c – 1 степень свободы для первой строки.

Продолжаем таким же образом для следующей строки. , и снова есть c – 1 степень свободы. Этот процесс продолжается, пока мы не дойдем до предпоследнего ряда. Каждая из строк, кроме последней, дает c – 1 степень свободы к общему количеству. К тому времени, когда у нас будет все, кроме последней строки, тогда, поскольку мы знаем сумму столбца, мы можем определить все записи последней строки. Это дает нам r – 1 строку с c – 1 степенями свободы в каждой из них, всего ( r – 1) ( c – 1) степеней свободы.

Пример

Мы видим это на следующем примере. Предположим, что у нас есть двусторонняя таблица с двумя категориальными переменными. Одна переменная имеет три уровня, а другая – два. Кроме того, предположим, что мы знаем итоги по строкам и столбцам для этой таблицы:

Уровень A Уровень B Всего
Уровень 1 100
Уровень 2 200
Уровень 3 300
Всего 200 400 600

Формула предсказывает наличие (3-1) (2-1) = 2 степени свободы. Мы видим это следующим образом. Предположим, мы заполняем верхнюю левую ячейку числом 80. Это автоматически определит всю первую строку записей:

Уровень A Уровень B Всего
Уровень 1 80 20 100
Уровень 2 200
Уровень 3 300
Всего 200 400 600

Теперь, если мы знаем, что первая запись во второй строке – 50, тогда остальная часть таблицы заполняется, потому что мы знаем общее количество каждой строки и столбца:

Уровень A Уровень B Итого
Уровень 1 80 20 100
Уровень 2 50 150 200
Уровень 3 70 230 300
Всего 200 400 600

Таблица полностью заполнена, но у нас было только два свободных варианта. Как только эти значения были известны, остальная часть таблицы была полностью определена..

Хотя обычно нам не нужно знать, почему существует такое количество степеней свободы, хорошо знать, что мы на самом деле просто применяем концепцию степеней свободы к новой ситуации.

  • Как найти степени свободы в статистике
  • Как найти критические значения с помощью вкладки хи-квадрат le
  • Что такое двусторонняя таблица категориальных переменных?
  • Степени свободы в статистике и Математика
  • Поиск функций хи-квадрат в Excel
  • Тест согласия по критерию хи-квадрат
  • Пример теста хи-квадрат для полиномиального эксперимента
  • Пример критерия соответствия критериям соответствия хи-квадрат
  • Пример двух образцов T-теста и доверительного интервала
  • Биномиальная таблица для n = 10 и n = 11
  • Статистическая формула хи-квадрат и способы ее использования
  • Биномиальная таблица для n = 2, 3, 4, 5 и 6
  • Таблица распределения студентов
  • Биномиальная таблица для n = 7, n = 8 и n = 9
  • Функции с Т-распределением в Excel
  • Что такое F-распределение?

символ>

Оцените статью
recture.ru
Добавить комментарий