Устойчивость в статистике

В статистике термин «устойчивость» или «устойчивость» означает надежность статистической модели, тестов и процедур в соответствии с конкретными условиями статистического анализа, на достижение которых рассчитано исследование. При условии, что эти условия исследования выполнены, модели могут быть проверены на истинность с помощью математических доказательств.

Многие модели основаны на идеальных ситуациях. которые не существуют при работе с реальными данными, и, в результате, модель может обеспечить правильные результаты, даже если условия не выполняются в точности.

Надежной статистикой, следовательно, является любая статистика, которая дает хорошие результаты, когда данные берутся из широкого диапазона распределений вероятностей, на которые в значительной степени не влияют выбросы или небольшие отклонения от допущений модели в данном наборе данных. Другими словами, надежная статистика устойчива к ошибкам в результатах.

Один из способов наблюдения за общепринятой устойчивой статистической процедурой, больше не нужно искать чем t-процедуры, которые используют проверку гипотез для определения наиболее точных статистических прогнозов.

Наблюдение за T-процедурами

В качестве примера устойчивости мы рассмотрим t -процедуры, которые включают доверительный интервал для среднего значения генеральной совокупности с неизвестным стандартным отклонением генеральной совокупности, а также проверки гипотез о среднем значении совокупности.

Использование процедур t- предполагает следующее:

  • Набор данных, с которым мы работаем, представляет собой простую случайную выборку генеральной совокупности.
  • Популяция, из которой мы сделали выборку, имеет нормальное распределение.

На практике с примерами из реальной жизни у статистиков редко бывает нормально распределенная совокупность, поэтому вопрос inst ead принимает следующий вид: «Насколько надежны наши t- процедуры? »

В общем, условие, что у нас есть простой случайный выборка более важна, чем условие, которое мы взяли из нормально распределенной совокупности; Причина этого в том, что центральная предельная теорема обеспечивает приблизительно нормальное выборочное распределение – чем больше размер нашей выборки, тем ближе выборочное распределение выборочного среднего к нормальному.

Как T-процедуры служат надежной статистикой

Таким образом, надежность t -процедур зависит от размера выборки и ее распределения. . Соображения для этого включают:

  • Если размер выборки большой, что означает, что у нас есть 40 или более наблюдений, тогда t- можно использовать даже с искаженными дистрибутивами.
  • Если размер выборки составляет от 15 до 40, то мы можем использовать t – процедуры для любого фигурного распределения, если нет выбросов или высокой степени асимметрии.
  • Если размер выборки меньше 15, то мы можем использовать t – процедуры для данных, которые не имеют выбросов, одного пика и почти симметричны.

В большинстве случаев надежность была установлена ​​в результате технической работы в математической статистике, и, к счастью, нам не обязательно выполнять эти расширенные математические вычисления для их правильного использования; нам нужно только понять, каковы общие рекомендации для надежности нашего конкретного статистического метода.

T-процедуры функционируют как надежные статистические данные, поскольку они обычно дают хорошую производительность в соответствии с этими моделями путем учета размера образца в основе для применения процедуры.

Оцените статью
recture.ru
Добавить комментарий