Доверительные интервалы находятся в теме выводимой статистики. Общая форма такого доверительного интервала – это оценка плюс или минус погрешность. Одним из примеров этого является опрос общественного мнения, в котором поддержка проблемы оценивается в определенном процентном соотношении плюс или минус определенный процент.
Другой пример: когда мы заявляем, что на определенном уровне уверенности, среднее значение равно x̄ +/- E , где E – это предел погрешности. Этот диапазон значений обусловлен природой выполняемых статистических процедур, но расчет погрешности основан на довольно простой формуле.
Хотя мы можем рассчитать погрешность, просто зная размер выборки, стандартное отклонение генеральной совокупности и желаемый уровень уверенности, мы можем перевернуть вопрос. Каким должен быть размер нашей выборки, чтобы гарантировать заданную погрешность?
Дизайн эксперимента
Такого рода базовые вопрос подпадает под идею экспериментального дизайна. Для определенного уровня достоверности мы можем иметь размер выборки настолько большой или маленький, насколько мы хотим. Предполагая, что наше стандартное отклонение остается фиксированным, предел погрешности прямо пропорционален нашему критическому значению (которое зависит от нашего уровня уверенности) и обратно пропорционален квадратному корню из размера выборки.
Формула погрешности имеет множество последствий для того, как мы планируем наш статистический эксперимент:
- Чем меньше чем больше размер выборки, тем больше погрешность.
- Чтобы сохранить такую же погрешность на более высоком уровне уверенности, нам потребуется увеличить размер выборки.
- Оставляя все остальное равным, чтобы сократить погрешность вдвое, нам пришлось бы в четыре раза увеличить размер нашей выборки. Удвоение размера выборки только уменьшит исходную погрешность примерно на 30%.
Желаемый размер выборки
Чтобы вычислить, каким должен быть размер нашей выборки, мы можем просто начать с формулы для погрешности и решить ее для n размера выборки. Это дает нам формулу n = ( z α/2 σ/ E ) 2 .
Пример
Ниже приводится пример того, как мы можем используйте формулу для расчета желаемого размера выборки.
Стандартное отклонение для совокупности 11-классников для стандартизированного теста составляет 10 баллов. Насколько велика выборка студентов, чтобы с уровнем достоверности 95% гарантировать, что среднее значение нашей выборки находится в пределах 1 балла от среднего для генеральной совокупности?
критическое значение для этого уровня достоверности составляет z α/2 = 1,64. Умножьте это число на стандартное отклонение 10, чтобы получить 16,4. Теперь возведите это число в квадрат, чтобы получить размер выборки 269.
Другие соображения
Есть некоторые практические вопросы, которые следует учитывать. Понижение уровня уверенности даст нам меньшую погрешность. Однако это будет означать, что наши результаты будут менее определенными. Увеличение размера выборки всегда уменьшает погрешность. Могут быть и другие ограничения, такие как затраты или осуществимость, которые не позволяют нам увеличить размер выборки.