Что такое бутстреппинг в статистике?

Самостоятельная загрузка — это статистический метод, который подпадает под более широкий заголовок передискретизации. Этот метод включает относительно простую процедуру, но повторяется столько раз, что сильно зависит от компьютерных расчетов. Самостоятельная загрузка предоставляет метод, отличный от доверительных интервалов, для оценки параметра совокупности. Похоже, что загрузка работает как по волшебству. Читайте дальше, чтобы узнать, как он получил свое интересное имя.

Объяснение начальной загрузки

Одна из целей логической статистики — определить значение параметра совокупности. Обычно это слишком дорого или даже невозможно измерить напрямую. Поэтому мы используем статистическую выборку. Мы выбираем совокупность, измеряем статистику этой выборки, а затем используем эту статистику, чтобы сказать что-то о соответствующем параметре совокупности.

Например, в шоколадная фабрика, мы можем гарантировать, что шоколадные батончики имеют определенный средний вес. Невозможно взвесить каждый произведенный шоколадный батончик, поэтому мы используем методы выборки, чтобы случайным образом выбрать 100 шоколадных батончиков. Мы вычисляем среднее значение этих 100 шоколадных батончиков и говорим, что среднее значение генеральной совокупности находится в пределах погрешности от среднего значения нашей выборки.

Предположим, что Через несколько месяцев мы хотим знать с большей точностью — или с меньшей погрешностью — каков был средний вес шоколадного батончика в тот день, когда мы производили отбор производственной линии. Мы не можем использовать сегодняшние шоколадные батончики, поскольку в картину вошло слишком много переменных (разные партии молока, сахара и какао-бобов, разные атмосферные условия, разные сотрудники на линии и т. Д.). Все, что у нас есть с того дня, который нас интересует, — это 100 гирь. Без машины времени в тот день казалось бы, что начальная погрешность — лучшее, на что мы можем надеяться.

К счастью, мы можем использовать техника бутстрэппинга. В этой ситуации мы произвольно производим выборку с заменой из 100 известных весов. Затем мы называем это образцом начальной загрузки. Поскольку мы допускаем замену, этот образец начальной загрузки, скорее всего, не идентичен нашему первоначальному образцу. Некоторые точки данных могут дублироваться, а другие точки данных из начальных 100 могут быть опущены в выборке начальной загрузки. С помощью компьютера тысячи образцов начальной загрузки могут быть созданы за относительно короткое время.

Пример

Как Как уже упоминалось, чтобы по-настоящему использовать методы начальной загрузки, нам нужен компьютер. Следующий числовой пример поможет продемонстрировать, как работает этот процесс.. Если мы начнем с примеров 2, 4, 5, 6, 6, тогда все следующие возможные примеры начальной загрузки:

  • 2 , 5, 5, 6, 6
  • 4, 5, 6, 6, 6
  • 2, 2, 4, 5, 5
  • 2, 2, 2, 4, 6
  • 2, 2, 2, 2, 2
  • 4,6, 6, 6, 6

История техники

Методы начальной загрузки относительно новы в области статистики. Первое использование было опубликовано в статье Брэдли Эфрона в 1979 году. По мере того, как вычислительные мощности увеличиваются и становятся менее дорогостоящими, методы начальной загрузки получили более широкое распространение.

Почему бутстрапирование по имени?

Название «самозагрузка» происходит от фразы «Поднять себя за шнурки». Это относится к чему-то абсурдному и невозможному. Старайтесь изо всех сил, вы не сможете подняться в воздух, дергая за куски кожи на своих ботинках.

Существует некоторая математическая теория, оправдывающая самозагрузку. техники. Однако при использовании начальной загрузки кажется, что вы делаете невозможное. Хотя не похоже, что вы сможете улучшить оценку статистики генеральной совокупности, повторно используя одну и ту же выборку снова и снова, на самом деле самонастройка может это сделать.

Оцените статью
recture.ru
Добавить комментарий