Определение и примеры теоремы Байеса

Теорема Байеса – это математическое уравнение, используемое в вероятности и статистике для вычисления условной вероятности. Другими словами, он используется для вычисления вероятности события на основе его связи с другим событием. Теорема также известна как закон Байеса или правило Байеса.

История

Теорема Байеса названа в честь английского министра и статистика преподобного Томаса Байеса, который сформулировал уравнение для своей работы «Эссе к решению проблемы в доктрине вероятностей». После смерти Байеса рукопись была отредактирована и исправлена ​​Ричардом Прайсом перед публикацией в 1763 году. Было бы правильнее называть теорему правилом Байеса-Прайса, поскольку вклад Прайса был значительным. Современная формулировка уравнения была разработана французским математиком Пьером-Симоном Лапласом в 1774 году, который не знал о работе Байеса. Лаплас признан математиком, ответственным за развитие байесовской вероятности.

Формула теоремы Байеса

Есть несколько разных способов записать формулу по теореме Байеса. Наиболее распространенная форма:

P (A ∣ B) = P (B ∣ A) P (A)/P (B)

где A и B – два события, а P (B) ≠ 0

P (A ∣ B) – условная вероятность наступления события A при условии, что B истинно.

P (B ∣ A) – это условная вероятность возникновения события B при условии, что A истинно.

P (A) и P (B) – вероятности A и B возникают независимо друг от друга (предельная вероятность).

Пример

Возможно, вы захотите узнать вероятность заболевания ревматоидным артритом у человека, если он сенная лихорадка. В этом примере «сенная лихорадка» – это тест на ревматоидный артрит (событие).

  • A будет событием «пациент» страдает ревматоидным артритом “. Данные показывают, что 10 процентов пациентов в клинике страдают этим типом артрита. P (A) = 0,10
  • B – это тест «у пациента сенная лихорадка». Данные показывают, что 5 процентов пациентов в клинике страдают сенной лихорадкой. P (B) = 0,05.
  • Записи клиники также показывают, что среди пациентов с ревматоидным артритом 7 процентов страдают сенной лихорадкой. Другими словами, вероятность того, что у пациента сенная лихорадка при ревматоидном артрите, составляет 7 процентов. B ∣ A = 0,07

Включение этих значений в теорему:

P (A ∣ B) = (0,07 * 0,10)/(0,05) = 0,14

Итак, если у пациента сенная лихорадка, его шанс заболеть ревматоидным артритом составляет 14 процентов. Маловероятно, что случайный пациент с сенной лихорадкой болеет ревматоидным артритом..

Чувствительность и специфичность

Теорема Байеса элегантно демонстрирует эффект ложноположительных и ложноотрицательных результатов медицинских тестов.

  • Чувствительность – истинно положительный показатель. Это мера доли правильно идентифицированных положительных результатов. Например, в тесте на беременность это будет процент беременных женщин с положительным тестом на беременность. Чувствительный тест редко пропускает «положительный результат».
  • Специфичность – это истинно отрицательный результат. Он измеряет долю правильно идентифицированных негативов. Например, в тесте на беременность это будет процент небеременных женщин с отрицательным результатом теста на беременность. Конкретный тест редко дает ложноположительный результат.

Идеальный тест будет на 100 процентов чувствительным и специфичным. На самом деле тесты имеют минимальную ошибку, называемую коэффициентом ошибок Байеса.

Например, рассмотрим тест на наркотики, который на 99 процентов чувствителен и на 99 процентов специфичен. Если полпроцента (0,5 процента) людей употребляют наркотик, какова вероятность того, что случайный человек с положительным результатом теста на самом деле является потребителем?

P (A ∣ B) = P (B ∣ A) P (A)/P (B)

можно переписать как:

P (user ∣ +) = P (+ ∣ user) P (user) /P (+)

P (пользователь ∣ +) = P (+ ∣ пользователь) P (пользователь)/[P (+ ∣ пользователь) P (пользователь) + P (+ ∣ не- пользователь) P (не пользователь)]

P (пользователь ∣ +) = (0,99 * 0,005)/(0,99 * 0,005 + 0,01 * 0,995)

P (пользователь ∣ +) ≈ 33,2%

Только примерно в 33% случаев случайный человек с положительным результатом теста на самом деле будет употреблять наркотики. Вывод состоит в том, что даже если человек дает положительный результат теста на наркотик, более вероятно, что он не употребляет наркотик, чем это делает. Другими словами, количество ложных срабатываний больше, чем количество истинных срабатываний.

В реальных ситуациях обычно делается компромисс между чувствительностью и специфичностью, в зависимости от того, больше ли важно не пропустить положительный результат или лучше не обозначать отрицательный результат как положительный.

Оцените статью
recture.ru
Добавить комментарий