Если вы уделяете много времени статистике, довольно скоро вы натолкнетесь на фразу «распределение вероятностей». Именно здесь мы действительно видим, насколько области вероятности и статистики пересекаются. Хотя это может показаться чем-то техническим, на самом деле фраза «распределение вероятностей» – это просто способ говорить об организации списка вероятностей. Распределение вероятностей – это функция или правило, которое присваивает вероятности каждому значению случайной величины. В некоторых случаях дистрибутив может быть указан. В других случаях он представлен в виде графика.
Пример
Предположим, мы бросаем две кости, а затем записываем сумму игральных костей. Возможны суммы от двух до 12. Каждая сумма имеет определенную вероятность выпадения. Мы можем просто перечислить их следующим образом:
- Сумма 2 имеет вероятность 1/36
- Сумма 3 имеет вероятность 2/36
- Сумма 4 имеет вероятность 3/36
- Сумма 5 имеет вероятность 4 /36
- Сумма 6 имеет вероятность 5/36
- Сумма 7 имеет вероятность 6/36
- Сумма 8 имеет вероятность 5/36
- Сумма 9 имеет вероятность 4/36
- Сумма 10 имеет вероятность 3 /36
- Сумма 11 имеет вероятность 2/36
- Сумма 12 имеет вероятность 1/36
Этот список представляет собой распределение вероятностей для вероятностного эксперимента по бросанию двух кубиков. Мы также можем рассматривать вышеизложенное как распределение вероятностей случайной величины, определенной путем просмотра суммы двух игральных костей.
График
Распределение вероятностей можно изобразить в виде графика, и иногда это помогает показать нам особенности распределения, которые не были очевидны при простом чтении списка вероятностей. Случайная величина отображается по оси x , а соответствующая вероятность отображается по оси y . Для дискретной случайной величины у нас будет гистограмма. Для непрерывной случайной величины у нас будет внутренняя часть гладкой кривой.
Правила вероятности все еще действуют, и они проявляются в нескольких способами. Поскольку вероятности больше или равны нулю, график распределения вероятностей должен иметь неотрицательные y -координаты. Другая особенность вероятностей, а именно то, что одна из них является максимальной вероятностью события, проявляется по-другому.
Area = Probability
График распределения вероятностей построен таким образом, что области представляют вероятности. Для дискретного распределения вероятностей мы просто вычисляем площади прямоугольников. На приведенном выше графике площади трех полосок, соответствующих четырем, пяти и шести, соответствуют вероятности того, что сумма наших кубиков равна четырем, пяти или шести. Площадь всех полос в сумме составляет одну.
В стандартном нормальном распределении или кривой колокола мы имеем аналогичную ситуацию. Область под кривой между двумя значениями z соответствует вероятности того, что наша переменная окажется между этими двумя значениями. Например, площадь под колоколообразной кривой для -1 z.
Важные распределения
Существует буквально бесконечно много распределений вероятностей . Ниже приводится список некоторых наиболее важных распределений:
- Биномиальное распределение – дает количество успешность серии независимых экспериментов с двумя результатами.
- Распределение хи-квадрат – для определения того, насколько близко наблюдаемые величины соответствуют предложенной модели.
- F-распределение – используется в дисперсионном анализе (ANOVA).
- Нормальное распределение – называется колоколом кривой и встречается во всей статистике.
- Распределение Стьюдента – для использования с небольшими размерами выборки из нормального распределения.