Гистограммы относительной частоты

В статистике есть много терминов, между которыми есть тонкие различия. Одним из примеров этого является разница между частотой и относительной частотой. Хотя есть много применений для относительных частот, есть одно, в частности, которое включает в себя гистограмму относительных частот. Это тип графика, который связан с другими темами статистики и математической статистики.

Определение

Гистограммы — это статистические графики. которые выглядят как гистограммы. Однако обычно термин гистограмма зарезервирован для количественных переменных. Горизонтальная ось гистограммы — это числовая линия, содержащая классы или ячейки одинаковой длины. Эти интервалы представляют собой интервалы числовой линии, в которые могут попадать данные, и могут состоять из одного числа (обычно для дискретных наборов данных, которые относительно малы) или диапазона значений (для больших наборов дискретных данных и непрерывных данных).

Например, нас может заинтересовать распределение баллов в викторине на 50 баллов для класса студентов. Один из возможных способов создания интервалов — иметь разные интервалы для каждых 10 точек.

Вертикальная ось гистограммы представляет количество или частоту, с которой значение данных находится в каждой из ячеек. Чем выше полоса, тем больше значений данных попадает в этот диапазон значений ячеек. Вернемся к нашему примеру, если у нас есть пять студентов, набравших более 40 баллов в викторине, тогда полоса, соответствующая ячейке от 40 до 50, будет иметь высоту пяти единиц.

Сравнение гистограммы частот

Гистограмма относительной частоты — это небольшая модификация типичной гистограммы частот. Вместо того, чтобы использовать вертикальную ось для подсчета значений данных, попадающих в данную ячейку, мы используем эту ось для представления общей доли значений данных, попадающих в эту ячейку. Поскольку 100% = 1, все столбцы должны иметь высоту от 0 до 1. Кроме того, высота всех столбцов на нашей гистограмме относительной частоты должна быть в сумме 1.

Таким образом, в рассматриваемом нами рабочем примере предположим, что в нашем классе 25 учеников, и пятеро из них набрали более 40 баллов. Вместо того, чтобы строить полосу высотой пять для этого бина, у нас будет полоса высотой 5/25 = 0,2.

Сравнение гистограммы с относительной частотой гистограммы, каждый с одинаковыми ячейками, мы что-то заметим. Общий вид гистограмм будет идентичным. Гистограмма относительной частоты не подчеркивает общее количество в каждой ячейке. Вместо этого этот тип графика фокусируется на том, как количество значений данных в ячейке соотносится с другими ячейками. Это отношение демонстрируется в процентах от общего числа значений данных.

Вероятностные массовые функции

Мы можем Интересно, какой смысл в определении гистограммы относительной частоты. Одно из ключевых приложений относится к дискретным случайным величинам, где наши ячейки имеют ширину один и сосредоточены вокруг каждого неотрицательного целого числа. В этом случае мы можем определить кусочную функцию со значениями, соответствующими вертикальной высоте столбцов на нашей гистограмме относительной частоты.

Этот тип функции называется функция массы вероятности. Причина построения функции таким образом заключается в том, что кривая, определяемая функцией, имеет прямую связь с вероятностью. Область под кривой от значений a до b — это вероятность того, что случайная переменная имеет значение от a на b.

Связь между вероятностью и площадью под кривой постоянно проявляется в математической статистике. Еще одна такая связь — использование функции вероятности массы для моделирования гистограммы относительной частоты.

Оцените статью
recture.ru
Добавить комментарий