Гистограмма – это тип графика, который имеет широкое применение в статистике. Гистограммы обеспечивают визуальную интерпретацию числовых данных, указывая количество точек данных, лежащих в пределах диапазона значений. Эти диапазоны значений называются классами или ячейками. Частота данных, попадающих в каждый класс, отображается с помощью столбца. Чем выше полоса, тем выше частота значений данных в этой ячейке.
Гистограммы и гистограммы
На первый взгляд гистограммы очень похожи на гистограммы. Оба графика используют вертикальные полосы для представления данных. Высота полосы соответствует относительной частоте количества данных в классе. Чем выше полоса, тем выше частота данных. Чем ниже полоса, тем ниже частота данных. Но внешность обманчива. На этом сходство двух типов графиков заканчивается.
Причина, по которой эти типы графиков различаются, связана с уровнем измерения данные. С одной стороны, гистограммы используются для данных на номинальном уровне измерения. Гистограммы измеряют частоту категориальных данных, и классы для гистограммы являются этими категориями. С другой стороны, гистограммы используются для данных, которые находятся, по крайней мере, на порядковом уровне измерения. Классы гистограммы – это диапазоны значений.
Еще одно ключевое различие между гистограммами и гистограммами связано с порядком столбцов. На гистограмме принято менять расположение полос в порядке убывания высоты. Однако столбцы на гистограмме не могут быть переставлены. Они должны отображаться в порядке появления классов.
Пример гистограммы
На диаграмме выше показана гистограмма . Предположим, что четыре монеты подброшены и результаты записаны. Использование соответствующей таблицы биномиального распределения или простых вычислений с помощью биномиальной формулы показывает, что вероятность того, что ни одна голова не отображается, равна 1/16, вероятность того, что одна голова отображается, равна 4/16. Вероятность выпадения двух орлов – 6/16. Вероятность выпадения трех решек – 4/16. Вероятность выпадения четырех орлов равна 1/16.
Всего мы создаем пять классов, каждый шириной один. Эти классы соответствуют количеству возможных голов: ноль, один, два, три или четыре. Над каждым классом рисуем вертикальную полосу или прямоугольник. Высота этих столбцов соответствует вероятностям, упомянутым в нашем вероятностном эксперименте по подбрасыванию четырех монет и подсчету орлов.
Гистограммы и вероятности
Приведенный выше пример не только демонстрирует построение гистограммы, но также показывает, что дискретные распределения вероятностей могут быть представлены с помощью гистограммы. Действительно, и дискретное распределение вероятностей можно представить гистограммой.
Чтобы построить гистограмму, которая представляет распределение вероятностей, мы начинаем с выбора классов. Это должны быть результаты вероятностного эксперимента. Ширина каждого из этих классов должна составлять одну единицу. Высота столбцов гистограммы – это вероятности для каждого из результатов. Для гистограммы, построенной таким образом, площади полосок также являются вероятностями.
Поскольку этот вид гистограммы дает нам вероятности, она подвержена влиянию пара условий. Одно из условий состоит в том, что только неотрицательные числа могут использоваться для шкалы, которая дает нам высоту данного столбца гистограммы. Второе условие заключается в том, что, поскольку вероятность равна площади, все площади полос должны составлять в сумме единицу, что эквивалентно 100%.
Гистограммы и другие приложения
Столбцы на гистограмме не обязательно должны быть вероятностями. Гистограммы полезны не только в вероятностных областях, но и в других областях. Каждый раз, когда мы хотим сравнить частоту появления количественных данных, можно использовать гистограмму для отображения нашего набора данных.