Набор данных является бимодальным, если он имеет два режима. Это означает, что не существует ни одного значения данных, которое встречается с наибольшей частотой. Вместо этого есть два значения данных, которые связаны друг с другом по наивысшей частоте.
Пример двухрежимного набора данных
В помощь Чтобы понять это определение, мы рассмотрим пример набора с одним режимом, а затем сравним его с двухрежимным набором данных. Предположим, у нас есть следующий набор данных:
1, 1, 1, 2, 2, 2, 2, 3, 4, 5, 5, 6 , 6, 6, 7, 7, 7, 8, 10, 10
Считаем частоту каждого числа в наборе данных:
- 1 встречается в наборе три раза
- 2 встречается в наборе четыре раза
- 3 встречается в наборе один раз
- 4 встречается в наборе один раз
- 5 встречается в наборе два раза
- 6 встречается в наборе три раза
- 7 встречается в наборе три раза
- 8 встречается в наборе один раз
- 9 встречается в наборе ноль раз
- 10 встречается в наборе два раза
Здесь мы видим, что 2 встречается больше всего часто, и поэтому это режим набора данных.
Мы сравниваем этот пример со следующим
1, 1, 1, 2 , 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 7, 7, 7, 7, 7, 8, 10, 10, 10, 10, 10
Считаем частоту каждого числа в наборе данных:
- 1 встречается в установлен три раза
- 2 встречается в наборе четыре раза
- 3 встречается в наборе один раз
- 4 встречается в наборе один время
- 5 встречается в наборе два раза
- 6 встречается в наборе три раза
- 7 встречается в наборе пять раз
- 8 встречается в наборе один раз
- 9 встречается в наборе ноль раз
- 10 встречается в наборе пять раз
Здесь 7 и 10 встречаются пять раз. Это выше, чем любое из других значений данных. Таким образом, мы говорим, что набор данных является бимодальным, что означает, что он имеет два режима. Любой пример бимодального набора данных будет похож на этот.
Последствия бимодального распределения
Режим – это один из способов измерить центр набора данных. Иногда чаще всего встречается среднее значение переменной. По этой причине важно видеть, является ли набор данных бимодальным. Вместо одного режима у нас будет два.
Одно из основных последствий бимодального набора данных состоит в том, что он может показать нам, что существует два разных типа лиц, представленных в наборе данных. Гистограмма бимодального набора данных будет иметь два пика или горба.
Например, гистограмма бимодальных результатов тестов будет иметь два пика. Эти пики будут соответствовать наибольшему количеству учащихся, набравших баллы. Если есть два режима, это может показать, что есть два типа учеников: те, кто был подготовлен к тесту, и те, кто не был подготовлен..