Не все данные создаются одинаково. Полезно классифицировать наборы данных по разным критериям. Некоторые из них количественные, а некоторые качественные. Некоторые наборы данных являются непрерывными, а некоторые – дискретными.
Другой способ разделить данные – разделить их на четыре уровня измерения: номинальный, порядковый, интервал и коэффициент . Для разных уровней измерения требуются разные статистические методы. Мы рассмотрим каждый из этих уровней измерения.
Номинальный уровень измерения
Номинальный уровень измерения – это самый низкий из четырех способов характеризации данных. Номинальный означает «только по названию», и это должно помочь запомнить, что это за уровень. Номинальные данные имеют дело с именами, категориями или ярлыками.
Данные на номинальном уровне являются качественными. Цвет глаз, ответы «да» или «нет» в опросе и любимые хлопья для завтрака – все это связано с номинальным уровнем измерения. Даже некоторые вещи с номерами, с которыми они связаны, например, число на спине футбольной майки, являются номинальными, поскольку они используются для «именования» отдельного игрока на поле.
Данные на этом уровне нельзя упорядочить осмысленным образом, и нет смысла вычислять такие вещи, как средние значения и стандартные отклонения.
Порядковый уровень измерения
Следующий уровень называется порядковым уровнем измерения. Данные на этом уровне можно упорядочить, но нельзя выделить значимые различия между данными.
Здесь вы должны думать о таких вещах, как список 10 лучших городов для жизни. Данные, здесь десять городов, ранжированы от одного до десяти, но различия между городами не имеют особого смысла. Невозможно взглянуть только на рейтинги, чтобы узнать, насколько лучше жизнь в городе №1, чем в городе №2.
Другой пример – буквенные оценки . Вы можете упорядочить вещи так, чтобы A был выше, чем B, но без какой-либо другой информации невозможно узнать, насколько лучше A от B.
Как и в случае номинального уровня, данные на порядковом уровне не должны использоваться в расчетах.
Интервальный уровень измерения
Интервальный уровень измерения имеет дело с данными, которые можно упорядочить, и в которых различия между данными действительно имеют смысл. Данные на этом уровне не имеют отправной точки.
Шкалы температур по Фаренгейту и Цельсию являются примерами данных на интервальном уровне измерения. Вы можете говорить о 30 градусах, что на 60 градусов меньше 90 градусов, поэтому различия действительно имеют смысл. Однако 0 градусов (в обеих шкалах) холода, каким бы он ни был, не означает полное отсутствие температуры.
Данные на уровне интервала могут использоваться в расчеты. Однако данным на этом уровне не хватает одного типа сравнения.. Несмотря на то, что 3 x 30 = 90, неверно сказать, что 90 градусов по Цельсию в три раза больше, чем 30 градусов по Цельсию.
Ratio Level of Measurement
Четвертый и самый высокий уровень измерения – это уровень отношения. Данные на уровне отношения обладают всеми характеристиками уровня интервала в дополнение к нулевому значению. Из-за наличия нуля теперь имеет смысл сравнить соотношения измерений. Такие фразы, как «четыре раза» и «дважды» имеют смысл на уровне отношения.
Расстояния в любой системе измерения дают нам данные в соотношении уровень. Такое измерение, как 0 футов, имеет смысл, поскольку оно не представляет собой длину. Кроме того, 2 фута вдвое длиннее 1 фута. Таким образом, между данными могут быть сформированы отношения.
На уровне измерения отношения могут быть вычислены не только суммы и разности, но и отношения. Одно измерение можно разделить на любое ненулевое измерение, и в результате получится значащее число.
Подумайте, прежде чем рассчитывать
Учитывая список номеров социального страхования, с ними можно делать всевозможные расчеты, но ни один из этих расчетов не дает ничего значимого. Каким будет один номер социального страхования разделить на другой? Полная трата вашего времени, поскольку номера социального страхования находятся на номинальном уровне измерения.
Когда вам дают какие-то данные, подумайте перед расчетом. Уровень измерения, с которым вы работаете, определит, что имеет смысл делать.