Парные данные в статистике, часто называемые упорядоченными парами, относятся к двум переменным в отдельных группах населения, которые связаны между собой для определения корреляции между ними. Чтобы набор данных считался парными, оба этих значения данных должны быть присоединены или связаны друг с другом и не рассматриваются отдельно.
Идея парных данных противопоставляется обычному связыванию одного числа с каждой точкой данных, как и в других наборах количественных данных, в том, что каждая отдельная точка данных связана с двумя числами, обеспечивая график, который позволяет статистикам наблюдать взаимосвязь между этими переменными в генеральной совокупности. .
Этот метод парных данных используется, когда в исследовании надеются сравнить две переменные в отдельных группах населения, чтобы сделать какой-то вывод о наблюдаемой корреляции. При наблюдении за этими точками данных важен порядок пар, потому что первое число является мерой одного, а второе – совсем другого.
Пример парных данных
Чтобы увидеть пример парных данных, предположим, что учитель подсчитывает количество домашних заданий, которые каждый ученик сдал для определенного блока, а затем связывает это число с процентным соотношением каждого ученика. модульный тест. Пары выглядят следующим образом:
- Человек, выполнивший 10 заданий, заработал 95% на своем тесте. (10, 95%)
- Человек, выполнивший 5 заданий, заработал 80% на своем тесте. (5, 80%)
- Человек, выполнивший 9 заданий, заработал 85% на своем тесте. (9, 85%)
- Человек, выполнивший 2 задания, заработал 50% на своем тесте. (2, 50%)
- Человек, выполнивший 5 заданий, заработал 60% на своем тесте. (5, 60%)
- Человек, выполнивший 3 задания, заработал 70% на своем тесте. (3, 70%)
В каждом из этих наборов парных данных мы видим, что количество назначений всегда идет первым в упорядоченная пара, в то время как процент, заработанный на тесте, идет на втором месте, как видно в первом экземпляре (10, 95%).
Хотя статистический анализ этого данные также можно использовать для расчета среднего количества выполненных домашних заданий или среднего балла за экзамен; могут возникнуть другие вопросы о данных. В этом случае учитель хочет знать, есть ли какая-либо связь между количеством сданных домашних заданий и успеваемостью по тесту, и учитель должен сохранить данные в паре, чтобы ответить на этот вопрос.
Анализ парных данных
Статистические методы корреляции и регрессии используются для анализа парных данных, где коэффициент корреляции количественно определяет, насколько близко данные лежат вдоль прямая линия и измеряет силу линейной зависимости.
Регрессия, с другой стороны, используется для нескольких приложений, включая определение того, какая линия лучше всего подходит для нашего набора данных. Затем эту строку можно использовать для оценки или прогнозирования значений y для значений x , которые не были частью нашего исходного набора данных.
Существует специальный тип графика, который особенно хорошо подходит для парных данных, называемый диаграммой рассеяния. В этом типе диаграммы одна координатная ось представляет одно количество парных данных, а другая координатная ось представляет другое количество парных данных.
Диаграмма рассеяния для приведенных выше данных ось X будет обозначать количество сданных заданий, а ось Y – баллы по модульному тесту.