Когда стандартное отклонение равно нулю?

Стандартное отклонение выборки – это описательная статистика, которая измеряет разброс набора количественных данных. Это число может быть любым неотрицательным действительным числом. Поскольку ноль является неотрицательным действительным числом, кажется целесообразным спросить: «Когда стандартное отклонение выборки станет равным нулю?» Это происходит в очень особенном и весьма необычном случае, когда все значения наших данных абсолютно одинаковы. Мы исследуем причины, почему.

Описание стандартного отклонения

Два важных вопроса, на которые мы обычно хотим ответить о набор данных включает:

  • Что является центром набора данных?
  • Насколько разбросан набор данных?

Существуют различные измерения, называемые описательной статистикой, которые отвечают на эти вопросы. Например, центр данных, также известный как среднее значение, можно описать в терминах среднего, медианы или моды. Можно использовать и другие менее известные статистические данные, такие как мидинг или триум.

Для распространения наших данных мы могли бы использовать диапазон, межквартильный размах или стандартное отклонение. Стандартное отклонение сочетается со средним значением для количественной оценки разброса наших данных. Затем мы можем использовать это число для сравнения нескольких наборов данных. Чем больше наше стандартное отклонение, тем больше разброс.

Intuition

Итак, давайте рассмотрим из этого описания, что это означало бы иметь нулевое стандартное отклонение. Это будет означать, что в нашем наборе данных нет никакого спреда. Все отдельные значения данных будут объединены в одно значение. Поскольку у наших данных может быть только одно значение, это значение будет составлять среднее значение для нашей выборки.

В этой ситуации, когда все наши данные значения те же, никаких изменений не будет. Интуитивно понятно, что стандартное отклонение такого набора данных будет равно нулю.

Математическое доказательство

Стандартное отклонение образца определяется формулой. Таким образом, любое утверждение, подобное приведенному выше, должно быть доказано с помощью этой формулы. Начнем с набора данных, который соответствует приведенному выше описанию: все значения идентичны, и есть значения n , равные x .

Мы вычисляем среднее значение этого набора данных и видим, что оно равно

x = ( x + x +.. + x )/ n = nx / n = x.

Теперь, когда мы вычисляем индивидуальные отклонения от среднего, мы видим, что все эти отклонения равны нулю. Следовательно, и дисперсия, и стандартное отклонение тоже равны нулю.

Необходимое и достаточное

Мы видим, что если набор данных не показывает изменений, тогда его стандартное отклонение равно нулю. Мы можем спросить, верно ли и обратное этого утверждения.. Чтобы убедиться, что это так, мы снова воспользуемся формулой для стандартного отклонения. Однако на этот раз мы установим стандартное отклонение равным нулю. Мы не будем делать никаких предположений относительно нашего набора данных, но посмотрим, что подразумевает установка s = 0

Предположим, что стандарт отклонение набора данных равно нулю. Это означало бы, что выборочная дисперсия s 2 также равна нулю. Результатом является уравнение:

0 = (1/( n – 1)) ∑ ( x i x )2

Умножаем обе части уравнения на n – 1 и видим, что сумма квадратов отклонений равна нулю. Поскольку мы работаем с действительными числами, единственный способ сделать это – сделать так, чтобы каждый квадрат отклонения был равен нулю. Это означает, что для каждого i термин ( x i x ) 2 = 0.

Теперь извлечем квадратный корень из приведенного выше уравнения и увидим, что каждое отклонение от среднего должен быть равен нулю. Поскольку для всех i,

x i x = 0

Это означает, что каждое значение данных равно среднему значению. Этот результат вместе с приведенным выше позволяет нам сказать, что стандартное отклонение выборки набора данных равно нулю тогда и только тогда, когда все его значения идентичны.

Оцените статью
recture.ru
Добавить комментарий