Меры разброса в статистике

При распределении данных очень важную роль играют меры дисперсии. Эти меры дополняют центральные позиции, характеризуя изменчивость данных.

Да, меры центральной тенденции указывают значения, относительно которых данные, как представляется, группируются. Им рекомендуется делать выводы о поведении переменных в популяциях и выборках. Некоторыми примерами из них являются среднее арифметическое, мода или медиана (1).

Меры дисперсии дополняют эти меры центральной тенденции. Более того, необходимы при распределении данных. Это потому, что они характеризуют изменчивость данных. Его актуальность в статистическом обучении указали Уайлд и Пфаннкуч (1999).

В этих измерениях восприятие изменчивости данных является одним из основных компонентов статистического мышления. Восприятие изменчивости данных дает нам информацию о разбросе данных по отношению к среднему или среднему значению.

Среднее арифметическое широко используется на практике, но часто может быть неправильно истолковано. Это произойдет, когда значения переменной сильно разойдутся. В таких случаях необходимо следовать среднему значению мер дисперсии (2).

В показателях дисперсии есть три важных компонента, связанных со случайной изменчивостью (два):

  • Восприятие его повсеместности в окружающем мире.
  • Конкурс на объяснение.
  • Умение считать (что подразумевает понимание и умение применять концепцию дисперсии).
Меры разброса в статистике

Какие меры дисперсии для?

В статистическом исследовании при обобщении данных из выборки совокупности очень важны меры дисперсии, поскольку они напрямую определяют ошибку, с которой мы работаем. Да, чем больше дисперсии мы соберем в выборке, тем большего размера нам понадобится для работы с той же ошибкой.

С другой стороны, эти меры помогают нам определить, далеки ли наши данные от основной ценности.. Таким образом, они дают нам информацию о том, адекватно ли это центральное значение для представления исследуемой популяции. Это очень полезно для сравнения распределений и понимания рисков при принятии решений (1).

Эти меры очень полезны для сравнения распределений и понимания рисков при принятии решений. Чем больше дисперсия, тем менее репрезентативно центральное значение.. Это наиболее часто используемые:

  • Путешествие или диапазон.
  • Среднее отклонение.
  • Дисперсия.
  • Стандартное или стандартное отклонение.
  • Коэффициент вариации.

Функции каждой из мер дисперсии

Классифицировать

Первый, диапазон рекомендуется для первичного сравнения. Таким образом, рассмотрим только два крайних наблюдения. Поэтому рекомендуется только для небольших образцов (1). Он определяется как разница между последним значением переменной и первым (3).

Меры разброса в статистике

Статистическое отклонение

Со своей стороны, Среднее отклонение указывает, где были бы сконцентрированы данные, если бы все они находились на одинаковом расстоянии от среднего арифметического (1). Мы рассматриваем отклонение значения переменной как разницу в абсолютном значении между этим значением переменной и средним арифметическим значением ряда. Таким образом, оно считается средним арифметическим отклонений (3).

Дисперсия

Дисперсия — это алгебраическая функция всех значений, подходящая для задач логической статистики. (1). Его можно определить как квадрат отклонений (3).

Стандартное или стандартное отклонение

Для выборок, взятых из одной и той же совокупности, стандартное отклонение является одним из наиболее часто используемых (1). Это квадратный корень из дисперсии (3).

Коэффициент вариации

Это мера, используемая в основном для сравнить различия между двумя наборами данных, измеренными в разных единицах. Например, рост и вес учащихся в выборке. Таким образом, он используется для определения того, в каком распределении данные более кластеризованы, а среднее значение более репрезентативно (1).

Меры разброса в статистике

Коэффициент вариации является более репрезентативной мерой дисперсии, чем предыдущие, потому что это абстрактное число. То есть он не зависит от единиц измерения, в которых появляются значения переменной. Обычно этот коэффициент вариации выражается в процентах (3).

Таким образом, эти меры дисперсии будут указывать, с одной стороны, на степень изменчивости в выборке. С другой стороны, они укажут на репрезентативность центральной ценности, поскольку если получено небольшое значение, это означает, что значения сосредоточены вокруг этого центра.

Это будет означать, что данные мало изменчивы, и центр хорошо представляет всех. С другой стороны, если будет получено большое значение, это будет означать, что значения не концентрируются, а рассредоточены. Это будет означать, что существует большая вариативность, и центр не будет очень репрезентативным. С другой стороны, при умозаключениях нам потребуется больший размер выборки, если мы хотим уменьшить ошибку, которая увеличивается именно за счет увеличения изменчивости.

Like this post? Please share to your friends: