Что характеризует коэффициент вариации. Коэффициент вариации в статистике: примеры расчета

Полученные из опыта величины неизбежно содержат погрешности, обусловленные самыми разнообразными причинами. Среди них следует различать погрешности систематические и случайные. Систематические ошибки обусловливаются причинами, действующими вполне определенным образом, и могут быть всегда устранены или достаточно точно учтены. Случайные ошибки вызываются весьма большим числом отдельных причин, не поддающихся точному учету и действующих в каждом отдельном измерении различным образом. Эти ошибки невозможно совершенно исключить; учесть же их можно только в среднем, для чего необходимо знать законы, которым подчиняются случайные ошибки.

Будем обозначать измеряемую величину через А, а случайную ошибку при измерении х. Так как ошибка х может принимать любые значения, то она является непрерывной случайной величиной, которая вполне характеризуется своим законом распределения.

Наиболее простым и достаточно точно отображающим действительность (в подавляющем большинстве случаев) является так называемый нормальный закон распределения ошибок :

Этот закон распределения может быть получен из различных теоретических предпосылок, в частности, из требования, чтобы наиболее вероятным значением неизвестной величины, для которой непосредственным измерением получен ряд значений с одинаковой степенью точности, являлось среднее арифметическое этих значений. Величина 2 называется дисперсией данного нормального закона.

Среднее арифметическое

Определение дисперсии по опытным данным. Если для какой-либо величины А непосредственным измерением получено n значений a i с одинаковой степенью точности и если ошибки величины А подчинены нормальному закону распределения, то наиболее вероятным значением А будет среднее арифметическое :

a - среднее арифметическое,

a i - измеренное значение на i-м шаге.

Отклонение наблюдаемого значения (для каждого наблюдения) a i величины А от среднего арифметического : a i - a.

Для определения дисперсии нормального закона распределения ошибок в этом случае пользуются формулой:

2 - дисперсия,
a - среднее арифметическое,
n - число измерений параметра,

Среднеквадратическое отклонение

Среднеквадратическое отклонение показывает абсолютное отклонение измеренных значений от среднеарифметического . В соответствии с формулой для меры точности линейной комбинации средняя квадратическая ошибка среднего арифметического определяется по формуле:

, где


a - среднее арифметическое,
n - число измерений параметра,
a i - измеренное значение на i-м шаге.

Коэффициент вариации

Коэффициент вариации характеризует относительную меру отклонения измеренных значений от среднеарифметического :

, где

V - коэффициент вариации,
- среднеквадратическое отклонение,
a - среднее арифметическое.

Чем больше значение коэффициента вариации , тем относительно больший разброс и меньшая выравненность исследуемых значений. Если коэффициент вариации меньше 10%, то изменчивость вариационного ряда принято считать незначительной, от 10% до 20% относится к средней, больше 20% и меньше 33% к значительной и если коэффициент вариации превышает 33%, то это говорит о неоднородности информации и необходимости исключения самых больших и самых маленьких значений.

Среднее линейное отклонение

Один из показателей размаха и интенсивности вариации - среднее линейное отклонение (средний модуль отклонения) от среднего арифметического. Среднее линейное отклонение рассчитывается по формуле:

, где

_
a - среднее линейное отклонение,
a - среднее арифметическое,
n - число измерений параметра,
a i - измеренное значение на i-м шаге.

Для проверки соответствия исследуемых значений закону нормального распределения применяют отношение показателя асимметрии к его ошибке и отношение показателя эксцесса к его ошибке.

Показатель асимметрии

Показатель асимметрии (A) и его ошибка (m a) рассчитывается по следующим формулам:

, где

А - показатель асимметрии,
- среднеквадратическое отклонение,
a - среднее арифметическое,
n - число измерений параметра,
a i - измеренное значение на i-м шаге.

Показатель эксцесса

Показатель эксцесса (E) и его ошибка (m e) рассчитывается по следующим формулам:

, где

Вариация признака определяется различными факторами, часть этих факторов можно выделить, если статистическую совокупность разделить на группы по определенному признаку. Тогда, наряду с изучением вариации признака по совокупности в целом, можно изучить вариацию для каждой из составляющих ее группы и между этими группами. В простом случае, когда совокупность разделена на группы по одному фактору, изучение вариации достигается посредством вычисления и анализа трех видов дисперсий: общей, межгрупповой и внутригрупповой.

Эмпирический коэффициент детерминации

Эмпирический коэффициент детерминации широко применяется в статистическом анализе и является показателем, представляющим долю межгруппопой дисперсии в результативного признака и характеризует силу влияния группировочного признака на образование общей вариации. Он может быть рассчитан по формуле:

Показывает долю вариации результативного признака у под влиянием факторного признака х, он связан с коэффициентом корреляции квадратичной зависимостью. При отсутствии связи эмпирический коэффициент детерминации равен нулю, а при функциональной связи - единице.

Например, когда изучается зависимость производительности труда рабочих от их квалификации коэффициент детерминации равен 0,7, то на 70% вариация производительности труда рабочих обусловлена различиями в их квалификации и на 30% - влиянием прочих факторов.

Эмпирическое корреляционное отношение - это квадратный корень из коэффициента детерминации. Отношение показывает тесноту связи между группировочным и результативным признаками. Эмпирическое корреляционное отношение принимает значения от -1 до 1. Если связи нет, то корреляционное отношение равняется нулю, т.е. все групповые средние равняются между собой и межгрупповой вариации нет. Значит, группировочный признак не влияет на образование общей вариации.

Если связь функциональная, то корреляционное отношение равняется единице. В таком случае дисперсия групповых средних равна общей дисперсии, т.е. внутригрупповой вариации нет. Это значит, что группировочный признак полностью определяет вариацию результативного признака.

Чем ближе значение корреляционного отношения к единице, тем сильнее и ближе к функциональной зависимости связь между признаками. Для качественной оценки силы связи на основе показателя эмпирического коэффициента корреляции можно использовать соотношение Чэддока.

Соотношение Чэддока

  • Связь весьма тесная — коэффициент корреляции находится в интервале 0,9 — 0,99
  • Связь тесная — Rxy = 0,7 — 0,9
  • Связь заметная — Rxy = 0,5 — 0,7
  • Связь умеренная — Rxy = 0,3 — 0,5
  • Связь слабая — Rxy = 0,1 — 0,3

В этом же документе приводятся правила определения коэффициента вариации. Разработано несколько методик выявления НМЦК: нормативная, тарифная, проектно-сметная, затратная. Самым приоритетным считается метод сопоставимых рыночных цен. Именно его рекомендуется использовать при определении стартовой цены. Он предполагает сравнение коммерческих предложений, предоставляемых потенциальными поставщиками по запросу заказчика. Для проведения такого анализа и применяется коэффициент вариации. Он выражается в процентах. Под коэффициентом вариации понимается мера относительного разброса предлагаемых цен. Он показывает, какую долю занимает средний разброс цен от среднего значения цены. Этот показатель может принимать следующие значения:

  1. Меньше 10%. В таком случае разница в ценах признается незначительной.
  2. От 10% до 20%. Разброс считается средним.
  3. От 20% до 33%.

Коэффициент вариации

Для проверки соответствия исследуемых значений закону нормального распределения применяют отношение показателя асимметрии к его ошибке и отношение показателя эксцесса к его ошибке. Показатель асимметрии Показатель асимметрии (A) и его ошибка (ma) рассчитывается по следующим формулам: , где А — показатель асимметрии, — среднеквадратическое отклонение,a — среднее арифметическое,n — число измерений параметра,ai — измеренное значение на i-м шаге.


Показатель эксцесса Показатель эксцесса (E) и его ошибка (me) рассчитывается по следующим формулам: , где Е — показатель эксцесса, — среднеквадратическое отклонение,a — среднее арифметическое,n — число измерений параметра,ai — измеренное значение на i-м шаге. Если А < 0, то больше данных с меньшими значениями, чем среднеарифметическое.
Если Е < 0, то данные сконцентрированы около среднеарифметического значения.

Инфо

X – отдельные значения, X̅– среднее арифметическое по выборке. Примечание. Для расчета дисперсии в Excel предусмотрена специальная функция.


Стоит отметить, что у такого расчета дисперсии есть недостаток – она получается смещенной, т.е. ее математическое ожидание не равно истинному значению дисперсии. Подробней об этом здесь. В то же время не все так плохо.
При увеличении объема выборки она все-таки приближается к своему теоретическому аналогу, т.е. является асимптотически не смещенной. Поэтому при работе с большими размерами выборок можно использовать формулу выше.
Язык знаков полезно перевести на язык слов. Получится, что дисперсия — это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности.

Что характеризует коэффициент вариации

Для определения дисперсии нормального закона распределения ошибок в этом случае пользуются формулой: , где 2 — дисперсия,a — среднее арифметическое,n — число измерений параметра,ai — измеренное значение на i-м шаге. Среднеквадратическое отклонение Среднеквадратическое отклонение показывает абсолютное отклонение измеренных значений от среднеарифметического.
В соответствии с формулой для меры точности линейной комбинации средняя квадратическая ошибка среднего арифметического определяется по формуле: , где — среднеквадратическое отклонение,a — среднее арифметическое,n — число измерений параметра,ai — измеренное значение на i-м шаге. Коэффициент вариации Коэффициент вариации характеризует относительную меру отклонения измеренных значений от среднеарифметического: , где V — коэффициент вариации, — среднеквадратическое отклонение,a — среднее арифметическое.

Вариация (статистика)

Для полноты описания нужно понять, какой является разница между средним ростом каждого студента и средним значением. На первом этапе вычислим параметр дисперсии. Дисперсия в статистике (обозначается σ2 (сигма в квадрате)) – это отношение суммы квадратов разности среднего арифметического (μ) и значения члена ряда (Х) к числу всех членов совокупности (N).

В виде формулы это рассчитывается понятнее: Значения, которые мы получим в результате вычислений по этой формуле, мы будем представлять в виде квадрата величины (в нашем случае – квадратные сантиметры). Характеризовать рост в сантиметрах квадратными сантиметрами, согласитесь, нелепо. Поэтому мы можем исправить, точнее, упростить это выражение и получим среднеквадратичное отклонение формулу и расчёт, пример: Таким образом, мы получили величину стандартного отклонения (или среднего квадратичного отклонения) – квадратный корень из дисперсии.

Коэффициент вариации в статистике: примеры расчета

Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, мы просто рассчитываем среднюю арифметическую. Средний – квадрат – отклонений. Отклонения возводятся в квадрат, и считается средняя.

Внимание

Разгадка заключается всего в трех словах. Однако в чистом виде, как, например, средняя арифметическая, или индекс, дисперсия не используется. Это скорее вспомогательный и промежуточный показатель, который необходим для других видов статистического анализа.


У нее даже единицы измерения нормальной нет. Судя по формуле, это квадрат единицы измерения исходных данных. Без бутылки, как говорится, не разберешься.

Статистические параметры

Было получено четыре коммерческих предложения цен: 2500 рублей, 2800 рублей, 2450 рублей и 2600 рублей. В первую очередь необходимо рассчитать среднеарифметическое значение цены Следующим шагом становится расчет среднеквадратичного отклонения Осталось только рассчитать коэффициент вариации Полученное значение коэффициента меньше 33%, следовательно, все собранные данные подходят для расчета стартовой цены контракта. Расчет НМЦК и коэффициента вариации оформляются в форме отчета, который становится обязательной частью закупочной документации. Коэффициент вариации – важный инструмент, позволяющий оценить правильность ценовых предложений, полученных от поставщиков. Поэтому при составлении документации заказчикам необходимо учитывать правила расчета этого показателя и особенности его применения.

Для чего нужен коэффициент вариации

Как доказать, что закономерность, полученная при изучении экспериментальных данных, не является результатом совпадения или ошибки экспериментатора, что она достоверна? С таким вопросом сталкиваются начинающие исследователи.Описательная статистика предоставляет инструменты для решения этих задач. Она имеет два больших раздела – описание данных и их сопоставление в группах или в ряду между собой. Оглавление:

  • Показатели описательной статистики
  • Среднее арифметическое
  • Стандартное отклонение
  • Коэффициент вариации
  • Расчёты в Microsoft Ecxel 2016

Любая статистическая совокупность состоит из единиц, значения признака которых варьируют. Для того, чтобы судить об однородности совокупности и типичности средней величины изучаемого признака, анализ следует дополнять исчислением показателей вариации.

Вариация - это колеблемость, многообразие, изменяемость величины признака у отдельных единиц совокупности.

К абсолютным показателям вариации относят: размах вариации, среднее линейное отклонение, дисперсию и среднее квадратическое отклонение.

Размах вариации - характеристика границ вариации изучаемого признака. Показывает, сколь велико различие между единицами совокупности, имеющими самое маленькое и самое большое значение признака, основан на крайних значениях варьирующего признака и не отражает отклонений всех вариант в ряду. Определяется по формуле:

R=Xmax-Xmin, (5.4)

где Xmax - максимальное значение вариационного ряда;

Xmin - минимальное.

Среднее линейное отклонение показывает, на какую величину отклоняется признак в изучаемой совокупности от средней величины признака. Находится по формуле:

где - индивидуальные значения варьирующего признака (варианты); - частоты, веса; - среднее значение варьирующего признака;

Дисперсия - средний квадрат отклонения индивидуальных значений признака от их средней величины. Вычисляется по следующим формулам.

Первый способ определения дисперсии:

Второй способ определения дисперсии (по средней арифметической):

где - средняя из квадратов индивидуальных значений; - квадрат средней величины признака.

Среднее квадратическое отклонение - это обобщающая характеристика размеров вариации признака в совокупности. Показывает, на какую величину в среднем значение признака отличается от стандартного значения, определяется по формуле:

Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее (количественно) совокупность и тем более типичной будет средняя величина.

Рассчитаем показатели вариации для группировки транспортных организаций по грузообороту автомобильного транспорта (таблица 5.1).

Найдем размах вариации (по формуле 5.4):

Разброс значений грузооборота транспорта общественного пользования достаточно высок.

Вычислим среднее линейное отклонение (по формуле 5.5):


Значения грузооборота автомобильного транспорта отличались от среднего значения на 508,8 млн. т. км.

Рассчитаем дисперсию двумя способами (по формулам 5.6 - 5.7). Первый способ:



Вычислим среднее квадратическое отклонение (по формуле 5.8):

Это значит, что грузооборот транспорта общественного пользования в среднем отличается от стандартного значения на 23,68 млн. т. км.

Найдем показатели вариации для группировки площадей жилых помещений (таблица 5.3), используя формулы 5.4 - 5.8

Вычислим размах вариации:

Размах вариации в 3,1 м2 показывает нам, что разброс значений площадей жилых помещений не очень высок.

Рассчитаем среднее линейное отклонение:

Таким образом, значения площадей жилых помещений в изучаемой совокупности отклоняются от средней величины на 1,19 м2.

Рассчитаем дисперсию двумя способами.

Первый способ:


Второй способ (по средней арифметической):

Вычислим среднее квадратическое отклонение:

Оно показывает, что значения площадей жилых помещений в среднем отличается от стандартного значения на 1,3 м2 .

Коэффициенты вариации

Вариация измеряется с помощью относительных величин, называемых коэффициентами вариации и определяемых в виде отношения среднего отклонения к средней величине. Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Значения коэффициента вариации изменяются от 0 до 100% и чем ближе он к нулю, тем типичнее найденная средняя величина для изучаемой статистической совокупности, а значит и качественнее подобраны статистические данные. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). Различают следующие относительные показатели вариации:

Коэффициент вариации:

где - среднее квадратическое отклонение, - средняя арифметическая.

Линейный коэффициент вариации:

где - среднее линейное отклонение.

Коэффициент осцилляции:

где - размах вариации.

Вычислим коэффициенты вариации для группы организаций по грузообороту автомобильного транспорта (таблица 5.1) по формулам 5.9, 5.10, 5.11

Коэффициент вариации будет равен: , что превышает 33%, следовательно, совокупность неоднородна.

Вычислим линейный коэффициент вариации: . Следовательно, доля усредненного значения абсолютных отклонений организаций от средней величины равна 30,7%

Найдем коэффициент осцилляции: . Из этого следует, что разница между максимальным и минимальным значениями организаций превышает среднее значение почти в 1,078 раз.

Определим коэффициенты вариации для группировки площадей жилых помещений (в среднем на одного жителя) (таблица 5.3).

Вычислим коэффициент вариации по формуле (5.9):

Это значит что коэффициент вариации не превышает 33%, следовательно, совокупность однородна.

Рассчитаем линейный коэффициент вариации по формуле (5.10):

Это значит, что доля усредненного значения абсолютных отклонений площадей жилых помещений от средней величины равна 5,56%.

Найдем коэффициент осцилляции по формуле (5.11):

Разница между максимальным и минимальным значениями площадей жилых помещений не превышает среднее значение.

представляет собой отношение среднего квадратического отклонения к среднему ожидаемому значению и показывает степень отклонения получаемых результатов.
V = -* 100%, Х
гдеV - коэффициент вариации, %;
G- среднее квадратическое отклонение;
X - среднее ожидаемое значение.
Так как коэффициент вариации - величина относительная, то на его размер не оказывают влияние абсолютные значения изучаемого показателя. С помощью коэффициента вариации можно сравнивать даже колебле-
мость признаков, выраженных в разных единицах измерения. Коэффициент вариации изменяется в пределах от 0 до 100%, при этом, значение коэффициента прямо пропорционально силе колеблемости. Установлена следующая качественная оценка различных коэффициентов вариации:
до 10% - слабая колеблемость;
10-25% - умеренная колеблемость;
свыше 25% - высокая колеблемость.
В качестве варианта может быть использован несколько упрощенный метод определения степени риска. Так как количественно риск характеризуется оценкой вероятной величины максимального и минимального результатов, то «чем больше диапазон между этими величинами при равной их вероятности, тем выше степень риска»1 . Тогда для расчета дисперсии можно использовать следующую формулу:
&2 = PMAX * (max - XУ + Pmin * (X - Xmin У,
2
гдеа2 - дисперсия;
Pmax - вероятность получения максимального результата;
Xmax - максимальная величина результата;
X - средняя ожидаемая величина результата;
Pmjn - вероятность получения минимального результата;
Xmjn - минимальная величина результата.
Полученные показатели следует учитывать в комплексе, так как использование отдельного критерия оценки риска не может служить основой принятия решения в пользу какой-либо стратегии.
В практике встречаются ситуации, когда отсутствует информация о вероятностях состояний среды, т.е. необходима оценка риска в условиях полной неопределенности - (2). В таких случаях для определения наилучших решений используются следующие критерии: максимакса, Вальда, Сэвиджа, Гурвица. Применение каждого из перечисленных критериев рассмотрим на примере матрицы выигрышей А (1) и матрицы рисков R (2).

Еще по теме Коэффициент вариации:

  1. ВАРИАЦИИ В СТРУКТУРЕ И СТРУКТУРНО-ОБУСЛОВЛЕННЫЕ ВАРИАЦИИ
  2. 1.2.10. Определение. Если существует производная функциив точке, то она называется первой вариацией функционала в точке при данной вариации аргумента, и обозначается: