По какой формуле рассчитывается дисперсия взвешенная. Дисперсия, виды и свойства дисперсии
Среди множества показателей, которые применяются в статистике, нужно выделить расчет дисперсии. Следует отметить, что выполнение вручную данного вычисления – довольно утомительное занятие. К счастью, в приложении Excel имеются функции, позволяющие автоматизировать процедуру расчета. Выясним алгоритм работы с этими инструментами.
Дисперсия – это показатель вариации, который представляет собой средний квадрат отклонений от математического ожидания. Таким образом, он выражает разброс чисел относительно среднего значения. Вычисление дисперсии может проводиться как по генеральной совокупности, так и по выборочной.
Способ 1: расчет по генеральной совокупности
Для расчета данного показателя в Excel по генеральной совокупности применяется функция ДИСП.Г . Синтаксис этого выражения имеет следующий вид:
ДИСП.Г(Число1;Число2;…)
Всего может быть применено от 1 до 255 аргументов. В качестве аргументов могут выступать, как числовые значения, так и ссылки на ячейки, в которых они содержатся.
Посмотрим, как вычислить это значение для диапазона с числовыми данными.
Способ 2: расчет по выборке
В отличие от вычисления значения по генеральной совокупности, в расчете по выборке в знаменателе указывается не общее количество чисел, а на одно меньше. Это делается в целях коррекции погрешности. Эксель учитывает данный нюанс в специальной функции, которая предназначена для данного вида вычисления – ДИСП.В. Её синтаксис представлен следующей формулой:
ДИСП.В(Число1;Число2;…)
Количество аргументов, как и в предыдущей функции, тоже может колебаться от 1 до 255.
Как видим, программа Эксель способна в значительной мере облегчить расчет дисперсии. Эта статистическая величина может быть рассчитана приложением, как по генеральной совокупности, так и по выборке. При этом все действия пользователя фактически сводятся только к указанию диапазона обрабатываемых чисел, а основную работу Excel делает сам. Безусловно, это сэкономит значительное количество времени пользователей.
По данным выборочного обследования произведена группировка вкладчиков по размеру вклада в Сбербанке города:
Определите:
1) размах вариации;
2) средний размер вклада;
3) среднее линейное отклонение;
4) дисперсию;
5) среднее квадратическое отклонение;
6) коэффициент вариации вкладов.
Решение:
Данный ряд распределения содержит открытые интервалы. В таких рядах условно принимается величина интервала первой группы равна величине интервала последующей, а величина интервала последней группы равна величине интервала предыдущей.
Величина интервала второй группы равна 200, следовательно, и величина первой группы также равна 200. Величина интервала предпоследней группы равна 200, значит и последний интервал будет иметь величину, равную 200.
1) Определим размах вариации как разность между наибольшим и наименьшим значением признака:
Размах вариации размера вклада равен 1000 рублей.
2) Средний размер вклада определим по формуле средней арифметической взвешенной.
Предварительно определим дискретную величину признака в каждом интервале. Для этого по формуле средней арифметической простой найдём середины интервалов.
Среднее значение первого интервала будет равно:
второго - 500 и т. д.
Занесём результаты вычислений в таблицу:
Размер вклада, руб. | Число вкладчиков, f | Середина интервала, х | xf |
---|---|---|---|
200-400 | 32 | 300 | 9600 |
400-600 | 56 | 500 | 28000 |
600-800 | 120 | 700 | 84000 |
800-1000 | 104 | 900 | 93600 |
1000-1200 | 88 | 1100 | 96800 |
Итого | 400 | - | 312000 |
Средний размер вклада в Сбербанке города будет равен 780 рублей:
3) Среднее линейное отклонение есть средняя арифметическая из абсолютных отклонений отдельных значений признака от общей средней:
Порядок расчёта среднего линейонго отклонения в интервальном ряду распределения следующий:
1. Вычисляется средняя арифметическая взвешенная, как показано в п. 2).
2. Определяются абсолютные отклонения вариант от средней:
3. Полученные отклонения умножаются на частоты:
4. Находится сумма взвешенных отклонений без учёта знака:
5. Сумма взвешенных отклонений делится на сумму частот:
Удобно пользоваться таблицей расчётных данных:
Размер вклада, руб. | Число вкладчиков, f | Середина интервала, х | |||
---|---|---|---|---|---|
200-400 | 32 | 300 | -480 | 480 | 15360 |
400-600 | 56 | 500 | -280 | 280 | 15680 |
600-800 | 120 | 700 | -80 | 80 | 9600 |
800-1000 | 104 | 900 | 120 | 120 | 12480 |
1000-1200 | 88 | 1100 | 320 | 320 | 28160 |
Итого | 400 | - | - | - | 81280 |
Среднее линейное отклонение размера вклада клиентов Сбербанка составляет 203,2 рубля.
4) Дисперсия - это средняя арифметическая квадратов отклонений каждого значения признака от средней арифметической.
Расчёт дисперсии в интервальных рядах распределения производится по формуле:
Порядок расчёта дисперсии в этом случае следующий:
1. Определяют среднюю арифметическую взвешенную, как показано в п. 2).
2. Находят отклонения вариант от средней:
3. Возводят в квадрат отклонения каждой варианты от средней:
4. Умножают квадраты отклонений на веса (частоты):
5. Суммируют полученные произведения:
6. Полученная сумма делится на сумму весов (частот):
Расчёты оформим в таблицу:
Размер вклада, руб. | Число вкладчиков, f | Середина интервала, х | |||
---|---|---|---|---|---|
200-400 | 32 | 300 | -480 | 230400 | 7372800 |
400-600 | 56 | 500 | -280 | 78400 | 4390400 |
600-800 | 120 | 700 | -80 | 6400 | 768000 |
800-1000 | 104 | 900 | 120 | 14400 | 1497600 |
1000-1200 | 88 | 1100 | 320 | 102400 | 9011200 |
Итого | 400 | - | - | - | 23040000 |
На данной странице описан стандартный пример нахождения дисперсии, также Вы можете посмотреть другие задачи на её нахождение
Пример 1. Определение групповой, средней из групповой, межгрупповой и общей дисперсии
Пример 2. Нахождение дисперсии и коэффициента вариации в группировочной таблице
Пример 3. Нахождение дисперсии в дискретном ряду
Пример 4. Имеются следующие данные по группе из 20 студентов заочного отделения. Нужно построить интервальный ряд распределения признака, рассчитать среднее значение признака и изучить его дисперсию
Построим интервальную группировку. Определим размах интервала по формуле:
где X max– максимальное значение группировочного признака;
X min–минимальное значение группировочного признака;
n – количество интервалов:
Принимаем n=5. Шаг равен: h = (192 - 159)/ 5 = 6,6
Составим интервальную группировку
Для дальнейших расчетов построим вспомогательную таблицу:
X"i– середина интервала. (например середина интервала 159 – 165,6 = 162,3)
Среднюю величину роста студентов определим по формуле средней арифметической взвешенной:
Определим дисперсию по формуле:
Формулу можно преобразовать так:
Из этой формулы следует, что дисперсия равна разности средней из квадратов вариантов и квадрата и средней.
Дисперсия в вариационных рядах с равными интервалами по способу моментов может быть рассчитана следующим способом при использовании второго свойства дисперсии (разделив все варианты на величину интервала). Определении дисперсии , вычисленной по способу моментов, по следующей формуле менее трудоемок:
где i - величина интервала;
А - условный ноль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой;
m1 - квадрат момента первого порядка;
m2 - момент второго порядка
Дисперсия альтернативного признака (если в статистической совокупности признак изменяется так, что имеются только два взаимно исключающих друг друга варианта, то такая изменчивость называется альтернативной) может быть вычислена по формуле:
Подставляя в данную формулу дисперсии q =1- р, получаем:
Виды дисперсии
Общая дисперсия измеряет вариацию признака по всей совокупности в целом под влиянием всех факторов, обуславливающих эту вариацию. Она равняется среднему квадрату отклонений отдельных значений признака х от общего среднего значения х и может быть определена как простая дисперсия или взвешенная дисперсия.
Внутригрупповая дисперсия характеризует случайную вариацию, т.е. часть вариации, которая обусловлена влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Такая дисперсия равна среднему квадрату отклонений отдельных значений признака внутри группы X от средней арифметической группы и может быть вычислена как простая дисперсия или как взвешенная дисперсия.
Таким образом, внутригрупповая дисперсия измеряет вариацию признака внутри группы и определяется по формуле:
где хi - групповая средняя;
ni - число единиц в группе.
Например, внутригрупповые дисперсии, которые надо определить в задаче изучения влияния квалификации рабочих на уровень производительности труда в цехе показывают вариации выработки в каждой группе, вызванные всеми возможными факторами (техническое состояние оборудования, обеспеченность инструментами и материалами, возраст рабочих, интенсивность труда и т.д.), кроме отличий в квалификационном разряде (внутри группы все рабочие имеют одну и ту же квалификацию).
Часто в статистике при анализе какого-либо явления или процесса необходимо учитывать не только информацию о средних уровнях исследуемых показателей, но и разброс или вариацию значений отдельных единиц , которая является важной характеристикой изучаемой совокупности.
В наибольшей степени вариации подвержены курсы акций, объемы спроса и предложения, процентные ставки в разные периоды времени и в разных местах.
Основными показателями, характеризующими вариацию , являются размах, дисперсия, среднее квадратическое отклонение и коэффициент вариации.
Размах вариации представляет собой разность максимального и минимального значений признака: R = Xmax – Xmin . Недостатком данного показателя является то, что он оценивает только границы варьирования признака и не отражает его колеблемость внутри этих границ.
Дисперсия лишена этого недостатка. Она рассчитывается как средний квадрат отклонений значений признака от их средней величины:
Упрощенный способ расчета дисперсии осуществляется с помощью следующих формул (простой и взвешенной):
Примеры применения данных формул представлены в задачах 1 и 2.
Широко распространенным на практике показателем является среднее квадратическое отклонение :
Среднее квадратическое отклонение определяется как квадратный корень из дисперсии и имеет ту же размеренность, что и изучаемый признак.
Рассмотренные показатели позволяют получить абсолютное значение вариации, т.е. оценивают ее в единицах измерения исследуемого признака. В отличие от них, коэффициент вариации измеряет колеблемость в относительном выражении - относительно среднего уровня, что во многих случаях является предпочтительнее.
Формула для расчета коэффициента вариации.
Примеры решения задач по теме «Показатели вариации в статистике»
Задача 1 . При изучении влияния рекламы на размер среднемесячного вклада в банках района обследовано 2 банка. Получены следующие результаты:
Определить:
1) для каждого банка: а) средний размер вклада за месяц; б) дисперсию вклада;
2) средний размер вклада за месяц для двух банков вместе;
3) Дисперсию вклада для 2-х банков, зависящую от рекламы;
4) Дисперсию вклада для 2-х банков, зависящую от всех факторов, кроме рекламы;
5) Общую дисперсию используя правило сложения;
6) Коэффициент детерминации;
7) Корреляционное отношение.
Решение
1) Составим расчетную таблицу для банка с рекламой . Для определения среднего размера вклада за месяц найдем середины интервалов. При этом величина открытого интервала (первого) условно приравнивается к величине интервала, примыкающего к нему (второго).
Средний размер вклада найдем по формуле средней арифметической взвешенной:
29 000/50 = 580 руб.
Дисперсию вклада найдем по формуле:
23 400/50 = 468
Аналогичные действия произведем для банка без рекламы :
2) Найдем средний размер вклада для двух банков вместе. Хср =(580×50+542,8×50)/100 = 561,4 руб.
3) Дисперсию вклада, для двух банков, зависящую от рекламы найдем по формуле: σ 2 =pq (формула дисперсии альтернативного признака). Здесь р=0,5 – доля факторов, зависящих от рекламы; q=1-0,5, тогда σ 2 =0,5*0,5=0,25.
4) Поскольку доля остальных факторов равна 0,5, то дисперсия вклада для двух банков, зависящая от всех факторов кроме рекламы тоже 0,25.
5) Определим общую дисперсию, используя правило сложения.
= (468*50+636,16*50)/100=552,08
= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96
σ 2 = σ 2 факт + σ 2 ост = 552,08+345,96 = 898,04
6) Коэффициент детерминации η 2 = σ 2 факт / σ 2 = 345,96/898,04 = 0,39 = 39% - размер вклада на 39% зависит от рекламы.
7) Эмпирическое корреляционное отношение η = √η 2 = √0,39 = 0,62 – связь достаточно тесная.
Задача 2 . Имеется группировка предприятий по величине товарной продукции:
Определить: 1) дисперсию величины товарной продукции; 2) среднее квадратическое отклонение; 3) коэффициент вариации.
Решение
1) По условию представлен интервальный ряд распределения. Его необходимо выразить дискретно, то есть найти середину интервала (х"). В группах закрытых интервалов середину найдем по простой средней арифметической. В группах с верхней границей - как разность между этой верхней границей и половиной размера следующего за ним интервала (200-(400-200):2=100).
В группах с нижней границей – суммой этой нижней границы и половины размера предыдущего интервала (800+(800-600):2=900).
Расчет средней величины товарной продукции делаем по формуле:
Хср = k×((Σ((х"-a):k)×f):Σf)+a. Здесь а=500 - размер варианта при наибольшей частоте, k=600-400=200 - размер интервала при наибольшей частоте. Результат поместим в таблицу:
Итак, средняя величина товарной продукции за изучаемый период в целом равна Хср = (-5:37)×200+500=472,97 тыс. руб.
2) Дисперсию найдем по следующей формуле:
σ 2 = (33/37)*2002-(472,97-500)2 = 35 675,67-730,62 = 34 945,05
3) среднее квадратическое отклонение: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 тыс. руб.
4) коэффициент вариации: V = (σ /Хср)*100 = (186,94 / 472,97)*100 = 39,52%
Виды дисперсий:
Общая дисперсия характеризует вариацию признака всей совокупности под влиянием всех тех факторов, которые обусловили данную вариацию. Эта величина определяется по формуле
где - общая средняя арифметическая всей исследуемой совокупности.
Средняя внутригрупповая дисперсия свидетельствует о случайной вариации, которая может возникнуть под влиянием каких-либо неучтенных факторов и которая не зависит от признака-фактора, положенного в основу группировки. Данная дисперсия рассчитывается следующим образом: сначала рассчитываются дисперсии по отдельным группам (), затем рассчитывается средняя внутригрупповая дисперсия:
где n i - число единиц в группе
Межгрупповая дисперсия (дисперсия групповых средних) характеризует систематическую вариацию, т.е. различия в величине исследуемого признака, возникающие под влиянием признака-фактора, который положен в основу группировки.
где - средняя величина по отдельной группе.
Все три вида дисперсии связаны между собой: общая дисперсия равна сумме средней внутригрупповой дисперсии и межгрупповой дисперсии:
Свойства:
25 Относительные показатели вариации
Коэффициент осцилляции | |
Относительное линейное отклонение | |
Коэффициент вариации |
Коэф. Осц. о тражает относительную колеблемость крайних значений признака вокруг средней. Отн. лин. откл . характеризует долю усредненного значения признака абсолютных отклонений от средней величины. Коэф. Вариации является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин.
В статистике совокупности, имеющие коэффициент вариации больше 30–35 %, принято считать неоднородными.
Закономерность рядов распределения. Моменты распределения. Показатели формы распределения
В вариационных рядах существует связь между частотами и значениями варьирующего признака: с увеличением признака величина частоты сначала возрастает до определённой границы, а потом уменьшается. Такие изменения называются закономерностями распределения.
Форму распределения изучают с помощью показателей асимметрии и эксцесса. При исчислении указанных показателей используют моменты распределения.
Моментом k-го порядка называют среднюю из k-х степеней отклонений вариантов значений признака от некоторой постоянной величины. Порядок момента определяется величиной k. При анализе вариационных рядов ограничиваются расчетом моментов первых четырех порядков. При исчислении моментов в качестве весов могут быть использованы частоты или частости. В зависимости от выбора постоянной величины различают начальные, условные и центральные моменты.
Показатели формы распределения:
Асимметрия (As) показатель характеризующий степень асимметричности распределения.
Следовательно, при (левосторонней) отрицательной асимметрии . При (правосторонней) положительной асимметрии.
Для расчета асимметрии можно использовать центральные моменты. Тогда:
,
где μ 3 – центральный момент третьего порядка.
- эксцесс (Е к ) характеризует крутизну графика функции в сравнении с с нормальным распределением при той же силе вариации:
,
где μ 4 – центральный момент 4-ого порядка.
Закон нормального распределения
Для нормального распределения (распределения Гаусса) функция распределения имеет следующий вид:
Матожидание- стандартное отклонение
Нормальное распределение симметрично и для него характерно следующее соотношение: Хср=Ме=Мо
Эксцесс нормального распределения равен 3, а коэффициент асимметрии 0.
Кривая нормального распределения представляет собой полигон(симметричная колокобразная прямая)
Виды дисперсий. Правило сложения дисперсий. Сущность эмпирического коэффициента детерминации.
Если исходная совокупность разделена на группы по какому-то существенному признаку, то вычисляют следующие виды дисперсий:
Общая дисперсия исходной совокупности:
где - общая средняя величина исходной совокупности;f– частоты исходной совокупности. Общая дисперсия характеризует отклонение индивидуальных значений признака от общей средней величины исходной совокупности.
Внутригрупповые дисперсии:
где j- номер группы;- средняя величина в каждойj-ой группе;- частотыj-ой группы. Внутригрупповые дисперсии характеризуют отклонение индивидуального значения признака в каждой группе от групповой средней величины. Из всех внутригрупповых дисперсий вычисляют среднюю по формуле:, где- численность единиц в каждойj-ой группе.
Межгрупповая дисперсия:
Межгрупповая дисперсия характеризует отклонение групповых средних величин от общей средней величины исходной совокупности.
Правило сложения дисперсий заключается в том, что общая дисперсия исходной совокупности должна быть равна сумме межгрупповой и средней из внутригрупповых дисперсий:
Эмпирический коэффициент детерминации показывает долю вариации изучаемого признака, обусловленную вариацией группировочного признака, и рассчитывается по формуле:
Способ отсчета от условного нуля (способ моментов) для расчета средней величины и дисперсии
Расчет дисперсии способом моментов основан на использовании формулы и 3 и 4 свойств дисперсии.
(3.Если все значения признака (варианты) увеличить (уменьшить) на какое-то постоянное число А, то дисперсия новой совокупности не изменится.
4.Если все значения признака (варианты) увеличить (умножить) в К раз, где К – постоянное число, то дисперсия новой совокупности увеличится (уменьшится) в К 2 раз.)
Получим формулу вычисления дисперсии в вариационных рядах с равными интервалами способом моментов:
А- условный ноль, равный варианте с максимальной частотой (середина интервала с максимальной частотой)
Расчет средней величины способом моментов также основан на использовании свойств средней.
Понятие о выборочном наблюдении. Этапы исследования экономических явлений выборочным методом
Выборочным называют наблюдение, при котором обследованию и изучению подвергаются не все единицы исходной совокупности, а только часть единиц, при этом результат обследования части совокупности распространяется на всю исходную совокупность. Совокупность, из которой производится отбор единиц для дальнейшего обследования и изучения называется генеральной и все показатели, характеризующие эту совокупность, называютсягенеральными .
Возможные пределы отклонений выборочной средней величины от генеральной средней величины называют ошибкой выборки .
Совокупность отобранных единиц называется выборочной и все показатели, характеризующие эту совокупность, называютсявыборочными .
Выборочное исследование включает следующие этапы:
Характеристика объекта исследования (массовые экономические явления). Если генеральная совокупность небольшая, то выборку проводить не рекомендуется, необходимо сплошное исследование;
Расчет объема выборки. Важно определить оптимальный объем, который позволит при наименьших затратах получить ошибку выборки в пределах допустимой;
Проведение отбора единиц наблюдения с учетом требований случайности, пропорциональности.
Доказательство репрезентативности, основанное на оценке ошибки выборки. Для случайной выборки ошибка рассчитывается с использованием формул. Для целевой выборки репрезентативность оценивается с помощью качественных методов (сравнения, эксперимента);
Анализ выборочной совокупности. Если сформированная выборка отвечает требованиям репрезентативности, то проводится ее анализ с использованием аналитических показателей (средних, относительных и проч.)