Вариация — это различия индивидуальных значений признака у единиц изучаемой совокупности. Исследование вариации имеет большое практическое значение и является необходимым звеном в экономическом анализе. Необходимость изучения вариации связана с тем, что средняя, являясь равнодействующей, выполняет свою основную задачу с разной степенью точности: чем меньше различия индивидуальных значений признака, подлежащих осреднению, тем однороднее совокупность, а, следовательно, точнее и надежнее средняя, и наоборот. Следовательно по степени вариации можно судить о границах вариации признака, однородности совокупности по данному признаку, типичности средней, взаимосвязи факторов, определяющих вариацию.

Изменение вариации признака в совокупности осуществляется с помощью абсолютных и относительных показателей.

Абсолютные показатели вариации включают:

Размах вариации (R)

Размах вариации — это разность между максимальным и минимальным значениями признака

Он показывает пределы, в которых изменяется величина признака в изучаемой .

Пример . Опыт работы у пяти претендентов на предшествующей работе составляет: 2,3,4,7 и 9 лет.
Решение: размах вариации = 9 — 2 = 7 лет.

Для обобщенной характеристики различий в значениях признака вычисляют средние показатели вариации, основанные на учете отклонений от средней арифметической. За отклонение от средней принимается разность .

При этом во избежании превращения в нуль суммы отклонений вариантов признака от средней (нулевое свойство средней) приходится либо не учитывать знаки отклонения, то есть брать эту сумму по модулю , либо возводить значения отклонений в квадрат

Среднее линейное и квадратическое отклонение

Среднее линейное отклонение — это из абсолютных отклонений отдельных значений признака от средней.

Среднее линейное отклонение простое:

Опыт работы у пяти претендентов на предшествующей работе составляет: 2,3,4,7 и 9 лет.

В нашем примере: лет;

Ответ: 2,4 года.

Среднее линейное отклонение взвешенное применяется для сгруппированных данных:

Среднее линейное отклонение в силу его условности применяется на практике сравнительно редко (в частности, для характеристики выполнения договорных обязательств по равномерности поставки; в анализе качества продукции с учетом технологических особенностей производства).

Среднее квадратическое отклонение

Наиболее совершенной характеристикой вариации является среднее квадратическое откложение, которое называют стандартом (или стандартным отклонение). () равно квадратному корню из среднего квадрата отклонений отдельных значений признака от :

Среднее квадратическое отклонение простое:

Среднее квадратическое отклонение взвешенное применяется для сгруппированных данных:

Между средним квадратическим и средним линейным отклонениями в условиях нормального распределения имеет место следующее соотношение: ~ 1,25.

Среднее квадратическое отклонение, являясь основной абсолютной мерой вариации, используется при определении значений ординат кривой нормального распределения, в расчетах, связанных с организацией выборочного наблюдения и установлением точности выборочных характеристик, а также при оценке границ вариации признака в однородной совокупности.

Дисперсия

Дисперсия - представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины.

Дисперсия простая:

В нашем примере:

Дисперсия взвешенная:

Более удобно вычислять дисперсию по формуле:

которая получается из основной путем несложных преобразований. В этом случае средний квадрат отклонений равен средней из квадратов значений признака минус квадрат средней.

Для несгрупиированных данных:

Для сгруппированных данных:

Вариация альтернативного признака заключается в наличии или отсутствии изучаемого свойства у единиц совокупности. Количественно вариация альтернативного признака выражается двумя значениями: наличие у единицы изучаемого свойства обозначается единицей (1), а его отсутствие — нулем (0). Долю единиц, обладающих изучаемым признаком, обозначают буквой , а долю единиц, не обладающих этим признаком — через . Учитывая, что p + q = 1 (отсюда q = 1 — p), а среднее значение альтернативного признака равно

,

средний квадрат отклонений

Таким образом, дисперсия альтернативного признака равна произведению доли единиц, обладающих данным свойством (), на долю единиц, данным свойством не обладающих ().

Максимальное значение средний квадрат отклонения (дисперсия) принимает в случае равенства долей, т.е. когда т.е. . Нижняя граница этого показателя равна нулю, что соответствует ситуации, при которой в совокупности отсутствует вариация. Среднее квадратическое отклонение альтернативного признака:

Так, если в изготовленной партии 3% изделий оказались нестандартными, то дисперсия доли нестандартных изделий , а среднее квадратическое отклонение или 17,1%.

Среднее квадратическое отклонение равно квадратному корню из среднего квадрата отклонений отдельных значений признака от средней арифметической.

Относительные показатели вариации

Относительные показатели вариации включают:

Сравнение вариации нескольких совокупностей по одному и тому же признаку, а тем более по различным признакам с помощью абсолютных показателей не представляется возможным. В этих случаях для сравнительной оценки степени различия строят относительные показатели вариации. Они вычисляются как отношения абсолютных показателей вариации к средней:

Рассчитываются и другие относительные характеристики. Например, для оценки вариации в случае асимметрического распределения вычисляют отношение среднего линейного отклонения к медиан

так как благодаря свойству медианы сумма абсолютных отклонений признака от ее величины всегда меньше, чем от любой другой.

В качестве относительной меры рассеивания, оценивающей вариацию центральной части совокупности, вычисляют относительное квартильное отклонение , где — средний квартиль полусуммы разности третьего (или верхнего) квартиля () и первого (или нижнего) квартиля ().

На практике чаще всего вычисляют коэффициент вариации. Нижней границей этого показателя является нуль, верхнего предела он не имеет, однако известно, что с увеличением вариации признака увеличивается и его значение. Коэффициент вариации является в известном смысле критерием однородности совокупности (в случае нормального распределения).

Рассчитаем коэффициент вариации на основе среднего квадратического отклонения для следующего примера. Расход сырья на единицу продукции составил (кг): по одной технологии при , а по другой — при. Непосредственное сравнение величины средних квадратических отклонений могло бы привести к неверному представлению о том, что вариация расхода сырья по первой технологии интенсивнее, чем по второй (. Относительная мера вариации ( позволяет сделать противоположный вывод

Пример расчета показателей вариации

На этапе отбора кандидатов для участия в осуществлении сложного проекта фирма объявлила конкурс профессионалов. Распределение претендентов по опыту работы показало средующие результаты:

Вычислим средний производственный опыт работы, лет

Рассчитаем дисперсию по продолжительности опыта работы

Такой же результат получается, если использовать для расчета другую формулу расчета дисперсии

Вычислим среднее квадратическое отклонение, лет:

Определим коэффициент вариации, %:

Правило сложения дисперсий

Для оценки влияния факторов, определяющих вариацию, используют прием группировки: совокупность разбивают на группы, выбрав в качестве группировочного признака один из определяющих факторов. Тогда наряду с общей дисперсией, рассчитанной по всей совокупности, вычисляют внутигрупповую дисперсию (или среднюю из групповых) и межгрупповую дисперсию (или дисперсию групповых средних).

Общая дисперсия характеризует вариацию признака во всей совокупности, сложившуюся под влиянием всех факторов и условий.

Межгрупповая дисперсия измеряет систематическую вариацию, обусловленную влиянием фактора, по которому произведена группировка:

Внутригрупповая дисперсия оценивает вариацию признака, сложившуюся по влиянием других, неучитываемых в данном исследовании факторов и независящую от фактора группировки. Она определяется как средняя из групповых дисперсий.

Все три дисперсии () связаны между собой следующим равенством, которое известно как правило сложения дисперсий:

на этом соотношении строятся показатели, оценивающие влияние признака группировки на образование общей вариации. К ним относятся эмпирический коэффициент детерминации () и эмпирическое корреляционное отношение ()

() характеризует долю межгрупоовой дисперсии в общей дисперсии:

и показывает насколько вариация признака в совокупности обусловлена фактором группировки.

Эмпирическое корреляционное отношение (!!\eta = \sqrt{ \frac{\delta^2}{\sigma^2} }

оценивает тесноту связи между изучаемым и группировочным признаками. Предельными значениями являются нуль и единица. Чем ближе к единице, тем теснее связь.

Пример. Стоимость 1 кв.м общей площади (усл.ед) на рынке жилья по десяти 17-м домам улучшенной планировки составляла:

При этом известно, что первые пять домов были построены вблизи делового центра, а остальные — на значительном расстоянии от него.

Для рассчета общей дисперсии вычислим среднюю стоимость 1 кв.м. общей площади: Общую дисперсию определим по формуле:

Вычислим среднюю стоимость 1 кв.м. и дисперсию по этому показателю для каждой группы домов, отличающихся месторасположением относительно центра города:

а) для домов, построенных вблизи центра:

б) для домов, построенных далеко от центра:

Вариация стоимости 1 кв.м. общей площади, вызванная изменением местоположения домов, определяется величиной межгрупповой дисперсии :

Вариация стоимости 1 кв.м. общей площади, обусловленная изменением остальных неучитываемых нами показателей, измеряется величиной внутригрупповой дисперсии

Найденные дисперссии в сумме дают величину общей дисперсии

Эмпирический коэффициент детерминации :

показывает, что дисперсия стоимости 1.кв.м. общей площади на рынке жилья на 81,8% объясняется различиями в расположении новостроек по отношению к деловому центру и на 18,2% — другими факторами.

Эмприческое корреляционное отношение свидетельствует о существенном влиянии на стоимость жилья месторасположения домов.

Правило сложения дисперсий для доли признака записывается так:

а три вида дисперсий доли для сгруппированных данных определяется по следующим формулам:

общая дисперсия:

Формулы межгрупповой и внутригрупповой дисперсий:

Характеристики формы распределения

Для получения представления о форме распределения используются показатели среднего уровня ( , ), показатели вариации, ассиметрии и эксцесса.

В симметричных распределениях средняя арифметическая, мода и медиана совпадают (. Если это равенство нарушается — распределение ассиметрично.

Простейшим показателем ассиметрии является разность , которая в случае правосторонней ассиметрии положительна, а при левосторонней — отрицательна.

Ассиметричное распределение

Для сравнения ассиметрии нескольких рядов вычисляется относительный показатель

В качестве обобщающих характеристик вариации используются центральные моменты распределения -го порядка , соответствующие степени, в которую возводятся отклонения отдельных значений признака от средней арифметической:

Для несгруппированных данных:

Для сгруппированных данных:

Момент первого порядка согласно свойству средней арифметической равен нулю .

Момент второго порядка является дисперсией .

Моменты третьего и четвертого порядков используются для построения показателей, оценивающих особенности формы эмпирических распределений.

С помощью момента третьего порядка измеряют степень скошенности или ассиметричности распределения.

— коэффициент ассиметрии

В симметричных распределениях , как все центральные моменты нечетного порядка.Неравенство нулю центрального момента третьего порядка указывает на асимметричность распределения. При этом, если , то асимметрия правосторонняя и относительно максимальной ординаты вытянута правая ветвь; если , то асимметрия левосторонняя (на графике это соответствует вытянутости левой ветви).

Для характеристики островершинности или плосковершинности распределения вычисляют отношение момента четвертого порядка () к среднеквадратическому отклонению в четвертой степени (). Для нормального распределения , поэтому эксцесс находят по формуле:

Для нормального распределения обращается в нуль. Для островершинных распределений , для плосковершинных .

Эксцесс распределения

Кроме показателей, рассмотренных выше, обобщающей характеристикой вариации в однородной совокупности служит определенный порядок в изменении частот распределения в соответствии с изменениями величины изучаемого признака, называемый закономерностью распределения .

Характер (тип) закономерности распределения может быть выявлен путем построения вариационного ряда на основании большого объема наблюдений, а также такого выбора числа групп и величины интегралов, при котором наиболее отчетливо могла бы проявиться закономерность.

Анализ вариационных рядов предполагает выявление характера распределения (как результата действия механизма вариации), установление функции распределения, проверку соответствия эмпирического распределения теоретическому.

Эмпирическое распределение , полученное на основе данных наблюдения, графически изображается эмпирической кривой распределения с помощью полигона.

На практике встречаются различные типы распределений, среди которых можно выделить симметричные и асимметричные, одновершинные и многовершинные.

Установить тип распределения, означает выразить механизм формирования закономерности в аналитической форме. Многим явлениям и их признакам свойственны характерные формы распределения, которые аппроксимируются соответствующими кривыми. При всем многообразии форм распределения наибольшее распространение в качестве теоретических получили нормальное распределение, распределение Пауссона, биноминальное распределение и др.

Особое место в изучении вариации принадлежит нормальному закону, благодаря его математическим свойствам. Для нормального закона выполняется правило трех сигм, по которому вариация индивидуальных значений признака находится в пределах от величины средней. При этом в границах находится около 70% всех единиц, а в пределах — 95%.

Оценка соответствия эмпирического и теоретического распределений производится с помощью критериев согласия, среди которых широко известны критерии Пирсона, Романовского, Ястремского, Колмогорова.

Подст-в в формулу дисперсии q = 1 - р, получим

Среднее квад-ое отклонение альтерн-ого признака

Коэффициент вариации представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:: V= σ / X‾ *100

Общая дисперсия σ 2 измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдель­ных значений признака х от общей средней х и может быть вычислена как простая дисперсия

Межгрупповая дисперсия δ 2 характеризует систематиче­скую вариацию результативного признака, обусловленную влия­нием признака-фактора, положенного в основание группиров­ки. Она равна среднему квадрату отклонений групповых (част­ных) средних X‾iот общей средней X‾:

Внутригрупповая (частная) дисперсия σ 2 i отражает случай­ную вариацию, т.е. часть вариации, обусловленную влиянием не­учтенных факторов и не зависящую от признака-фактора, поло­женного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы х от средней арифметической этой группы х) (групповой средней) и может быть исчислена как простая дисперсия или как взвешенная дисперсия по формулам, соответственно:

На основании внутригрупповой дисперсии по каждой груп­пе, т.е. на основании σ 2 i можно определить общую среднюю извнутригрупповых дисперсий:

Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:

Внутригрупповые дисперсии показывают вариации выработ­ки в каждой группе, вызванные всеми возможными фактора­ми (техническое состояние оборудования, обеспеченность ин­струментами и материалами, возраст рабочих, интенсивность труда и т.д.) , кроме различий в квалификационном разряд. Средняя из внутригрупповых дисперсий отражает вариацию выработки, обусловленную всеми факторами, кроме квалифика­ции рабочих, но в среднем по всей совокупности. Межгрупповая дисперсия характеризует вариацию групповых средних, обусловленную различиями групп рабочих по квали­фикационному разряду. Общая дисперсия отражает суммарное влияние всех возмож­ных факторов на общую вариацию среднечасовой выработки изделий всеми рабочими цеха.

Поэтому в статистическом анализе широко используется эм­пирический коэффициент детерминации (ή 2) - показатель, пред­ставляющий собой долю межгрупповой дисперсии в общей дис­персии результативного признака и характеризующий силу влия­ния группировочного признака на образование общей вариации:

ή 2 =δ 2 / σ 2 Эмпирический коэффициент детерминации показывает долю вариации результативного признака у под влиянием факторного признака х (остальная часть общей вариации у обуславливается вариацией прочих факторов). При отсутствии связи эмпирический коэф равен 0, а при функциональной связи – единице.Эмпирическое корреляционное отношение - это корень квад­ратный из эмпирического коэффициента детерминации: v

ή=√ δ 2 / σ 2 оно показывает тесноту связи между группировочным и ре­зультативным признаками.

Эмпирическое корреляционное отношение ή , как и ή 2 , может принимать значения от 0 до 1. Если связь отсутствует, то корреляционное отношение равно нулю, т.е. все групповые средние будут равны между собой, межгрупповой вариации не будет. Значит, группировочный при­знак никак не влияет на образование общей вариации. Если связь функциональная, то корреляционное отношение будет равно единице. В этом случае дисперсия групповых средних равна общей дисперсии, т.е. внутригрупповой вариации не будет. Это означает, что группировочный признак целиком оп­ределяет вариацию изучаемого результативного признака.

Чем значение корреляционного отношения ближе к еди­нице, тем теснее, ближе к функциональной зависимости связь между признаками.

Ряды динамики

Одной из важнейших задач статистики является изучение изменений анализируемых показателей во времени, то есть их динамика . Эта задача решается при помощи анализа рядов динамики (временных рядов).

Ряд динамики (или временной ряд) – это числовые значения определенного статистического показателя в последовательные моменты или периоды времени (т.е. расположенные в хронологическом порядке).

Числовые значения того или иного статистического показателя, составляющего ряд динамики, называют уровнями ряда и обычно обозначают буквой y . Первый член ряда y 1 называют начальным или базисным уровнем , а последний y n конечным . Моменты или периоды времени, к которым относятся уровни, обозначают через t .

Ряды динамики, как правило, представляют в виде таблицы или графика, причем по оси абсцисс строится шкала времени t , а по оси ординат – шкала уровней ряда y .

Понятие вариации

Средняя дает обобщающую характеристику всей совокупности изучаемого явления.

Вариацией признака называется различие индивидуальных значений признака внутри изучаемой совокупности.

Средняя величина является абстрактной, обобщающей характеристикой признака изучаемой совокупности, но она не показывает строение совокупности.

Средняя величина не дает представления о том, как отдельные значения изучаемого признака группируются вокруг средней, сосредоточены ли они вблизи или значительно отклоняются от неё.

Если отдельные значения признака близки к средней арифметической, то в этом случае средняя хорошо представляет всю совокупность. И наоборот.

Колеблемость отдельных значений характеризуют показатели вариации.

Термин «вариация» произошел от латинского variatio – изменение, колеблемость, различие. Однако не всякие различия принято называть вариацией.

Под вариацией в статистике понимают такие количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов. Различают вариацию признака в абсолютных и относительных величинах. Абсолютная – R, L, σ, σ 2 .

Показатели вариации

1 совокупность 2 совокупность
n=5 80, 100, 120, 200, 300 n=8 145, 150, 155, 160, 160, 162, 168, 180

80 100 120 x 200 300

Поэтому в этом случае возникает необходимость определить вариацию признака, т.е. соотношение отдельных значений ряда относительно друг друга.

Показатели вариации

1. Размах вариации, представляет собой разность между максимальным и минимальным значением признака.

R = X max - X min

R 1 = 300-80=220 R 2 =180-145=35

Практика: для однородной совокупности, для контроля качества продукции.

2. Показатели, учитывающие отклонения всех вариантов от средней арифметической.

а) Среднее линейное отклонение

б) Среднее квадратическое отклонение

Среднее линейное отклонение представляет собой среднее арифметическое из абсолютных значений отклонений отдельных вариантов от средней.

для не сгруппированных:

;

для сгруппированных:

Практика: с его помощью анализируется:

1. Состав работающих

2. Ритмичность производства

3. Равномерность поставок материалов

Недостаток: этот показатель усложняет расчеты вероятного типа, затрудняет применение методов математической статистики

Среднее квадратическое отклонение (стандартное) – это

для не сгруппированных данных

для сгруппированных данных

Для умеренно асимметричных распределений

Среднее квадратическое отклонение, как и среднее линейное отклонение – это абсолютный показатель, выражается в тех же единицах, что и среднее арифметическое.

Показатели среднего квадратического или среднего линейного отклонений для двух совокупностей оказываются несопоставимыми, если сами признака у этих совокупностей неодинаковы. Несопоставляются эти показатели и для разных признаков одной совокупности. Т.е. когда средние в обеих совокупностях выражены в одних и тех же единицах измерения и одинаковы, сопоставление возможно и отразит различия в вариации признака.

Среднее квадратическое отклонение является мерилом надежности средней. Чем меньше σ, тем лучше среднее арифметическое отражает собой всю представляемую совокупность.

3. Дисперсия используется для измерения колеблемости признака. Этот показатель более объективно отражает меру вариации

для не сгруппированных

для сгруппированных

Отличительной особенностью данного показатели является то, что при возведении в квадрат удельный вес малых отклонений падает, а больших увеличивается в общей сумме отклонений.

Это тоже абсолютный показатель

Дисперсия обладает рядом свойств, некоторые из них позволяют упростить её вычисление:

1. Дисперсия постоянной величины равна 0

2. Если все варианты значений признака (x) ↓ на одно и то же число, то дисперсия не уменьшается

3. Если все варианты ↓ в одно и то же число раз (K раз), то дисперсия ↓ в К 2 раз

x f x "

x в 100 раз

Дисперсия σ равна 0,909*10000=9090

Выше был рассмотрен расчет показателей вариации для количественных признаков, но может ставиться задача оценки вариации качественных признаков . Например, при изучении качества изготовленной продукции можно разделить на годную и бракованную.

В таком случае речь идет об альтернативных признаках.

Дисперсия альтернативного признака

Альтернативными признаками называются такие, которыми одни единицы совокупности обладают, а другие нет. Например, наличие производственного стажа у абитуриентов, ученая степень у преподавателей ВУЗов и т.д. Наличие признака у единиц совокупности условно обозначаем через 1, а отсутствие – 0. х 1 =1, х 2 =0. Долю единиц, обладающих признаком (в общей совокупности) обозначаем через р, а долю единиц, не обладающих – через q. Т.е. p+q=1, q=1-p.

Рассчитаем среднее значение альтернативного признака

; ;

Т.е. среднее значение альтернативного признака равно доли единиц, обладающих данными признаками, на долю единиц, не обладающих данными признаками.

Среднее квадратическое отклонение равно Б p =

Проверяется качество: 1000 готовых изделий, 20 бракованных.

Находим долю брака: (20/1000)*100%=0,02%

Дисперсия обладает рядом свойств , которые позволяют упростить расчет.

1. Если из всех значений вариант отнять какое-то постоянное число А, то среднее квадратическое отклонение от этого не изменится.

Основоположником развития теории средних величин является Адольф Кетле, который считал их важнейшими статистическими показателями. Он первым четко сформулировал тот факт, что на массовые явления (статистические совокупности) влияет два вида причин:

- общие для каждой единицы совокупности, эти причины формируют тип явления и связаны с его сущностью;

- индивидуальные, специфические для каждой единицы совокупности, не связанные с типом явления, то есть случайные для него.

При расчете средней величины в совокупности влияние случайных причин взаимопогашается, и средняя величина, абстрагируясь от индивидуальных особенностей отдельных единиц совокупности, выражает общие свойства, присущие всей совокупности. Кетле считал среднюю величину не просто статистическим показателем, имеющим определенный способ расчета, а категорией объективной реальности.

В настоящее время средняя величина признается также центральным показателем, характеризующим совокупность. И определяют ее как обобщающий показатель, характеризующий типический уровень варьирующего признака. Он выражает величину признака, отнесенную к единице совокупности.

Средняя всегда обобщает количественную вариацию признака, т.е. в средних величинах погашаются индивидуальные различия единиц совокупности, обусловленные случайными обстоятельствами. В отличие от средней абсолютная величина, характеризующая уровень признака отдельной единицы совокупности, не позволяет сравнивать значения признака у единиц, относящихся к разным совокупностям. Так, если нужно сопоставить уровни оплаты труда работников на двух предприятиях, то нельзя сравнивать по данному признаку двух работников разных предприятий. Оплата труда выбранных для сравнения работников может быть не типичной для этих предприятий. Если же сравнивать размеры фондов оплаты труда на рассматриваемых предприятиях, то не учитывается численность работающих и, следовательно, нельзя определить, где уровень оплаты труда выше. В конечном итоге сравнить можно лишь средние показатели, т.е. сколько в среднем получает один работник на каждом предприятии. Таким образом, возникает необходимость расчета средней величины как обобщающей характеристики совокупности .

Вычисление среднего – один из распространенных приемов обобщения; средний показатель выделяет то общее, что характерно (типично) для всех единиц изучаемой совокупности, в то же время он игнорирует различия отдельных единиц. В каждом явлении и его развитии имеет место сочетание случайности и необходимости. При исчислении средних в силу действия закона больших чисел случайности взаимопогашаются, уравновешиваются, поэтому можно абстрагироваться от несущественных особенностей явления, от количественных значений признака в каждом конкретном случае.



Таким образом, в способности абстрагироваться от случайности отдельных значений, колебаний и заключена научная ценность средних как обобщающих характеристик совокупностей. Следует отметить, что средняя величина будет объективной характеристикой, если она вычислена по качественно однородной совокупности.

Рассмотрим теперь виды средних величин, особенности их исчисления и области применения . Средние величины делятся на два больших класса: степенные средние и структурные средние.

К степенным средним относятся такие наиболее известные и часто применяемые виды, как средняя геометрическая, средняя арифметическая и средняя квадратическая.

В качествеструктурных средних рассматриваются мода и медиана.

Выбор конкретного вида средней величины зависит от цели исследования и логической сущности усредняемого признака.

Степенные средние в зависимости от представления исходных данных могут быть простыми ивзвешенными .

Простая средняя считается по несгруппированным данным и имеет следующий общий вид:

где X – варианта (значение) осредняемого признака;
m – показатель степени средней;
n – число вариант.

В зависимости от степени m получают различные виды средних величин.

Если же данные сгруппированы, то используется формулы средних взвешенных , где весами выступают частоты f (повторяемость варианты).

Взвешенная средня я считается по сгруппированным данным и имеет общий вид

где X – варианта (значение) усредняемого признака или серединноезначение интервала, в котором измеряется варианта;
m – показатель степени средней;
f – частота, показывающая, сколько раз встречается каждое значение усредняемого признака.



Таблица 7. Виды степенных средних

Вид степенной средней Показатель степени (m) Формула расчета
Простая Взвешенная
Гармоническая -1
Геометрическая
Арифметическая
Квадратическая
Кубическая

Формулы средневзвешенные могут использоваться для расчета общей по совокупности средней на основе групповых средних.

Таблица 8. Оплата труда по бригадам

Таблица 9. Оплата труда по бригадам

В обеих задачах определяющей функцией является ФЗП.

Прежде, чем выбрать формулу для расчетов средней величины,нужно словами записать логическую сущность усредняемого признака.

Средняя заработная плата = Фонд заработной платы / численность работников

Средняя урожайность = Валовой сбор / Посевная площадь

Средняя производительность труда = Объем продукции / Численность (Время)

Правило: Если в представленной информации есть данные о числителе логической формулы, то есть об определяющей функции, то для расчета средней величины используется средняя гармоническая. Если представлены данные о знаменателе логической формулы, то для расчета средней величины используется средняя арифметическая.

Пример . В течение 8-часового рабочего дня пять рабочих производили одинаковые детали. Их затраты времени на одну деталь, мин.: 20, 16, 20, 15, 24. Определить средние затраты времени на одну деталь.

Средние затраты времени на одну деталь определяются путем деления суммарного времени на число деталей.

480 +480+480+480+480

480:20+480:16+480:20+480:15+480:24

(2400:130=18,46 мин.)

Это - правильный расчет, а неправильно, если сложить все затраты времени на одну деталь и разделить на пять (19 мин.). При таком расчете искажается объем производства деталей (2400:19=126, а не 130, как фактически).

1. Средняя арифметическая постоянной величины равна этой постоянной:

2. Алгебраическая сумма линейных отклонений варианты от средней арифметической равна 0 (нулевое свойство):

для несгруппированных данных,

для сгруппированных данных;

3. Сумма квадратов отклонений варианты от средней арифметической есть число минимальное:

– min (для несгруппированных данных),

– min (для сгруппированных данных);

Эти три свойства определяют сущность средней арифметической. Следующие свойства – расчетные .

4. Если каждую варианту Х уменьшить или увеличить на определенное число, то средняя величина уменьшается или увеличивается на это число.

5. Если каждую варианту Х уменьшить или увеличить в одно и то же число раз, то средняя величина уменьшается или увеличивается в это число раз.

6. Если каждую частоту f уменьшить или увеличить в одно и то же число раз, то средняя величина не изменится.

Доля каждой варианты (d) определяется путем деления каждой частоты на сумму всех частот.

Таким образом средняя величина зависит от варианты Х и от структуры совокупности, которая характеризуется долями d.

7. Средняя суммы равна сумме средних:

Ряд распределения имеет 3 центра:

1) средняя арифметическая;

3) медиана.

Рассчитаем среднюю арифметическую для дискретного ряда распределения, представленного в таблице 1:

При расчете средней величины по интервальному ряду распределения в качестве варианты Х берется середина интервала. Если интервал открытый, то при расчете средней величины его условно закрывают, принимая равным соседнему закрытому интервалу.

Рассчитаем среднюю величину основных средств по таблице 3:

Млрд.руб.

В таблице 5 была рассчитана эта же величина, и она получилась равной 3,3 млрд. руб. (Объяснить различия)

Мода – наиболее часто встречающаяся варианта.

Определим моду тарифного разряда по таблице 1:

Для интервальных рядов распределения сначала находится модальный интервал, то есть интервал с наибольшей частотой внутри этого интервала, затем мода находится по формуле:

Нижняя граница модального интервала;

i - величина модального интервала;

Частота модального интервала;

Частота интервала предшествующего модальному интервалу;

Частота интервала следующего за модальным интервалом.

млрд. руб.

Медиана - варианта, стоящая в середине ряда распределения.

Номер медианы:

№ Ме= - если число единиц в совокупности четное;

№ Ме= - если число единиц в совокупности нечетное.

Найдем медиану тарифного разряда по таблице 1:

Следовательно, половина рабочих цеха имеет разряд не выше 3-го.

Прежде чем найти медиану для интервального ряда распределения, ищут интервал, в который входит срединная варианта, затем внутри этого интервала определяют медиану по формуле:

,

где - нижняя граница медианного интервала;

i- величина медианного интервала;

n- число единиц совокупности;

Накопленная частота интервала предшествующего медианному;

Частота медианного интервала

Найдем медиану основных средств по таблице 3:

млрд.руб.,

То есть половина предприятий имеет основные средства не выше, чем 3,45 млрд. руб.

Ряды распределения, имеющие одинаковую среднюю величину, могут существенно отличаться по степени колеблемости изучаемого признака. (Пример. Средний возраст студентов в группе и бабушки с детьми).

Для характеристики совокупности, особенно, в том случае, если значение признака существенно колеблется, дополнительно к расчету средней величины определяют ряд показателей вариации.

Для измерения вариации используют абсолютные и относительные показатели.

1. Размах вариации: R = X max – X min – диапазон изменения признака.

2. Среднее линейное отклонение – показывает среднее отклонение варианты от средней величины:

Для несгруппированных данных;

3. Среднее квадратическое отклонение - показывает среднее отклонение вариант от средней величины:

- для не сгруппированных данных;

- для сгруппированных данных;

Все 3 показателя имеют те же единицы измерения, что и признак.

4. Дисперсия – квадрат среднего квадратического отклонения:

или

Не имеет единиц измерения.

Свойства дисперсии :

1) D(const)=0, то есть дисперсия постоянной величины равна 0.

2) Если каждую варианту Х уменьшить или увеличить на одно и то же число раз, то дисперсия не изменится;

3) Если каждую варианту Х уменьшить или увеличить в одно и то же число раз i, то дисперсия уменьшится или увеличится в i 2 раз.

Способы расчета дисперсии:

1) исходя из определения:

2) исходя из средней из квадратов вариант:

; ;

Эта формула получена преобразованием основной формулы.

3) по способу моментов:

Первый условный момент;

Второй условный момент;

;

Рассчитаем дисперсию тарифного разряда по данным таблицы 1 двумя способами:

2) =13,75-3,53=1,29

Показатели относительного рассеивания (вариации) .

Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер вариации в различных распределениях (колеблемость одного и того же признака в двух совокупностях или колеблемость различных признаков в одной совокупности). Расчет показателей меры относительного рассеивания осуществляют как отношение абсолютного показателя рассеивания к средней арифметической.

1.Коэффициент осцилляции показывает относительную колеблемость крайних значений признака относительно средней.

2. Относительное линейное отклонение характеризует относительное усредненное значение абсолютных отклонений от средней величины.

3. Коэффициент вариации является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин.


В статистике совокупности, имеющие коэффициент вариации больше 30–35 %, принято считать неоднородными.

Для более глубокого анализа колеблемости признаков также используют показатели дифференциации.

1. По несгруппированным первичным данным можно рассчитать коэффициент фондовой дифференциации :

,

где - средняя величина, рассчитанная для 10% самых больших значений признака.

Средняя величина, рассчитанная для 10% самых маленьких значений признака.

2. Если данные сгруппированы, то рассчитывают коэффициент децильной дифференциации :

Где и - соответственно 1 и 9 децили.

Дециль - значение признака, которому в ряду распределения соответствует 10-я доля совокупности, то есть децили делят совокупность на 10 равных частей..

Процедура нахождения децилей аналогична процедуре нахождения медианы для интервального ряда распределения:

1) определяют № децили: для 1-й децили: № = ;

для 9-й децили: № = ;

2) находят интервалы, в которые входят эти децили и внутри этих интервалов находят децили по формулам:

; ,

где и - соответственно нижние границы интервалов, в которые входят 1 и 9 децили;

i - величины интервалов, в которые входят 1 и 9 децили;

И - соответственно частоты интервалов, в которые входят 1 и 9 децили;

Накопленная частота интервала, предшествующая децильному (в первой формуле для 1-й децили, во второй формуле для 2-й децили).

Таблица 10. Распределение населения района

По среднедушевому доходу

Месячный среднедушевой доход, тыс.руб Численность Накопленные частоты
тыс.чел. в % к итогу
20-40 - 40-60 60-100 100-150 150-200 - 200-300 300-500 500 и выше 9,2 25,2 32,9 30,0 27,4 15,5 4,9 3,1 6,2 17,0 22,2 20,2 18,5 10,5 3,3 2,1 9,2 () 34,4 () 67,3 97,3 124,7 () 140,2 () 145,1 148,2
Итого 148,2 -

Альтернативный признак – это признак, которым обладает часть единиц и не обладает другая часть единиц совокупности.

Дисперсия равна произведению доли (р ) на дополняющее эту долю до единицы число (q ):

где p – доля единиц, обладающих признаком;

q – доля единиц, не обладающих признаком.

Предельное значение дисперсии альтернативного признака равно 0,25 при р = 0,5.

Пример 6.1 . Из 200 студентов факультета - 60 чел. – неуспевающие.

Доля неуспевающих студентов равна p = 60 / 200 = 0,3

Доля успевающих студентов равна q = 1 – 0,3 = 0,7

Дисперсия доли равна = 0,3 · 0,7 = 0,21

Пример 6.2 . Расчет по несгруппированным данным. Имеются данные о стаже 10 работников - 1, 2, 3, 3, 4, 4, 5, 7, 9, 12. Рассчитать показатели вариации.

Составим рабочую таблицу для расчёта.

Номер работник Стаж, лет (х i ) x 2
-4
-3
-2
-2
-1
-1
Итого

Средний стаж равен лет.

Размах вариации R =12–1= 11 лет.

Далее рассчитываем отклонения от средней , и

Среднее линейное отклонение лет.

Дисперсия

Средняя из квадратов

Второй способ расчёта дисперсии = 35,4 – 5 2 = 10,4

года

Коэффициент вариации V = 3,22 / 5 = 0,645 или 64,5%

V d = 2,6 / 5 = 0,520 или 52,0%.

Пример 6.3 . Расчёт по интервальному вариационному ряду.

Имеются данные о распределении рабочих по зарплате

Решение: Составим рабочую таблицу для расчёта.

Зарплата f Середина интервала (х ) x i ·f i
до 10 -21
10–20 -11
20–30 -1
30–40
40 и более
Итого

Средняя зарплата тыс.руб.

Среднее линейное отклонение тыс.руб.

Дисперсия

Среднее квадратическое отклонение тыс.руб.

Коэффициент вариации V = 12,45 / 26 = 0,479 или 47,9%

Линейный коэффициент вариации: V d = 10,36 / 26 = 0,398 или 39,8%.

Виды дисперсий

Общая дисперсия s 2 измеряет вариацию результативного признака (y ) во всей совокупности под влиянием всех факторов (x 1 , x 2 , x 3 …) обусловивших эту вариацию.

Межгрупповая дисперсия характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возникающие под влиянием признака-фактора (x ), положенного в основание группировки. Она рассчитывается по формуле

,

где `y i и n i - соответственно групповые средние и численности по отдельным группам.

Внутригрупповая дисперсия () отражает случайную вариацию, т. е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она исчисляется следующим образом:

Средняя из внутригрупповых дисперсий ():

Существует закон, связывающий три вида дисперсии. Общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсией:

В статистическом анализе широко используется показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии. Он носит название эмпирического коэффициента детерминации ():

.

Этот коэффициент показывает долю (удельный вес) общей вариации изучаемого признака обусловленную вариацией группировочного признака.

Корень квадратный из эмпирического коэффициента детерминации носит название эмпирического корреляционного отношения (h ):

.

Оно характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака. Эмпирическое корреляционное отношение изменяется в пределах от 0 до 1. Если h = 0, то группировочный признак не оказывает влияние на результативный. Если h = 1, то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих факторных признаков равно нулю. Промежуточные значения оцениваются в зависимости от их близости к предельным значениям.

Пример 6.4 . Имеются данные о группе рабочих.

Оценить силу связи между признаками.

Решение: Даны групповые средние и внутригрупповые дисперсии.

Определим среднюю общую используя групповые средние

Средняя из внутригрупповых дисперсий

Межгрупповая дисперсия

Общая дисперсия s 2 =6,955 + 34,65 = 41,605

Эмпирический коэффициент детерминации

34,65 / 41,605 = 0,833

Эмпирическое корреляционное отношение

Такое значение (близко к 1) характеризует очень сильную связь между числом обслуживаемых станков и средней зарплатой.