Понятие вариации признака в совокупности. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Понятие вариации признака в совокупности.



Понятие вариации признака в совокупности.

Система показателей вариации.

Правило сложения дисперсий и его применение.

Виды дисперсий. Правило сложения дисперсий.

Расчёт показателей тесноты и силы связи признаков на основе правила сложения дисперсий.

Характеристика формы распределения единиц совокупности.

1. Понятие вариации признака в совокупности.

Информации о средних значениях обычно бывает недостаточным для полного анализа изучаемого процесса (явления), т.к. иногда совершенно разные по внутреннему строению совокупности могут иметь равные средние величины

Пример.

5 5

_

Ряд 1. 95 100 105 х1 = 100

_

Ряд 2. 75 100 125 х2 = 100

 


25 25

При изучении явлений необходимо учитывать разброс значений признака единиц совокупности, т.е. вариацию признака единиц.

Вариации – это различие индивидуальных значений признака в ряде распределения, т.е. колеблемость признака.

 

Вариация признака возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов, которые по разному сочетаются в каждом отдельном случае.

Отклонение индивидуального варианта от среднего значения - это разность

 

Если вариация (т.е.разброс значений признака вокруг средней величины) незначительна, то средняя величина типична для данной совокупности.

Если вариация велика (т.е. отклонения от средней значительны), то средняя является ненадёжной характеристикой совокупности.

Вариация измеряется специальной системой показателей, которые позволяют определить величину разброса значений признака и тем самым установить надёжность средней.

 

Кроме того, эти показатели позволяют:

· Определить предельные границы изменения признака

· Установить, является лисовокупность однородной

· Установить тесноту и силу взаимосвязи между факторами, действующими на признак, и результативным признаком.

Пример.

Имеется ряд распределения (табл.6.1) сотрудников по стажу работ.

 

Таблица 6.1

Распределение сотрудников по стажу работ

Стаж, лет Число работающих, чел.
1-4  
4-7  
7-10  

Определить размах вариации R, среднее линейное отклонение , среднее квадратическое отклонение s, дисперсию s2, коэффициент вариации Vs.

 

Поскольку исходные данные заданы интервальным рядом, для расчетов используется взвешенная форма показателей (5) - (7), т.е. с учётом частот f.

 

R = Xmax - Xmin = 10 – 1 = 9 лет

 

Для вычисления остальных показателей вариации необходимо построить вспомогательную расчетную таблицу.

Таблица 6.2

Расчётная таблица для оценки дисперсии

Стаж лет, xj Число работников fj x'j x'j • fj _ x'j – x _ (x'j – x)2 _ (x'j – x)2 • fj
1-4   2,5 10,0 -2,5 6,25 25,00 2,5  
4-7   5,5 27,5 0,5 0,25 1,25 0,5 2,5
7-10   8,5 17,0 3,5 12,25 24,50 3,5 7,0
Итого     54,5     50,75   19,5

i=1,2, …, 11 j=1, 2, 3

лет = 19,5/11 = 1,77 лет.

года.

2,1 года - это среднее отклонение стажа от среднего стажа 5 лет.

Вывод:

Анализ полученных данных говорит о том, что стаж работников фирмы отличается от среднего стажа (5,0 лет) в среднем на 2,1 года, что составляет 42,0%.

Значение Vs > 33%, следовательно, вариация стажа велика, и следовательно средний стаж не является типичной величиной. Её нельзя считать надёжной характеристикой совокупности работников, а саму совокупность нет оснований считать однородной по производственному стажу.

 

3.Правило сложения дисперсий и его применение

3.1. Виды дисперсий в совокупности, разделеннойна группы.

Правило сложения дисперсий.

 

В совокупности, разделенной на группы, существуют различные виды дисперсии:

 

Общая дисперсия

Межгрупповая дисперсия

Внутригрупповая дисперсия

 

Дадим определение этих трех видов дисперсии, обозначая факторный признак – Х, результативный – Y,

 

Введем обозначения:

 

1 гр. 1 г р.
2 гр.
3 гр.
k гр.
n1.
n2.
n3.
nk.

 

n=n1+n2+…+nk;

k – количество групп;

– среднее значение результативного признака У в j -ой группе;

– общая средняя по всей совокупности;

n – число единиц совокупности

 

Содержательный смысл этих 3-х дисперсий:

 

1. Общая дисперсия s2общ характеризует вариацию результативного признака У под воздействием всех факторов, влияющих на У (т.е. определяющих различия в значениях признака У).

 

Она вычисляется по формуле:

(12)

 

2. Среди множества факторов { Х}, влияющих на результативный признак У, выделим один основной фактор Х, влияние которого на У будем изучать. Для этой цели используется межгрупповая дисперсия.

Межгрупповая дисперсия δ 2x характеризует вариацию У под воздействием только выделенного фактора Х

(греческая буква δ – дельта).

 

Расчетная формула:

(13)

где – групповые средние;

– общая средняя;

– численность единиц в j-ой группе;

k – количество групп.

3. Внутригрупповая дисперсия – определяет вариацию признака У внутри j - ой группы.

 

(14)

 

где: yi – индивидуальные значения признака внутри группы;

– среднее значение признака в группе с номером j;

nj – численность единиц в j-ой группе.

 

Cредняя из внутригрупповых дисперсий рассчитывается по формуле

(15)

 

Существует следующее ПРАВИЛО СЛОЖЕНИЯ ДИСПЕРСИЙ:

Пример 1.

Рассчитать зависимость объёма выполненных работ от формы собственности организации.

Таблица 6.3

Рис 3. Кривые асимметричных распределений

(пунктиром обозначена нормальная кривая

 

Если вершина сдвинута влево, то правая часть кривой оказывается длиннее левой (рис. 3а), т.е. имеет место правосторонняя асимметрия, характеризующаяся неравенством

> Me>Mo,

что означает преимущественное появление в распределении более высоких значений признака.

 

Если же вершина кривой сдвинута вправо и левая часть оказывается длиннее правой, то асимметрия левосторонняя (рис. 3б), для которой справедливо неравенство

< Me<Mo,

означающее, что в распределении чаще встречаются более низкие значения признака.

 

Чем больше величина расхождения между , Me, Mo, тем более асимметричен ряд. Разности

являются простейшими показателями симметрии в рядах распределения.

 

В нормальном и близких к нему распределениях основная масса единиц (почти 70%) располагается в центральной зоне ряда, в диапазоне

().

Для оценки асимметричности распределения в этом центральном диапазоне служит коэффициент К.Пирсона:

.

При правосторонней асимметрии Asп>0, при левосторонней Asп<0. Если Asп=0, вариационный ряд симметричен.

 

Наиболее точным показателем асимметрии распределения является коэффициент асимметрии As, вычисляемый по формуле

,

где n – число единиц совокупности.

В симметричных распределениях As=0.

при As>0 имеется правосторонняя асимметрия,

при As<0левосторонняя.

Правосторонняя асимметрия означает, что в распределении появляются преимущественно более высокие значения признака, а левосторонняяболее низкие значения признака,

 

Чем больше величина |As|, тем более асимметрично распределение. Установлена следующая оценочная шкала асимметричности:

|As| 0,25 - асимметрия незначительная;

0,25<|As| 0, 5 - асимметрия заметная (умеренная); |As|>0,5 - асимметрия существенная.

Поскольку коэффициенты Asп и As являются относительными безразмерными величинами, они часто применяются для сравнительного анализа асимметричности различных рядов распределения.

2. Показатель эксцесса характеризует крутизну кривой распределения - ее заостренность или пологость по сравнению с нормальной кривой (рис.4).

     

а) островершинное б) плосковершинное

Рис.4. Кривые распределения с ненулевым эксцессом

(пунктиром обозначена нормальная кривая).

 

Для оценки расхождений в степени крутизны кривых (при одинаковой силе вариации) применяется коэффициент эксцесса Ek:

.

 

Как правило, коэффициент эксцесса вычисляется только для симметричных или близких к ним распределений.

Это объясняется тем, что за базу сравнения принята кривая нормального распределения, являющаяся симметричной. Относительно вершины нормальной кривой и определяется выпад вверх или вниз вершины теоретической кривой эмпирического распределения.

 

При этом:

· если Ek>0, то вершина кривой распределения располагается выше вершины нормальной кривой, а форма кривой является более островершинной, чем нормальная (рис. 3а). Это говорит о скоплении значений признака в центральной зоне ряда распределения, т.е. о преимущественномпоявлении в данных значений близких к средним;

· если Ek<0, то вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной (рис. 3б). Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от xmax до xmin .

 

Для нормального распределения Ek=0, поэтому чем больше абсолютная величина | Ek|, тем существеннее распределение отличается от нормального.

В частности очень большая отрицательная величина Ek означает преобладание у признака крайних значений, причем одновременно и более низких, и более высоких. При этом в центральной части распределения может образоваться «впадина» (U –образной формы), превращающая распределение в двухвершинное, что является индикатором неоднородности совокупности.

 

Существуют распределения, отличные от нормального, например, распределение Пуассона (рис.5). По этому закону описываются инвестиции (чем больше инвестиции, тем реже они поступают), а также кредиты (мелкие кредиты выдаются часто, а чем больше кредит, тем реже его выдают).

 

 

f

 

 

х

Рис.5. График распределения Пуассона

.

 

Дополнительные примеры расчета показателей вариации

Задачи из "Практикума по общей теории статистки"

(авторы О.В.Лосева, К.М.Буданов)

 

(в практикуме дисперсии обозначены через s 2, а не σ2,

среднее квадратичное отклонение - через s)

 

Пример 1. Имеются следующие данные о чистой прибыли, полученной предприятиями:

№ предприятия          
Чистая прибыль, млн. руб.          

Вычислить размах вариации, среднее линейное отклонение, дисперсию, среднее квадратическое отклонение и коэффициент вариации.

Решение.

Вычисления удобно оформить в виде вспомогательной таблицы

 

№ единицы совокупности Чистая прибыль xi, млн. руб.
    – 10,6 10,6   112,36
    – 5,6 5,6   31,36
    – 0,6 0,6   0,36
    7,4 7,4   54,76
    9,4 9,4   88,36
Сумма     33,6   287,2

Вычислим среднюю арифметическую:

млн. руб.

Размах вариации:

млн. руб.

Среднее линейное отклонение:

млн. руб.

Дисперсия:

Для расчёта дисперсии можно также воспользоваться формулой

Среднее квадратическое отклонение:

млн. руб.

Коэффициент вариации:

Таким образом, средний размер чистой прибыли по совокупности предприятий составляет 30,6 млн. рублей. При этом прибыль отдельных предприятий отличается от среднего размера в среднем на 7,58 млн. рублей. Данная совокупность предприятий является однородной, поскольку коэффициент вариации не превышает 33%.

Пример 2. Имеются данные о распределении продукции, произведённой работниками завода:

Число единиц продукции, шт. Число рабочих, чел.
   
   
   
   
   

Вычислить размах вариации, среднее линейное отклонение, дисперсию, среднее квадратическое отклонение и коэффициент вариации.

Решение:

Вычисления удобно оформить в виде таблицы

Число единиц продукции xi, шт. Число рабочих fi, чел.
      – 2        
      – 1        
               
               
               
Итого              

Вычислим среднюю арифметическую:

шт.

Размах вариации:

шт.

Среднее линейное отклонение:

шт.

Дисперсия:

Для расчёта дисперсии можно также воспользоваться формулой . Составим вспомогательную таблицу:

 

       
       
       
       
       
Итого      

Отсюда получаем:

Среднее квадратическое отклонение:

шт.

Коэффициент вариации:

Таким образом, каждый работник предприятия в среднем изготовил по 10 единиц продукции. При этом число единиц продукции, изготовленных отдельными работниками, отличается от среднего значения в среднем на 1,2 единицы. Данная совокупность работников является однородной, поскольку коэффициент вариации не превышает 33%.

Пример 3. Имеются данные о распределении работников некоторого предприятия по уровню среднемесячной заработной платы:

 

Заработная плата, тыс. руб. Число работников, чел.
14 – 16  
16 – 18  
18 – 20  
20 – 22  

Вычислить размах вариации, среднее линейное отклонение, дисперсию, среднее квадратическое отклонение и коэффициент вариации.

Решение:

Данные в задаче представлены в виде интервального ряда, для решения необходимо перейти к дискретному ряду.

 

 

Заработная плата, тыс. руб. Число работников fi, чел. xi
14 – 16       3,4   11,56 115,6
16 – 18       1,4   1,96 58,8
18 – 20       0,6   0,36 14,4
20 – 22       2,6   6,76 135,2
Итого              

Вычисляем среднюю арифметическую:

тыс. руб.

Размах вариации:

тыс. руб.

Среднее линейное отклонение:

тыс. руб.

Дисперсия:

Для расчёта дисперсии можно также воспользоваться формулой . Составим вспомогательную таблицу:

 

       
       
       
       
Итого      

Отсюда получаем:

Среднее квадратическое отклонение:

тыс. руб.

Коэффициент вариации:

Таким образом, средняя заработная плата работников предприятия составляет 18,4 тыс. рублей. При этом заработная плата отдельных работников отличается от среднего значения в среднем на 1,8 тыс. рублей. Данная совокупность работников является однородной, поскольку коэффициент вариации не превышает 33%.

 

Понятие вариации признака в совокупности.



Поделиться:


Последнее изменение этой страницы: 2017-02-17; просмотров: 236; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.144.161.116 (0.108 с.)