Оценка однородности изучаемой совокупности. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Оценка однородности изучаемой совокупности.



Одним из важнейших условий правильного применения методов корреляционного анализа является однородность совокупности, подлежащей изучению.

Количественная оценка однородности производится с помощью относительных показателей вариации. Традиционно широкое распространение для этих целей получил коэффициент вариации (по факторным признакам).

Вывод об однородности совокупности по тому или иному признаку требует также проверки гипотезы о принадлежности “выделяющихся” (“аномальных”) значений признака исследуемой генеральной совокупности. Для исключения выделяющихся наблюдений из дальнейшей обработки применяются различные критерии.

В случае, когда распределение результатов подчиняется нормальному закону распределения, значение признака резко отличающееся по своей величине от остальных сравнивается с критической границей:

 - верхняя допустимая граница для максимального выделяющегося значения признака,

 - нижняя допустимая граница для минимального выделяющегося значения признака.

Значение t определяется по таблице нормированной функции Лапласа (Фt) исходя из принятой доверительной вероятности a.

 Например, известны следующие данные:

 x1 x2 xn-1 xn s
1 13 130 178 57.3 35.3

 

Проверим принадлежат ли выделяющиеся минимальное x1=1 и максимальное xn=178 значения к рассматриваемой совокупности.

 При уровне значимости a=0.01 значение нормированной функции Лапласа будет равно:

Фt =0.5 - a; 

Фt =0.5 - 0.01=0.49;

По таблице нормированной функции Лапласа определяем значение t: t= 2.33.

Верхняя допустимая граница значений признака:

57.3+2.33×35.3=139.60.

Нижняя допустимая граница значений признака:

57.3 - 2.33×35.3= -24.95.

Значение xn=178 выходит за рассчитанную границу, а потому с вероятностью 0.99 можно считать xn=178, не принадлежащим к изучаемой совокупности, и исключить его из дальнейших расчетов.

Для исключения выделяющихся наблюдений по данным малых выборок применяется критерий Граббса, который основан на отношении двух сумм квадратов отклонений:

1. для испытания наибольшего наблюдения, выделяющегося в выборке объема n из нормально распределенной совокупности, рассчитывается отношение:

,

где x1 £ x2 £ x3 £... £ xn; ; ;

2. для испытания наименьшего наблюдения, выделяющегося в выборке объема n, рассчитывается отношение:

,

где .

Рассчитанная величина отношения (Красч) сравнивается с табличной величиной (Ктабл) при определенном числе наблюдений и заданном уровне значимости. Если Красч £ Ктабл, то выделяющееся наименьшее или наибольшее значение не отбрасывается.

 

Значения критерия Граббса (Ктабл)

Число

Уровень значимости

наблюдений 0.01 0.05
3 0.0001 0.0027
4 0.0100 0.0494
5 0.0442 0.1270
6 0.0928 0.2032
7 0.1447 0.2696
8 0.1948 0.3261
9 0.2411 0.3742
10 0.2831 0.4154
15 0.4401 0.5559
20 0.5393 0.6379
25 0.6071 0.6923

 

3. Статистические методы выявления наличия корреляционной связи.  

Для определения наличия или отсутствия корреляционной связи в статистике используются следующие методы:

*  параллельное сопоставление рядов значений результативного и факторного признаков;

*  построение групповой таблицы;

*  построение корреляционной таблицы;

*  графический метод;

*  дисперсионный анализ.

Простейшим приемом обнаружения связи является сопоставление двух параллельных рядов - ряда значений факторного признака и соответствующих ему значений результативного признака. Значения факторного признака располагают в возрастающем порядке и прослеживают направление изменения величины результативного.

Например, по 30 предприятиям были установлены процент выполнения норм выработки и величина средней заработной платы:

№ п/п Выполнение норм выраб., % Заработная плата, руб. № п/п Выполнение норм выраб., % Заработная плата, руб.
1 96.7 1420 16 103.1 1630
2 97.0 1510 17 103.7 1640
3 98.0 1450 18 104.3 1670
4 98.5 1440 19 105.2 1820
5 100.0 1530 20 105.3 1850
6 100.0 1610 21 105.8 1890
7 100.6 1530 22 106.0 1900
8 100.7 1630 23 106.4 1780
9 100.8 1620 24 106.9 1870
10 101.0 1560 25 107.0 1880
11 101.2 1600 26 107.0 2040
12 101.8 1700 27 108.0 1950
13 102.3 1730 28 108.3 2160
14 103.0 1640 29 110.0 2100
15 103.0 1760 30 112.0 2120

 

По приведенным данным можно отметить, что в целом увеличение нормы выработки влечет за собой увеличение средней заработной платы.

В тех случаях, когда возрастание величины факторного признака влечет за собой возрастание величины и результативного признака имеется прямая корреляционная связь. если же с увеличением факторного признака величина результативного признака имеет тенденцию к уменьшению, то присутствует обратная связь между признаками. 

Однако наличие большого числа различных значений результативного признака, соответствующих одному и тому же значению признака-фактора, затрудняет восприятие таких параллельных рядов особенно при большом числе единиц, составляющих совокупность. В таких случаях для установления факта наличия связи целесообразнее воспользоваться статистическими таблицами - корреляционными или групповыми.

В корреляционной таблице факторный признак x располагают, как правило, в строках, а результативный признак y - в колонках таблицы. Числа, расположенные на пересечении строк и столбцов таблицы, показывают частоту повторения данного сочетания х и у.   

Построение корреляционной таблицы начинают с группировки значения факторного и результативного признаков. Для определения величины интервалов может использоваться формула Стерджесса.

Центр интервала 1482 1606 1730 1854 1978 2102    
группы по y® группы по X ¯ 1420 - - 1544 1544 - - 1668 1668 - - 1792 1792 - - 1916 1916 - - 2040 2040 - - 2164 fx
96.7-99.3 4           4 1482.0
99.3-101.9 2 5 1       8 1590.5
101.9-104.5   3 3       6 1668.0
104.5-107.1     1 6 1   8 1854.0
107.1-109.7         1 1 2 2040.0
109.7-112.3           2 2 2102.0
fy 6 8 5 6 2 3 20

 

Корреляционная таблица дает возможность выдвинуть предположение о наличии или отсутствии связи, а также выяснить ее направление.

Если частоты в корреляционной таблице расположены на диагонали из левого верхнего угла в правый нижний угол (т. е. большим значениям факторного признака соответствуют большие значения результативного), то можно предположить наличие прямой корреляционной зависимости между признаками. Если же частоты расположены по диагонали справа налево, то предполагают наличие обратной связи между признаками.

Для того, чтобы сделать восприятие корреляционной таблицы более доступным, можно для каждой строки рассчитать средние значения результативного признака, соответствующие определенному значению факторного признака (последняя колонка таблицы).

Корреляционная таблица позволяет сжато, компактно изложить материал, поэтому все последующие расчеты (показателей тесноты связи и параметров уравнения) можно вести по корреляционной таблице.

 

Другим приемом обнаружения связи является построение групповой таблицы. Все наблюдения разбиваются на группы в зависимости от величины факторного признака, и по каждой группе вычисляются средние значения результативного признака.

Группы по  факторному признаку Сумма значений результативного признака в группе Число значений результативного признака в группе Среднее значение результативного признака в группе
96.7 - 99.3 5820 4 1455.00
99.3 - 101.9 12780 8 1597.50
101.9 - 104.5 10070 6 1678.33
104.5 - 107.1 15030 8 1878.75
107.1 - 109.7 4110 2 2055.00
109.7 - 112.3 4220 2 2110.00
Итого: 52030 30 1734.33

 

Для предварительного выявления наличия связи и раскрытия ее характера, а также для выбора формы связи применяют графический метод. Используя данные об индивидуальных значениях факторного признака и соответствующих ему значениях результативного признака, можно построить в прямоугольных осях точечный график, который называют поле корреляции.

Точки корреляционного поля не лежат на одной линии, но вытянуты определенной полосой слева направо. Если нанести на график точки с абсциссами, соответствующими центрам интервалов факторного признака, и ординатами равными средним значениям результативного признака в выбранных группах, то соединив их отрезками прямой получим эмпирическую линию связи.

 Если эмпирическая линия связи по своему виду приближается к прямой линии, то можно предположить наличие прямолинейной корреляционной связи между признаками. Если же имеется тенденция неравномерного изменения значения результативного признака и эмпирическая линия связи будет приближаться к какой-либо кривой, то это может быть связано с наличием криволинейной корреляционной связи.

Для выявления наличия и оценки существенности связи между признаками могут применяться и методы дисперсионного анализа (см. далее: расчет корреляционного отношения).

 



Поделиться:


Последнее изменение этой страницы: 2022-01-22; просмотров: 74; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.145.77.114 (0.011 с.)