Корреляционный анализ взаимосвязи признаков 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Корреляционный анализ взаимосвязи признаков



Основные статистические методы выявления наличия

И направления корреляционной связи

 

Для определения направления и характера связи применяются метод параллельных рядов, метод аналитических группировок, корреляционных таблиц и графический метод.

1. Сопоставление параллельных рядов статистических величин заключается в следующем. В одной графе таблицы приводятся упорядоченные значения факторного признака (X), а в другой – соответствующие им значения результативного признака (Y):

 

Х1 Y1
Х2 Y2
... ...
... ...
... ...
Хn Yn

 

В тех случаях, когда возрастанию значений факторного признака соответствует возрастание значений результативного признака (возможно, с некоторым отклонением), говорят о наличии прямой корреляционной связи. Если же с увеличением факторного признака значения результативного признака имеют тенденцию к уменьшению, то можно предполагать наличие обратной корреляционной связи между этими признаками.

 

 

Пример.

 

x                    
y -7 -3                
z                 -3 -11
w       -5           -3

 

Обращаясь к исходным данным примера, можно говорить о наличии прямой корреляционной связи между признаками Х,Y, обратной связи - между признаками Х, Z и отсутствии связи между Х,W.

Метод параллельных рядов обычно используется для установления характера связи при относительно небольшом объёме исходных данных.

2. Метод аналитической группировки

 

В статистической практике изучение взаимосвязей явлений проводится, как правило, по достаточно большому числу наблюдений, а значения наблюдаемых признаков X и Y представляются в сгруппированном виде

Наиболее удобной формой представления корреляционных зависимостей при большом числе наблюдений являются групповые аналитические таблицы, отражающие результаты аналитической группировки статистической совокупности по факторному признаку.

 

При построении аналитической таблицы для каждой выделенной j -ой группы подсчитывается численность составляющих её факторных значений x, а также суммарное и среднее групповые значения результативного признака

 

Пример.

Зависимость суммы прибыли банков от объема кредитных вложений.

Номер группы Группы банков по объему кредитных вложений, млн. руб., х Число банков, fj Сумма прибыль, млн. руб.
всего в среднем на один банк
         
  40 – 90   50,4 16,800
  90 – 140   241,3 40,217
  140 – 190   711,4 59,283
  190 – 240   704,0 78,222
  Итого   1707,1  

 

.Если при переходе от одной группы к другой средние значения будут изменяться с определенной закономерностью - систематически возрастать или убывать, то между признаками X и Y существует корреляционная связь ( как в приведенной таблице ).

 

3. Метод корреляционной таблицы

 

При построении корреляционной таблицы значения признаков X и Y ранжируются в порядке возрастания, факторные значения xi располагаются, как правило, в строках таблицы, результативные – в столбцах (графах), а на пересечении строк и столбцов проставляются числа, указывающие частоту появления различных результативных значений yj при фиксированном факторном значении xi. При таком построении таблицы каждая i -ая строка представляет распределение признака Y при условии X= xi. В итоговой строке таблицы проставляются частоты повторения в эмпирических данных результативного значения yj, а в итоговом столбце – частоты повторения значений xi.

Пример.

Зависимость суммы прибыли банков от объема кредитных вложений.

Группы банков по объему кредитных вложений, млн. руб. Группы банков по сумме прибыли, млн. руб.  
6,2 – 27,2 27,2 – 48,2 48,2 – 69,2 69,2 – 90,2 Итого
40 – 90          
90 – 140          
140 – 190          
190 – 240          
Итого          

 

По корреляционной таблице прослеживают визуально, как именно расположена в таблице основная масса частот повторения в эмпирических данных сочетаний (xi, yj):

- концентрация частот вдоль диагонали от левого верхнего угла таблицы к правому нижнему (т.е. большему значению X соответствует большее значение Y) означает наличие прямой корреляционной связи между признаками (как в таблице данного примера).

- концентрация частот вдоль диагонали от левого нижнего угла к правому верхнему (когда большему значению Х соответствует меньшее значение Y) означает наличие обратной корреляционной связи между признаками

Интенсивная концентрация частот около диагонали таблицы указывает на факт тесной корреляционной связи. Так, в корреляционной таблице данного примера наблюдается тесная связь между рассматриваемыми признаками.

Корреляционная таблица дает более правильную характеристику тесноты связи в случае, если число выделенных групп одинаково для обоих изучаемым признаков X и Y (как в приведенной таблице).



Поделиться:


Последнее изменение этой страницы: 2017-01-18; просмотров: 431; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.20.205.228 (0.007 с.)