Корреляционная взаимосвязь признаков 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Корреляционная взаимосвязь признаков



xi
  19,3
  22,2
  25,5
  28,0

 

Из табл. 2 видно, что с ростом значений xi фактора X систематически (т.е. закономерно) возрастают и средние значения результативного признака Y. Следовательно, связь между этими признаками является статистической, а поскольку закономерно меняется именно средняя величина Y ( а не какой-либо другой обобщающий показатель), то эта статистическая связь является корреляционной.

 

1.2. Графическое представлениекорреляционной связи

Для графического представления парных корреляционных связей применяются два вида графиков – поле корреляции и эмпирическая линия связи (называемая также эмпирической линией регрессии).

Поле корреляции – это точечный график, используемый для изображения связи признаков в совокупностях небольшого объёма.

При построении графика в декартовой системе координат по оси абсцисс в определённом масштабе наносятся значения факторного признака, а по оси ординат – результативного. На пересечении абсцисс и ординат отмечаются точки (xi, yi), совокупность которых и представляет корреляционное поле (рис.3).

Эмпирическая линия связи представляет собой ломаную линию, изображающую изменение средних значений признака Y в зависимости от изменения значений фактора Х.

При несгруппированных значениях признака Х по оси абсцисс откладываются значения xi, а по оси ординат – условные средние . Нанеся на поле графика точки (xi, ) и соединив их последовательно отрезками прямых, получают ломаную линию, которая и является эмпирической линией связи – графиком условных средних результативного признака.

В качестве примера на рис.3 изображены корреляционное поле (точечная диаграмма) для данных табл.1 и эмпирическая линия связи для данных табл.2.

 

 

Рис. 3. Корреляционное поле и эмпирическая линия связи для условных средних

(по данным табл. 1, 2)

В случае сгруппированных факторных значений (как, например, в табл.3) по оси абсцисс откладываются середины интервалов группировки, а по оси ординат – соответствующие средние групповые значения результативного признака. Отметив точки ( ) и соединив их отрезками прямых, получают эмпирическую линию связи – график групповых средних результативного признака. Пример эмпирической линии связи для данных табл. 3 представлен на рис. 4.

Таблица 3

Зависимость выпуска продукции от среднегодовой стоимости

основных производственных фондов

Номер группы Группы предприятий по среднегодовой стоимости основных фондов, млн руб. Число пред-приятий Выпуск продукции, млн руб.
Всего по группе В среднем на одно предприятие,
  94,00 - 134,80   331,00 110,33
  134,80 - 175,60   887,00 110,88
  175,60 - 216,40   1461,00 146,10
  216,40 - 257,20   824,00 164,80
  257,20 - 298,00   806,00 201,50
Итого     4309,00 143,63

 

 

 

Рис. 4. Корреляционное поле и эмпирическая линия связи для групповых средних по данным табл.3

(пунктирная линия – теоретическая параболическая модель связи)

Если бы зависимость Y от Х была функциональной, то все точки (xi, yj) корреляционного поля были бы расположены на определенной эмпирической линии связи. При корреляционной связи, вследствие различных случайных факторов, точки (xi, yj) не лежат на одной линии, однако их расположение обнаруживает определенную тенденцию, которая выражается видом эмпирической линии связи. Так, например, эмпирическая линия связи на рис.3 по своему виду приближается к прямой линии, а на рис.4 - к параболе.

1.3.Виды и формы выражения корреляционной связи

 

Корреляционные связи, как и прочие факторные связи, имеют разную форму выражения, различаясь по степени тесноты, направлению, количеству факторов в модели связи и форме аналитического выражения связи.

 

Ø Теснота корреляционной связи характеризует степень её приближения к функциональной связи. Если значению xi признака Х соответствуют значения yi1, yi2, …, yik, близкие друг другу, тесно расположенные около своей средней , то связь тесная (сильная). Если же эти результативные значения существенно отклоняются от своей средней , то связь менее тесная (она может быть слабой, умеренной, заметной).

 

Таким образом, чем сильнее связь, тем теснее будут группироваться точки вокруг некоторой определенной линии, моделирующей форму связи, т.е. возле линии регрессии (рис. 3, 4).

При отсутствии тесной связи между признаками имеет место беспорядочное расположение точек на графике (рис.5а).

 

Ø В зависимости от направления изменения результативного признака различаются прямые и обратные связи. Если результативный признак Y изменяется в том же направлении, что и факторный признак Х (т.е. с ростом Х признак Y также возрастает, а при уменьшении Х – уменьшается), то связь прямая. Если же результативный признак меняется в противоположном направлении, то связь обратная.

 

Ø По количеству факторов, действующих на результативный признак, различают однофакторные и многофакторные связи. Если исследуется связь между одним признаком-фактором Х и результативным признаком Y (при абстрагировании от влияния на Y всех других факторов), то говорят об однофакторной связи и парной корреляции (рассматриваетсяпара признаков X,Y). Если же изучается воздействие на Y нескольких факторных признаков X1, X2, …, Xm, то связь называют многофакторной, а корреляцию множественной.

 

Модель многофакторной корреляционной связи имеет вид:

(7)

В случае многофакторной связи имеется ввиду, что все влияющие факторы действуют в комплексе – одновременно и во взаимосвязи.

Если же изучается зависимость между результативным и одним из факторных признаков при фиксированных значениях других факторных признаков, то говорят о частной корреляции.

 

Ø По форме аналитического выражения связи различают линейные и нелинейные модели связи.

 

В однофакторных моделях (6) наиболее часто используются следующие видыматематических функций, характеризующих воздействие факторного признака на результативный:

= a0 + a1x – линейная,

= a0 + a1 гиперболическая,

= a0 + a1lgx – логарифмическая,

= a0 степенная, (8)

= a0 + a1x + а2x2 параболическая,

= a0 + показательная.

 

Коэффициенты a0, a1, a2, … и т.д. в моделях (8) называют параметрами связи.

 

Зависимости (8) описывают типы кривых, применяемых для «сглаживания»ломаных эмпирических линий связи с помощью некоторой плавной кривой, к которой тяготеют точки (xi, yj) (на рис.3,4 сглаживающая прямая обозначена пунктирной линией).

1.4. Свойства корреляционной связи

 

Для корреляционной связи характерны следующие свойства:

 

1. Будучи стохастическими, корреляционные связипроявляются не в единичных наблюдениях, а в общем и среднем при достаточно большом числе наблюдений. Поэтому для своего исследования они требуют эмпирических статистических данных, полученных на основе массовых наблюдений.

 

2. Эмпирические статистические данные отображают, как правило, совокупное действие на результативный показатель всех имеющих место причин и условий, однако в корреляционных связях учитываются лишь некоторые из них. Наличие прочих «неучтенных» факторов проявляется в том, что корреляционные связи, даже обнаруженные на основе массового материала (где случайные факторы нивелируются), оказываются неполными. По силе связи они никогда не достигают связи функциональной – полной и однозначной.

 

3. Корреляционные связи являютсянеобратимыми:наличие зависимости результативного признака Y от фактора Х не означает наличия обратной связи – зависимости Х от Y (так, производительность труда зависит от уровня автоматизации производства, но обратной зависимости нет).

Кроме перечисленных форм связи различают также непосредственные, косвенные и ложные связи. Суть каждой из них очевидна из названия.

При непосредственных связях факторы взаимодействуют между собой непосредственно.

Для косвенной связи характерно участие какой-то третьей переменной, которая опосредует связь между изучаемыми признаками.

Ложная связь – это связь, установленная формально и, как правило, подтвержденная только количественными оценками. Она не имеет под собой качественной основы, бессмысленна

2. Этапы корреляционно-регрессионного анализа, требования кк исходному статистическому материалу

Исследование корреляционных зависимостей включает ряд этапов, которые в совокупности составляют метод корреляционно-регрессионного анализа:

 

Корреляционный анализ осуществляется в 2 этапа:

 

1. Установление факта наличия связи, определение ее направления и формы.

2. Измерение степени тесноты связи между признаками.

 

После того, как наличие корреляционной связи установлено и выявлено, что связь достаточно тесна (т.е. цель корреляционного анализа достигнута), переходят к регрессионному анализу

Регрессионный анализ осуществляется в 3 этапа:

 

1. Выбор аналитической формы корреляционной связи между факторными признаками X1, X2, …, Xm и результативным признаком Y (т.е. выбор из набора (8) общего вида математической функции для моделирования связи).

2. Нахождение числовых значений коэффициентов модели связи.

3. Выбор наилучшей из построенных моделей (если таких моделей несколько),

анализ качества и адекватности модели.

 

 

Применение методов КРА требует предварительного анализа свойств совокупности эмпирических данных (xi, yi).

Необходимость такого анализа обусловлена тем, что для получения достоверных результатов КРА должны выполняться следующие требования в отношении отбора единиц наблюдения (xi, yi):

1) однородность изучаемой статистической совокупности (например, для совокупности предприятий – это однородность выпускаемой продукции, одинаковый характер технологического процесса, одинаковый тип используемого оборудования);

2) репрезентативность выборки единиц наблюдаемой совокупности, т.к. при малой выборке может быть «затушёвано» действие случайных факторов, взаимопогашение которых происходит при расчёте условных средних ;

3) достаточность объёма эмпирических данных для выявления закономерности связи (число факторных признаковдолжно быть в 5-6 раз меньше объёма изучаемой совокупности);

4) независимость включаемых в регрессионную модель факторов-признаков X1, X2, …, Xm, т. к. наличие связи между ними свидетельствует о том, что они характеризуют одни и те же стороны изучаемого явления и в значительной мере дублируют друг друга;

5) нормальный характер распределения изучаемого признака Y при фиксированных значениях признаков X1, X2, …, Xm.

 

В статистических исследованиях часто приходится сталкиваться с теми или иными отклонениями от указанных требований, однако практика показывает, что незначительные отклонения не являются препятствием к применению методов корреляционно-регрессионного анализа.

 



Поделиться:


Последнее изменение этой страницы: 2017-01-18; просмотров: 771; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.226.93.207 (0.035 с.)