Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Статистические методы выявления корреляционной связи

Поиск

 

Выделяют три этапа изучения связей между явлениями. В основе первого этапа лежит качественный анализ состава явления методами экономики, социологии и других наук. Второй этап предполагает построение модели связи с помощью методов группировки, средних величин, индексного метода и др. Третий этап состоит в интерпретации результатов в соответствии с качественными особенностями изучаемого явления.

При исследовании корреляционных связей между признаками необходимо решить следующие задачи:

§ предварительно проанализировать свойства изучаемой совокупности;

§ установить факт наличия связи, определить ее направление и формы;

§ измерить степень тес­ноты связи между признаками;

§ построить регрессионную мо­дель (найти аналитическое выражение связи);

§ оцен­ить адекватность модели, возможность ее экономической интерпретации и прак­тического использования.

Таким образом, статистика не только определяет наличие взаимосвязей социально-экономических явлений, но и дает количественную характеристику этих взаимосвязей.

Для выявления наличия связи, ее характера и направления в статистике используются следующие методы: метод параллельных рядов; графический; метод аналитических группировок; дисперсионный анализ; корреляционно-регрессионный анализ.

Метод параллельных рядов состоит в том, чтостатистические показатели располагают в виде параллельных рядов – ряда значений факторного признака и соответствующих ему значений результативного признака . При этом значения факторного признака располагают по возрастанию. С этими значениями сопоставляются изменения значений результативного признака. Такое сопоставление рядов позволяет установить характер и тесноту связи. Если значения признаков и изменяются в одном направлении, то связь между ними является прямой, а в противном случае – обратной.

Графический метод позволяет наглядно судить о наличии, направлении и форме связи с помощью графика поля корреляции. На оси абсцисс откладываются значения факторного признака, а на оси ординат – результативного. На графике откладываются все единицы, имеющие значения и . Считается, что связь отсутствует, если точки беспорядочно расположены на графике. При наличии связи межу признаками точки группируются вокруг определенной линии (эмпирическая линия регрессии), которая и выражает форму связи (рис. 10.1).

Рис. 10.1. График поля корреляции

 

На рис. 10.1 видно, что эмпирическая линия связи при некотором приближении имеет вид прямой линии. Поэтому можно предположить наличие прямолинейной корреляционной связи между признаками. Если значения результативного признака изменяются неравномерно, то эмпирическая линия связи будет приближаться к некоторой кривой. В этом случае можно предположить наличие криволинейной (нелинейной) корреляционной связи (рис. 10.2).

Рис. 10.2. Вид криволинейной обратной связи

Метод аналитических группировок состоит в том, что единицы совокупности группиру­ются, как правило, по факторному признаку. Для каждой группы по результативному признаку рассчитывается средняя или отно­сительная величина. Для выявления характера связи между признаками сопоставляют изменения зна­чений (средних или относительных) результативного признака с изменениями значений факторного признака.

Метод дисперсионного анализа позволяетрешить две задачи: 1) определить долю систематиче­ской и случайной вариаций в общей вариации; 2) установить роль факторного признака в изменении результативного признака.

Замечание. Дисперсионный анализ – это раздел математической ста­тистики, изучающий степень влияния одного или нескольких фак­торных признаков на результативный признак при небольшом числе наблюдений. Отличие дисперсионного анализа от корреляционного состоит в том, что измерение колебле­мости в дисперсионном анализе осуществляется на основе расчета дисперсий. В дисперсионном анализе используются одно- и многофак­торные статистические комплексы, т.е. комбинационные таблицы, в которых определена (представ­лена) структура качественно разнородной статистической со­вокупности. Таким образом, дисперсионный анализ применяют для установления существенности влияния качественных факторов на исследуе­мую величину.

Метод корреляционно-регрессионного анализа позволяет оценить тесноту и направление связи, получить уравнение зависимости ме­жду факторными и результативными признаками.

Статистическое изучение социально-экономических явлений предполагает не только выявление связи между признаками, но и построение математической модели (аналитическое выражение) этой связи.

Уравнение парной регрессии

 

При статистическом изучении корреляционных зависимостей решаются две основные задачи:

1) нахождение формы связи между признаками и в виде математической формулы, выражающей эту зависимость;

2) измерение тесноты связи.

Эти задачи являются неразрывными и взаимно дополняющими друг друга задачами корреляционно-регрессионного анализа. Решение данных задач допускается в разной последовательности. В настоящем пособии сначала рассматривается нахождение уравнения регрессии, а затем – методы выявления и измерения тесноты связи.

Определение формы связи называется нахождением уравнения регрессии (уравнения связи).

Регрессия – это зависимость среднего значения случайной величины от одной или нескольких величин. Термин «регрессия» (от лат. regression – отступление, возврат к чему-либо) введен Ф. Гальтоном в 1886 г.

Парная регрессия позволяет получить аналитическое выражение связи между двумя признаками: факторным и результативным .

Найти уравнение регрессии – значит по фактическим (эмпирическим) данным математически описать изменения взаимно коррелируемых величин. Уравнение регрессии также называют теоретической линией регрессии – это линия, вокруг которой группируются точки корреляционного поля и которая указывает основное направление (основную тенденцию) связи. Теоретическая линия регрессии позволяет оценить среднее значение результативного признака при различных значениях факторного признака . При этом не должны учитываться все остальные факторы, влияющие на признак и не связанные с признаком .

Значения результативного признака, рассчитанные по уравнению регрессии, называются теоретическими . То есть, теоретические значения рассматриваются в виде функции, т.е. =

Аналитическая связь между признаками может описываться следующими уравнениями:

§ прямая:

§ парабола:

§ гипербола: и др.

Считается, что если факторный и результативный признаки изменяются одинаково (примерно в арифметической прогрессии), то это свидетельствует о линейной связи между ними. Если признаки изменяются в разных направлениях, то связь является обратной. В этом случае применяется уравнение гиперболы. А если признаки изменяются в одном направлении, но с разной скоростью, то применяется параболическая или степенная функция.

После выбора типа функции определяют параметры уравнения регрессии. Параметры должны быть такими, чтобы рассчитанные с их помощью теоретические значения результативного признака , минимально бы отличались от фактических значений . То есть, теоретическая линия регрессии должна быть проведена так, чтобы сумма отклонений точек поля корреляции от соответствующих точек теоретической линии равнялась нулю ().

Уравнение парной линейной регрессии имеет вид:

,

где: - среднее значение результативного признака при определенном значении факторного признака; - свободный член уравнения (не имеет экономического смысла); - коэффициент регрессии, который показывает, на сколько единиц в среднем изменится результативный признак при изменении факторного признака на единицу его измерения. При такой интерпретации коэффициента регрессии предполагается, что сила воздействия признака на признак постоянна при любых значениях . С геометрической точки зрения коэффициент регрессии характеризует угол наклона лини регрессии к оси абсцисс.

Знак при коэффициенте регрессии показывает направление связи между признаками:

§ при > 0 – связь прямая;

§ при < 0 – связь обратная.

Параметры уравнения регрессии (, ) определяются с помощью метода наименьших квадратов (МНК), согласно которому сумма квадратов отклонений теоретических значений результативного признака от фактических значений , была бы минимальной:

.

Рассмотрим парную линейную регрессию, так как линейная зависимость является наиболее используемой формой связи между двумя признаками.

Найдя частные производные указанной суммы по и , и, приравняв их нулю, получим систему нормальных уравнений при линейной парной регрессии:

где - объем исследуемой совокупности.

Решение этой системы дает параметры уравнения регрессии. Для нахождения параметров и при линейной зависимости могут использоваться готовые формулы:

;

Однако значения параметров и можно получить иначе. Если в системе нормальных уравнений каждое уравнение разделить на , то получим:

.

Теперь, зная значение , можно определить второй параметр уравнений регрессии:

Если связь выражена параболой, то для отыскания параметров уравнения , и применяется система нормальных уравнений вида:

Решив систему, получим уравнение регрессии вида:

.

Оценка обратной зависимости признаков и может быть осуществлена на основе уравнения гиперболы. Тогда для нахождения параметров уравнения гиперболы применяется система нормальных уравнений вида:

Также коэффициент регрессии можно рассчитать с помощью линейного коэффициент корреляции по формуле:

.

Коэффициент регрессии применяется для определения коэффициента эластичности , который показывает, на сколько процентов изменится в среднем величина результативного признака при изменении факторного признака на 1 %.

Коэффициент эластичности определяется по формуле:

Для большинства форм связи коэффициент эластичности является переменной величиной, т.е. изменяется в соответствии с изменением значений фактора .

 



Поделиться:


Последнее изменение этой страницы: 2016-04-20; просмотров: 704; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.128.94.112 (0.007 с.)