Множественная линейная корреляционная зависимость 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Множественная линейная корреляционная зависимость

Поиск

Рассмотрим отбор факторов для построения множественной линейной зависимости, когда переменные у, х 1, х 2 ..., хp являются случайными величинами (обычно предполагается, что их совместное распреде­ление нормальное).

Наиболее простой формой зависимости, достаточно строго обоснованной для случая совместного нормального распределения, является линейная зависимость, т.е. зависимость вида

У = а 0 + а 1 х 1 + а 2 х 2 +... + аpхр. (6.1)

Такая зависимость во многих случаях довольно хорошо отражает сложившиеся экономические взаимосвязи. Исходная информация для построения зависимости (6.1) обычно задается в виде некоторой таблицы.

Факторы, для которых получены данные
  x 1 x 2 x 3 xk y
  x 11 x 21 x 31 xk 1 y 1
  x 12 x 22 x 32 xk 2 y 2
  x 13 x 23 x 33 xk 3 y 3
N x 1 n x 2 n x 3 n xkn yn

 

Следует определить, все ли переменные следует включать в уравнение (5.1) или есть переменные, которые существенно не влияют на величину у и их нецелесообразно включать в (6.1). В первом случае р = k, во втором р < k.

Для решения этого вопроса часто используется таблица, составленная из коэффициентов парной корреляции. Элементами такой таблицы являются коэффициенты парной корреляции для всех k факторов.

Таблица имеет вид

  y x 1 x 2 x 3 xk
y   ryx 1 ryx 2 ryx 3 ryxx
x 1 rx 1 y   rx 1 x 2 rx 1 x 3 r x 1 xk
x 2 rx 2 y rx 2 x 1     r x 2 xk
x 3 rx 3 y rx 3 x 4 rx 3 x 2   r x 3 xk
xk rxky rxk x 1 rxk x 2  

 

В клетках таблицы записаны парные коэффициенты корреляции, например, r 31 — парный коэффициент корреляции между переменными х 3 и х 1и др. Коэффициенты rij и rji ;, а также rxiy и ryxi совпадают, так как теснота связи между переменными у и хi такая же, как между хi и у, аналогично, для хi и хj Поэтому таблицу записывают в упрощенной симметричной форме (треугольная форма).

 

  y x 1 x 2 x 3 xk
y   ryx 1 ryx 2 ryx 3 ryxx
x 1 -   ryx 2 rx 1 x 3 r x 1 xk
x 2 - -   rx 2 x 3 r x 2 xk
x 3 - - -   r x 3 xk
xk - - - -  

По данным такой таблицы можно примерно оценить, какие факторы существенно влияют на переменную у, а какие — несущественно, а также выявить взаимосвязь между факторами.

Пример 1.

Пусть получена таблица

  y —.. x 1 x 2 x 3
y   0,6 0,5 0,7
x 1 -   0,04 0,03
x 2 - -   0,1
x 3 - - -  

На основании указанных в таблице парных коэффициентов корреля­ции можно сделать вывод, что связь факторов х 1, х 2, х 3 с фактором у существенная (коэффициенты корреляции, соответственно, 0,6; 0,5; 0,7). Теснота связи между факторами х 1, х 2, х 3незначительная (коэф­фициенты корреляции 0,04, 0,03, 0,1).

Такая информация наиболее благоприятна для построения уравнения (6.1).

Если факторы-аргументы не являются случайными величинами, то коэффициенты корреляции не могут быть использованы при построении уравнения регрессии, так как они не могут быть интерпретированы как показатели тесноты связи.

Существенность вводимых факторов в случае линейной множественной регрессии может быть проверена одновременно с существенностью коэффициентов регрессии. Для проверки существенности вычисляется отношение

tiii, і=1,n, (6.2)

где аi - — коэффициент множественной регрессии; σi — среднее квадратическое отклонение этого коэффициента.

Если ti< tта6л, взятого по таблицам t -распределения Стьюдента, то с заданной вероятностью не отвергается гипотеза, что соответствующий коэффициент регрессии аi - в генеральной совокупности (который не известен и который нужно оценить по данным выборки) равняется нулю. При этом i-й фактор в таком случае признается несуществен­ным для построенного уравнения регрессии.

При проведении исследования может оказаться, что вычисленные значения t для нескольких факторов не превышают tтабл В этом случае несущественные факторы из уравнения регрессии исключаются поочередно, начиная с наименьшего по абсолютной величине t. Фактор, соответствующий минимальному значению t, изуравнения регрессии исключается, и заново решается система нормальных уравнений. За­тем вновь вычисляются значения t для всех оставшихся в уравнении коэффициентов, определяется минимальное значение t, которое со­поставляется с tтабл. Если окажется, что tmin. < tтабл,то фактор, имеющий tmin исключается.

Процесс исключения коэффициентов повторяется до тех пор, пока не будет выполняться соотношение tmin. ≥ tтабл. В этом случае все оставшиеся в уравнении факторы существенны.

Проводить исключение из уравнения регрессии одновременно несколько факторов, имеющих t < tтабл. нецелесообразно, так как после исключения одного несущественного фактора коэффициенты регрессии других факторов меняются и несущественные факторы после пересчета могут оказаться существенными.

Аналогичный подход осуществляется и при наличии корреляционной зависимости, но на последней стадии отбора существенных факторов. Проверка значимости уравнения регрессии осуществляется по крите­рию Фишера

F =σ 2 y / σ 2 ост

с числом степеней свободы υ 1= п – 1 и υ 2 = п -р -1,

где σ 2 y =Σ(yi –y)2/(n -1).

σ 2 ост. =Σ(yi –ŷi) 2/(n - p- 1).

ŷi значения у, полученные по данным наблюдений; уi — расчетные значения у, полученные для соответствующих значений х 1, х 2 ,..., хр.

Полученное значение F сравнивается с Fта6л при выбранном уровне значимости. Если окажется F> Fта6л, то гипотеза о том, что х 1, х 2 ,..., хр не имеют существенного влияния на у, отвергается.

Если F>Fта6л,, то следует ввести некоторые другие факторы, влияющие на показатель у, или перейти к построению нелинейной множественной регрессии.

Нелинейная регрессия

Между экономическими явлениями существуют нелинейные соотношения, они выражаются с помощью нелинейных функций.

Различают два класса нелинейных регрессий: регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по оцениваемым параметрам.

Примерами нелинейной регрессии по включаемым в нее объясняющим переменным являются следующие функции:

• полиномы разных степеней: у = а + bx + сх2 +е, y = а +bх+сх2 +dx3+e

• равносторонняя гипербола у = а + b/х + е.

К нелинейным регрессиям по оцениваемым параметрам относятся функции:

• степенная у = аxbе;

• показательная у = аbхе;

• экспоненциальная у = еа + bхе.

Во всех приведенных выше и далее регрессиях слагаемое и сомножитель е означает ошибку (погрешность) регрессии случайной величины х на случайную величину у.

Нелинейная регрессия по включенным переменным (первого класса) определяется, как и в линейной регрессии, методом наименьших квадратов (МНК), так как эти функции линейны по параметрам. Например, в параболе второй степени, которую запишем в виде

у =а0 + а 1 х + а 2 х 2 + е,

заменяя переменные х = х 1, х 2 = х2, получим двухфакторное уравнение линейной регрессии:

у =а0 + а 1 х + а 2 х 2 + е,

для оценки параметров которого используется МНК.

Соответственно, для полинома третьего порядка

у =а0 + а 1 х + а 2 х 2 + а 3 х 3 + е,

при замене х = х 1, х 2 = х 2, х 3 = х 3получим трехфакторную модель ли­нейной регрессии вида

у =а0 + а 1 х + а 2 х 2 + а 2 х 2 + е,

и т. д.

Таким образом, полином любого порядка сводится к линейной регрессии с ее методами оценивания параметров и проверки гипотез. В экономических исследованиях чаще всего используется парабола второй степени; в отдельных случаях — полином третьего порядка.

Применение МНК для оценки параметров параболы второй степени приводит к следующей системе нормальных уравнений:

{
na 0 + a 1 Σ x +a 2 Σ x 2 = Σ y,

a 0 Σ x + a 1 Σ x 2 + a 2 Σ x 3 = Σ xy

a 0 Σ x 2 + a 1 Σ x 3 + a 2 Σ x 4 = Σ x 2 y

 

Система содержит 3 уравнения с 3 неизвестными коэффициентами а 0, а 1, а 2и ее решение может быть произведено по формулам Крамера.

Парабола второй степени при b > 0 и с < 0 симметрична относительно высшей точки, т. е. точки максимума, изменяющей направление связи, а именно, рост на падение. Такого рода функцию можно наблюдать в экономике труда при изучении зависимости заработной платы работников физического труда от возраста — с увеличением возраста повышается заработная плата ввиду одновременного увеличения опыта и повышения квалификации работника. Однако с определенного момента из-за старения организма и снижения производительности труда дальнейшее повышение возраста может приводить к снижению заработной платы работника.

При b < 0 и с > 0 парабола второго порядка симметрична относитель­но своей низшей точки, что позволяет определять минимум функции в точке, меняющей направление связи, т. е. снижение на рост.

Из-за симметричности кривой парабола второй степени далеко не всегда пригодна в конкретных исследованиях, чаще имеют дело лишь с отдельными сегментами параболы.

К классу нелинейных функций, параметры которых оцениваются МНК, следует отнести равностороннюю гиперболу:

у = а + b/х + е. (6.3)

Она может быть использована на микро- и макроуровне, например, для характеристики связи удельных расходов сырья, материалов, топлива с объемом выпускаемой продукции, зависимости времени обращения товаров от величины товарооборота. Классическим ее примером является кривая Филлипса, английского экономиста, характеризующая соотношение между нормой безработицы и процентом прироста заработной платы.

Для равносторонней гиперболы (6.3) обозначим z = 1 /х, тогда полу­чим линейное уравнение регрессии

у = а + b z + е,

{
оценка параметров которого может быть определена МНК. Система нормальных уравнений составит:

Σ y = na + b Σ 1 /x

Σ y/x = a Σ 1 /x + b Σ 1 /x 2

При b > 0 имеем обратную зависимость, которая при х→ ∞характеризуется нижней асимптотой.

При b < О имеем медленно возрастающую функцию с верхней асимптотой при х→∞.

Примером такой зависимости может служить взаимосвязь доли расходов на товары длительного пользования и общих сумм расходов (или доходов). Математическое описание подобного рода взаимосвя­зей получило название кривых Энгеля. В 1857 г. немецкий статистик Э. Энгель на основе исследования семейных расходов сформулировал закономерность — с ростом дохода доля доходов, расходуемых на продовольствие, уменьшается. Соответственно, с увеличением дохода доля доходов, расходуемых на непродовольственные товары, будет возрастать. Однако это увеличение не беспредельно, ибо сумма долей, расходуемых на все товары, не может быть больше единицы.

Рассмотрим регрессию, нелинейную по оцениваемым параметрам (второго класса). Данный класс нелинейных моделей подразделяется на два типа: нелинейные модели внутренне линейные и нелинейные модели внутренне нелинейные. Если нелинейная модель внутренне линейна, то она с помощью соответствующих преобразований может быть приведена к линейному виду. Если же нелинейная модель внутренне нелинейна, то она не может быть сведена к линейной функции. Например, в эконометрических исследованиях при изучении эластичности спроса от цен широко используется степенная функция:

y=а ∙ xb∙e,

где у — объем спроса; х — цена; е — случайная ошибка.

Модель нелинейна относительно оцениваемых параметров, так как включает параметры а и b неаддитивно. Однако ее можно считать внутренне линейной, так как логарифмирование данного уравнения приводит его к линейному виду:

ln у= ln а + b ln х + ln е.

{
Оценки параметров а и b уравнения (16.9) могут быть найдены МНК. Система нормальных уравнений имеет вид

Σ ln y = n ln a + b Σ ln x,

Σ ln y ln x = ln a Σ ln x + b Σ (ln x)2.

Параметр b определяется из системы, а параметр а — потенцированием выражения ln а.

При этом предполагается, что случайная ошибка е функции (16.9) мультипликативно связана с объясняющей переменной x. Если же модель представить в виде

у = а хb + е,

то она становится внутренне нелинейной, так как ее невозможно пре­вратить в линейный вид.

К внутренне нелинейным относятся модели вида

y = а + bхc + е,

y = а [1 - 1 / (1 - xb)] + е.

Эти уравнения не могут быть преобразованы в уравнения линейные по коэффициентам.

Если модель внутренне нелинейна по параметрам, то для оценки параметров используются итеративные процедуры, успешность которых зависит от вида уравнений и особенностей применяемого итеративного подхода. Модели внутренне нелинейные по параметрам могут использоваться в эконометрических исследованиях. Однако гораздо большее распространение получили модели, приводимые к линейному виду. Решение такого типа моделей реализовано в стандартных пакетах прикладных программ.

Из нелинейных функций, которые могут быть приведены к линейному виду, в качестве нелинейной регрессии широко используется степенная функция ух = аxb. Это объясняется тем, что параметр b в ней является коэффициентом эластичности, показывающим, на сколько процентов изменится в среднем результат, если фактор изменится на 1 %. Коэффициент эластичности (Э) в качестве нелинейной регрес­сии вычисляется по формуле

Э= ƒ´(х) ∙х/y,

Где f’(х) — первая производная функции.

Коэффициент эластичности можно определять и при наличии других форм связи, но только для степенной функции он представляет собой постоянную величину, равную параметру b. В других функциях коэффициент эластичности зависит от значений фактора х. Например, для линейной регрессии у = а + b∙х имеем:

f’(х)=b, Э = b∙x/(a+b∙x).

В силу того, что коэффициент эластичности для линейной функции не является величиной постоянной, а зависит от соответствующего значения х, то обычно рассчитывается средний показатель эластичности

Э = b∙x/у.

Несмотря на широкое использование в экономике коэффициентов эластичности, возможны случаи, когда их расчет экономического смысла не имеет. Это происходит тогда, когда для рассматриваемых признаков бессмысленно определение изменения значений в процентах. Например, вряд ли кто будет определять, на сколько процентов изменится урожайность пшеницы, если качество почвы, измеряемое в баллах, изменится на 1 %. В такой ситуации степенная функция, даже если она оказывается наилучшей по формальным соображениям (исходя из наименьшего значения остаточной вариации), не может быть экономически интерпретирована.

В моделях нелинейных по оцениваемым параметрам, но приводимых к линейному виду МНК применяется к преобразованным уравнениям. Если в линейной модели и моделях нелинейных по переменным при оценке параметров исходят из критерия Σ(у - ух) 2→ min, то в моделях нелинейных по оцениваемым параметрам требование МНК применяется не к исходным данным результативного признака, а к их преобразованным величинам ln y, 1 /х. Это значит, что оценка пара­метров основывается на минимизации суммы квадратов отклонений в логарифмах. Вследствие этого оценка параметров для линеаризуемых функций МНК оказывается несколько смещенной.

Практическое применение некоторых нелинейных регрессий, например экспоненты, возможно, если результативный признак не имеет отрицательных значений. Поэтому если исследуется, например, финансовый результат деятельности предприятий, среди которых наряду с прибыльными есть и убыточные, то данная функция не может быть использована.

 

ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ:

1.Какие классы нелинейных регрессий различают между экономическими явлениями?

2. Какие функции относятся к нелинейным регрессиям по оцениваемым параметрам?

3. Как определяется средний показатель эластичности?

4. Как осуществляется отбор наиболее значимых факторов при составлении математических моделей экономических процессов?



Поделиться:


Последнее изменение этой страницы: 2016-08-12; просмотров: 353; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.116.80.252 (0.011 с.)