Тема 5. О многофакторных регрессионных моделях сложных экономических систем 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Тема 5. О многофакторных регрессионных моделях сложных экономических систем



 

При исследовании сложных экономических систем строят многофакторные регрессионные модели, описывающие зависимость показателя Y от нескольких факторных переменных. Ниже приводятся основные типы моделей множественной регрессии:

1. Линейная:

y (x) = a 0 + a 1 x 1 + a 2 x 2 + … + akxk.

2. Степенная:

y (x) =

3. Показательная:

y(x) = exp(a0 + a1x1 + a2x2 + … + akxk).

4. Параболическая:

y (x) = a 0 + a 1 x 1 2 + a 2 x 2 2 + … + akxk 2.

5. Гиперболическая:

 

Здесь a 0, a 1, a 2,…, ak – коэффициенты регрессии, (x 1, x 2,…, xk) – значения факторных переменных X 1, X 2, …, Xk. Остановимся подробнее на модели 1 множественной линейной регрессии. В матричной форме линейная многофакторная модель 1 (с учетом случайных ошибок наблюдений – остатков) имеет вид:. При этом предполагается, что компоненты случайного вектора имеют нормальный закон распределения и математическое ожидание, равное нулю. Здесь:

 

y 1

y 2 – вектор-столбец значений

... зависимого признака Y;

yn

      a 0 a 1 – вектор-столбец … регрессионных коэффициентов; an  

 

 

 

1 x 11 x 12 … x 1 k

X = 1 x 21 x 22 … x 2 k – матрица,

… … … … …

1 xn 1 xn 2 … xnk

 

столбцы которой, начиная со второго, соответствуют значениям факторных переменных X 1, X 2, …, Xk, номер строки соответствует номеру объекта наблюдения. Как и в случае линейной модели парной регрессии (согласно МНК) строят систему нормальных уравнений (аналогичную системе (9)). Решение этой системы – вектор оценок регрессионных коэффициентов – представляют в виде:

,

где XT – матрица, полученная транспонированием матрицы X; (XTX)-1 – матрица, обратная к матрице XTX. После вычисления по формуле (10) значений регрессионных коэффициентов получают уравнение регрессии модели 1. Значимость регрессионной модели проверяют по F -критерию Фишера [8, с. 298]. Для этого вычисляют, где;. Значение F набл. определяет качество регрессионной модели, чем больше число F набл., тем лучше модель описывает зависимость результативного признака Y от факторных переменных.

Если F набл. > F кр. (α, υ1, υ2), уравнение считается значимым и регрессионная модель признается адекватной экспериментальным данным при уровне значимости α с υ1= k и υ2= n - k -1 степенями свободы. Значимость отдельных коэффициентов регрессии можно проверить по t -критерию Стьюдента. Для этого вычисляют эмпирическую значимость коэффициента ai (i =0,1,…, k) модели:, где – дисперсия соответствующего регрессионного коэффициента. Значение (i =0,1,…, k) находятся на главной диагонали ковариационной матрицы [7, с. 210]:, где – несмещенная оценка остаточной дисперсии. По таблице t -распределения Стьюдента находят t крит. (α, υ) для заданного уровня значимости α и числа степеней свободы υ= n - k -1. Если, соответствующий коэффициент регрессии признается значимым.

При наличии незначимых коэффициентов регрессии в линейной многофакторной модели, как правило, в дальнейшем исследовании используют методы пошаговой регрессии. Пошаговая регрессия позволяет из исходных факторных переменных X 1, X 2,…, Xk производить отбор тех независимых переменных, которые наиболее значимы для адекватного представления данных. Рассмотрим два вида процедуры отбора факторных переменных: включение переменных и исключение переменных. При методе последовательного включения вначале в модель вводится та факторная переменная, которая имеет наибольший коэффициент корреляции с зависимой переменной Y. На каждом очередном шаге в модель включается та переменная Xi, которая имеет наибольший частичный коэффициент корреляции:, где Ri 2 – коэффициент детерминации, который вычисляется, когда все независимые переменные, за исключением i -ой, присутствуют в модели. Большое изменение R 2 указывает на то, что данная переменная дает уникальную информацию о результативной переменной и ее нужно включить в уравнение регрессии.

Процесс прекращается, когда ни одна из оставшихся переменных не обеспечивает заданное минимальное значение статистики Фишера, или F -значение включения, либо, когда значение толерантности меньше заданного уровня. Число T =1Ri 2 – есть толерантность, которая показывает меру изменчивости регрессионных коэффициентов, не объясняемую другими переменными. Малое значение T означает высокую степень коррелированности i -ой независимой переменной с другими независимыми переменными и в то же время большую стандартную ошибку в оцениваемом регрессионном коэффициенте ai.

Метод последовательного исключения состоит в удалении на очередном шаге из полного набора факторных переменных той переменной, которая имеет наименьший частичный коэффициент корреляции. Процесс прекращения, когда предназначенная для удаления переменная дает статистику Фишера – F -значение больше выбранного уровня. Статистика F относится к проверке нулевой гипотезы того, что удаление очередной переменной из модели не приводит к значимому изменению коэффициента множественной корреляции R. В конечном итоге с помощью процедуры отбора переменных формируется модель множественной линейной регрессии, значимая для описания исходных данных.

Коэффициенты моделей линейной регрессии характеризуются определенной устойчивостью по отношению к изменению исходных данных. Влияние изменения факторных переменных X 1 и X 2 и зависимой переменной Y на регрессионные коэффициенты приводится в [1, с. 254] для случая двухфакторной линейной модели.

Рассмотрим статистические данные о деятельности одной из компаний (данные условные). Поставим задачу изучения зависимости объема реализации товара (Y, млн.руб.) от факторных переменных: Х1 – затрат на рекламу (тыс.руб.), Х2 – индекса потребительских расходов (%), Х3 – цены товара (руб.).

 

 

Таблица 3

Статистические данные деятельности компании

 

Месяц Х1 Х2 Х3 Y
1 5,1 100 25,1 226
2 5,8 98,6 24,9 237
3 4,8 102,2 25,2 248
4 9,7 104,5 24,8 291
5 9,2 110,1 23,4 374
6 10,7 120,2 20,1 470
7 24,7 123,4 19,9 535
8 28,7 125,5 19,8 546
9 29,6 110,3 23,4 466
10 20,6 115,2 22,9 465
11 9,5 110,7 24,9 421
12 7,5 109,4 25,5 407
13 22,6 112,8 21,1 431
14 20,5 115,7 19,5 445
15 25,8 122,3 19,1 464
16 21,7 128,6 18,7 484
17 30,7 130,5 17,6 556

 

На основании данных, содержащихся в таблице 3, построим матрицу коэффициентов парной корреляции:

.

Анализ матрицы R показывает, что результативный показатель Y (объем реализации) имеет тесную связь с расходами на рекламу (ryx1=0,835) с индексом потребительских расходов (ryx2=0,919) и с ценой товара – обратную связь (ryx3=-0,787). Но факторные переменные Х1 и Х2 также тесно связаны с фактором Х3. Поэтому, чтобы из множества факторных переменных произвести отбор тех факторов, которые наиболее значимы для адекватного представления исходных данных, применим процедуру пошаговой регрессии (метод последовательного включения). На последнем шаге процедуры была сформирована модель множественной линейной регрессии, включающая только две переменные – Х1 и Х2:. Статистические характеристики модели регрессии следующие: R 2 =0,88; F =53,04; σ2ост=38,75. Таким образом, коэффициент детерминации указывает на сильную зависимость объема реализации от затрат на рекламу и индекса потребительских расходов. Данное уравнение регрессии является статистически значимым по F -критерию; коэффициенты модели являются эмпирически значимыми по t -критерию Стьюдента.

Модель множественной линейной регрессии позволяет оценить влияние факторных переменных на вариацию результативного показателя Y, что достигается расчетом β-коэффициентов модели по формуле [3, с. 230]:

(11),

где σ i – среднее квадратичное отклонение факторной переменной Xi (i =1,2,…, k), σ y – отклонение зависимой переменной Y. Числа β i 2 (i =1,2,…, k) показывают самостоятельный взнос каждого показателя Xi в вариацию результативного показателя Y. Таким образом, β -коэффициенты модели являются своего рода индикаторами относительной важности факторных переменных. Величина η= R 2 –(β 1 2 +…+ βk 2) составляет так называемый системный эффект модели, обусловленный взаимосвязями факторных переменных. В рассматриваемом примере β 1 =3,4997∙9,4033/106,16=0,3099; β 2 =7,3434∙9,8186/106,16=0,6792. Коэффициент β 1 показывает, что при увеличении затрат на рекламу на 9,4033 тыс.руб. объем реализации увеличится примерно на 33 тыс.руб. (0,3099∙106,16); β 2 показывает, что при росте индекса потребительских расходов на 9,82% объем реализации увеличится примерно на 72 тыс.руб. (0,6792∙106,16). Число β 1 2 =0,10 показывает, что вклад показателя Х1 в вариацию объемов реализации Y составляет около 10%; число β 2 2 =0,46 показывает, что вклад показателя Х2 в вариацию Y больший и составляет 46%.

Отметим, что свободный член a 0 в уравнении регрессии отражает усредненное влияние факторов, не привлеченных к исследованию, и частичное влияние учтенных факторных признаков, которое зависит от тесноты их связи с неучтенными факторами. Правильный научно обоснованный анализ многофакторной линейной модели, дополненный экономическим содержанием, имеет большое практическое значение в исследовании различных сфер финансовой деятельности.

 



Поделиться:


Последнее изменение этой страницы: 2021-01-08; просмотров: 67; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.118.140.108 (0.009 с.)