Y - зависимая переменная (результативный признак), 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Y - зависимая переменная (результативный признак),



x1, x2,..., хm – независимые, объясняющие, переменные (признак-факторы),

ε - возмущение или стохастическая переменная, включающая влияние неучтенных в модели факторов.

Основные типы функций, используемые при количественной оценке связей:

Линейная функция: y=a01 x1 2 x2 +,..., +аm хm;

Параметры а1 , а2,… аm называются коэффициентами «чистой» регрессии и характеризуют среднее изменение результата с изменением соответствующего фактора на единицу при неизменном значении других факторов, закрепленных на среднем уровне.

Нелинейные функции: y=a x1b1x2b2 ... хm b m –степенная функция;

b1,b2,…,bm - коэффициенты эластичности; показывают на сколько % изменится в среднем результат при изменении соответствующего фактора на 1% и при неизменности действия других факторов.

Обозначим:

X - прямоугольная матрица наблюдений независимых переменных размерностью n (n - число наблюдений) на (m +1) - число оцениваемых коэффициентов, включая свободный член.

- вектор наблюденных значений зависимой переменной размерностью n.

- вектор искомых оценок коэффициентов регрессии размерностью (m + 1).

Для нахождения МНК – оценок коэффициентов регрессии, как и прежде, минимизируют остаточную сумму квадратов:

Истинное значение коэффициента регрессии отличается от его оценки. Может иметь место случай, когда оценка отличается от нуля, хотя истинное значение коэффициента равно нулю. В этом случае xi не влияет на выход, а про коэффициент bi говорят, что он незначимо отличается от нуля. Незначимые коэффициенты исключают из уравнения регрессии, а оставшиеся оценки пересчитывают.

Сводка формул для множественной регрессии:

Оценка коэффициента множественной детерминации

где ∆ и ∆1 – определители матрицы парных коэффициентов корреляции и расширенной матрицы парных коэффициентов корреляции.

.

F – критерий значимости уравнения в целом

t – критерий значимости коэффициентов регрессии

 

После определения точечных оценок коэффициентов теоретического уравнения регрессии могут быть рассчитаны интервальные оценки коэффициентов. Доверительный интервал, накрывающий с доверительной вероятностью =1−α неизвестное значение параметра , определяется неравенством

Здесь

Проще всего провести построение множественной регрессии с помощью с помощью инструмента анализа данных Регрессия. Для этого выполняют команду Сервис-Анализ данных-Регрессия-OK.

 

Задание 1. В табл. 4.1 приведены данные за 11 дней о курсе доллара (x1 руб.), фондовом индексе (x2) и котировке акций (y, ден. ед.).

 

 

Таблица 4.1

Требуется:

1) построить уравнение множественной линейной регрессии и дать экономическую интерпретацию коэффициентов уравнения;

2) оценить стандартную ошибку регрессии и стандартные ошибки коэффициентов;

3) построить доверительные интервалы для коэффициентов регрессии, соответствующие доверительной вероятности ;

4) оценить статистическую значимость коэффициентов регрессии с помощью t -критерия при уровне значимости ;

5) оценить на уровне 0,05 полученное уравнение на основе коэффициента детерминации и F - критерия Фишера;

6) сделать выводы по качеству построенной модели.

Метод исключения в проверке спецификации модели

При выборе формы спецификации модели первоначально рассматривается уравнение множественной линейной регрессии

y = β0 + β1x1 + β2x2 + …+ βnxn + ε (1)

Для перехода к адекватной форме модели далее применяется алгоритм пошагового регрессионного анализа методом исключения переменных. При этом выполняются следующие действия:

· строится регрессионная модель методом наименьших квадратов;

· оценивается значимость коэффициентов регрессии;

· выявляется наличие зависимости между факторными признаками путем анализа матрицы парных коэффициентов корреляции и матрицы частных коэффициентов корреляции;

· строится новое уравнение регрессии с исключением незначимых и части взаимно коррелирующих переменных. При этом из числа коррелирующих переменных в модели оставляют те, которые более соответствуют ее экономическому содержанию, либо те, которые имеют наибольшее значение частной корреляции с зависимой переменной.

Задание 2.

Имеются следующие данные по 20 сельскохозяйственным районам:

Y – урожайность зерновых культур (ц/га);

X1 – число колесных тракторов (приведенной мощности) на 100 га;

X2 – число зерноуборочных комбайнов на 100 га;

X3 – число орудий поверхностной обработки почвы на 100 га;

X4 – количество удобрений, расходуемых на гектар;

X5 – количество химических средств оздоровления растений, расходуемых на гектар.

Требуется провести пошаговый регрессионный анализ урожайности Y на основе исходных данных (табл. 1)

Таблица 1

Исходные данные

 

Y X1 X2 X3 X4 X5
  9.7 1.59 0.26 2.05 0.32 0.14
  8.4 0.34 0.28 0.46 0.59 0.66
  9.0 2.53 0.31 2.46 0.3 0.31
  9.9 4.63 0.4 6.44 0.43 0.59
  9.6 2.16 0.26 2.16 0.39 0.16
  8.6 2.16 0.3 2.69 0.32 0.17
  12.5 0.68 0.29 0.73 0.42 0.23
  7.6 0.35 0.26 0.42 0.21 0.08
  6.9 0.52 0.24 0.49 0.2 0.08
  13.5 3.42 0.31 3.02 1.37 0.73
  9.7 1.78 0.3 3.19 0.73 0.17
  10.7 2.40 0.32 3.3 0.25 0.14
  12.1 9.36 0.4 11.51 0.39 0.38
  9.7 1.72 0.28 2.26 0.82 0.17
  1.0 0.59 0.29 0.6 0.13 0.35
  7.2 0.28 0.26 0.3 0.09 0.15
  8.2 1.64 0.29 1.44 0.2 0.08
  8.4 0.09 0.22 0.05 0.43 0.2
  13.1 0.08 0.25 0.03 0.73 0.2
  8.7 1.36 0.26 1.17 0.99 0.42

 

Указание: для окончательного выбора модели воспользуйтесь критерием Фишера в отношении коэффициентов сравниваемых спецификаций. Для этого рассчитывают статистику

Здесь используются коэффициенты детерминации из регрессии первоначальной (неогр) и регрессии с исключенными переменными (огр), причем q – число исключений, n – число наблюдений, p – число факторов в исходной регрессии. Находят табличное (критическое) значение F табл со степенями свободы q и n - p – 1. Если F факт > F табл, то нулевая гипотеза отклоняется в пользу альтернативной: имеющиеся данные противоречат гипотезе об эквивалентности моделей.

 

 

2-й учебный вопрос. Основы обработки данных в GRETL

Подготовка данных в Excel для импорта в GRETL

Создайте новую рабочую книгу Excel. Убедитесь, что все импортируемые данные расположены на одном листе с названием без символов кириллицы или со стандартным названием (Лист1 для русифицированной версии Excel). Данные должны быть размещены в столбцах (или строках) без пропусков ячеек. Не допускайте также объединения ячеек импортируемого столбца (строки).

В первой ячейке столбца (строки) укажите имя переменной (без символов кириллицы), которое понадобится для импорта данного столбца (строки) в G RETL. Желательно сразу указывать такие имена рядов данных, по которым можно будет легко идентифицировать импортируемую переменную в дальнейшем при работе с ней в GRETL.

Установите формат импортируемых ячеек на «Общий», проверьте отсутствие нечисловых значений в ячейках: текста, значений со знаком процента «%» и т.п.

Сохраните рабочую книгу Excel в формате Excel с именем файла без символов кириллицы.



Поделиться:


Последнее изменение этой страницы: 2016-12-17; просмотров: 346; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.147.103.202 (0.011 с.)