Методические указания к выполнению работы 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Методические указания к выполнению работы



Краткая справка

Парной регрессией называется уравнение связи двух переменных y и x вида y = f (x), где y – зависимая переменная, функция; x –независимая переменная, аргумент. Различают линейные и нелинейные регрессии.

Линейная регрессия описывается уравнением ŷ x = a + b · x.

Среди нелинейных регрессийнаиболее часто применяются следующие модели:

- гиперболическая ŷ x = a + b / x;

- полиномиальная ŷ x = a + b · x + с · x 2;

- показательная    ŷ x = a · bx;

- степенная           ŷ x = a · xb;

- экспоненциальная ŷ x = a · е bx;

- логарифмическая ŷ x = a + b ·ln x и др.

Построение уравнения регрессии. По имеющимся данным n наблюдений за совместным изменением двух параметров x и y {(xi, yi), i =1,2,…, n } необходимо определить аналитическую зависимость ŷ x = f (x), наилучшим образом описывающую данные наблюдений.

Построение уравнения регрессии осуществляется в два этапа:

- спецификация модели (определение вида аналитической зависимости ŷ x = f (x));

- оценка параметров выбранной модели.

Спецификация модели. Парная регрессия применяется, если имеется доминирующий фактор, который и используется в качестве аргумента x в уравнении связи y = f (x).

Применяется три основных метода выбора аналитической зависимости:

- графический (на основе анализа поля корреляций);

- аналитический, т.е. исходя из теории изучаемой взаимосвязи;

- экспериментальный, т.е. путём сравнения средней ошибки аппроксимации Ā, рассчитанной для различных моделей регрессии (метод перебора).

Оценка параметров модели.  Для оценки параметров регрессий (a, b и c) используется метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений функции y от теоретических значений ŷ x при тех же значениях аргумента x минимальна, т.е.

Оценка тесноты связи. Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции rxy для линейной регрессии
(-1 £ rxy £ 1) и индекс корреляции ρ xy для нелинейной регрессии (0 £ ρ xy £ 1). Коэффициент парной корреляции rxy вычисляется по формуле 

,

где  средние значения (функция Excel: =СРЗНАЧ(<диапазон>));

среднеквадратические отклонения (функция Excel:
=СТАНДОТКЛОН(<диапазон>)).

Индекс корреляции ρ xy вычисляется по формуле

.

Долю дисперсии, объясняемую регрессией, в общей дисперсии переменной y характеризует коэффициент детерминации (для линейной регрессии) и индекс детерминации  (для нелинейной регрессии).

Коэффициент детерминации – квадрат коэффициента или индекса корреляции.Для оценки качества построенной модели регрессии можно использовать показатель (коэффициент, индекс) детерминации R 2 либо среднюю ошибку аппроксимации .

Средняя ошибка аппроксимации – среднее относительное отклонение расчётных значений от фактических. Чем выше показатель детерминации или чем ниже средняя ошибка аппроксимации, тем лучше модель описывает исходные данные.

Построенное уравнение регрессии считается удовлетворительным, если значение  не превышает 10-12%.

Оценка значимости уравнения регрессии. Оценка значимости всего уравнения регрессии в целом осуществляется с помощью F-критерия Фишера.

F -критерий Фишера заключается в проверке гипотезы Н0о статистической незначимости  уравнения регрессии. Для этого выполняется сравнение фактического F факт и критического (табличного) F maзначений F -критерия Фишера. F факт определяется по следующей формуле

где п - число измерений; т - число параметров при переменных.Для линейной регрессии т = 1.Для нелинейной регрессии вместо  используется R 2.

F ma-максимально возможное значение критерия под влиянием случайных факторов при степенях свободы k 1 = т, k 2 = п - т - 1 (для линейной регрессии т = 1) и уровне значимости α.

Определяется функцией Excel: =FРАСПОБР(α; k 1; k 2).

Уровень значимости α - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно величина α принимается равной 0,05 или 0,01.

Если F ma< F факт, то H 0 -гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F ma> F факт, то гипотеза Н0 не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.

 

Пример выполнения работы

Построить уравнение регрессии между выходной толщиной h 1 и входной толщиной h 0 холоднокатаной полосы. Значения толщин x = h 0 и y = h 1 даны в таблице 2.

Регрессионный анализ в Excel невероятно прост. Как только данные представлены в графическом виде, регрессия выполняется с помощью нескольких щелчков мыши, поэтому регрессия с использованием прямой часто применяется, несмотря на то, что зависимость между переменными не линейная, а более сложная.

Сформулируем практическое правило: всегда следует строить диаграмму, на которой представлена кривая регрессии и данные, чтобы можно было визуально оценить степень совпадения. В том случае, когда регрессия проводится с помощью линии тренда, кривая регрессии автоматически добавляется на диаграмму с соответствующими данными.

Таблица 2

xi ·10-2 71 78 84 92 87 85 86 91 93 93 90 85 81 80 78 84 82 85 82 80
yi ·10-2 46 50 54 54 52 50 49 53 57 59 56 53 50 48 50 54 55 55 54 54

 

1. Подготовьте начальный рабочий лист с исходными данными (рис. 32), постройте точечную диаграмму.

2. При построении на диаграмме линии тренда Excel автоматически находит значения коэффициентов a и b, а также квадрат коэффициента корреляции (достоверность аппроксимации) R2.

3. Уравнение линии тренда и значение R2 по умолчанию на диаграмме не отображаются. Чтобы отобразить эту информацию, следует в нижней части диалога Параметры линии тренда поставить флажки в параметрах:

þ показывать уравнение на диаграмме;

þ поместить на диаграмме величину достоверности аппроксимации (R2).

Рис. 32. Исходные данные и точечная диаграмма

 

4. Щелкните правой кнопкой мыши на любом из маркеров данных и вконтекстном меню выберите команду Добавить линию тренда... (рис. 33).

Рис. 33. Контекстное меню

 

5. В диалоговом окне Параметры линии тренда выберите тип диаграммы Линейная (рис. 34).

6. Отобразите уравнение кривой регрессии на диаграмме, и величину достоверности аппроксимации (R 2).

Рис. 34. Параметры линии тренда

7. Как видно из диаграммы (рис. 35), уравнение регрессии имеет вид

y = 0,4108· х + 18 с достоверностью аппроксимации R 2 = 0,5223.

Рис. 35. Линейная модель

8. Рассчитаем среднюю ошибку аппроксимации, предварительно сформировав в столбце С массив значений . Для этого введите следующие формулы:

в ячейку С2: = 0,4108*А2 + 18;

в ячейку D2: =ABS((B2 – D2)/B2 (рис. 36).

 

Рис. 36. Расчёт модельных значений и относительной ошибки

9. В ячейку D25 введите формулу: =1/20*D22*100 (рис. 37).


Получаем: R 2 = 0,5223,  = 3,53%. Построенное уравнение регрессии считается удовлетворительным, поскольку значение  не превышает 10-12%.

 

Рис. 37. Расчёт средней ошибки аппроксимации для линейной модели

 

10. Рассчитайте F факт и F табл. Для этого в ячейки D27 и D28 введитеследующие формулы:

D27: = КОРРЕЛ(A2:A21;B2:D21)^2/(1 -КОРРЕЛ(A2:A21;B2:D21)^2)*18;

D28: = FРАСПОБР(0,05;1;18). Получаем F факт=19,6809, F табл=4,413873.

Так как F ma< F факт, то H 0 - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность (рис. 37).

Поскольку идеальной аппроксимации соответствует величина R 2 = 1, можно сделать вывод, что прямая линия не описывает зависимости идеально. Нужно попытаться подобрать другую кривую регрессии, обладающую некоторой кривизной.

Рис. 38. Расчёт фактического и табличного значения F-критерия Фишера

 

11. Рассчитаем параметры полиномиальной и экспоненциальной модели. Результаты моделирования и расчётов приведены на рис. 39 и 40.

12. В ячейку G2 введите формулу: = - 0,0036*А2^2 + 1,0193*A2 - 7,3346.

Видно, что лучше всего экспериментальные данные описывает линейная зависимость, т.к. у линейной регрессии величина  минимальна.


Рис. 39. Параметры экспоненциальной аппроксимации

 

Рис. 40. Параметры параболической аппроксимации

Лабораторная работа № 16

Множественная регрессия

Задание

На основании данных для соответствующего варианта:

1. Отобрать значимые аргументы для построения уравнения регрессии.

2. Построить уравнение линейной регрессии.

3. Определить коэффициент множественной корреляции.

4. Проверить значимость уравнения при уровнях значимости 0,05 и 0,01.



Поделиться:


Последнее изменение этой страницы: 2021-04-04; просмотров: 130; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.144.98.13 (0.024 с.)