Тема 13. Елементи теорії регресії 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Тема 13. Елементи теорії регресії



 

Мета роботи: навчитися з’ясовувати існування залежності між двома або декількома статистичними ознаками, вміти описати її рівнянням, розуміти зміст параметрів в рівнянні регресії.

План вивчення теми 1. Рівняння лінійної парної регресії.

2. Визначення параметрів b*, b*. 3. Властивості b*, b*.

4. Множинна регресія.

 

77
 
 
 
 


 

 

Методичні рекомендації до самостійної роботи

 

 

Рівняння лінійної парної регресії

 

Нехай між змінними Х та Y теоретично існує певна лінійна залежність. Це твердження може ґрунтуватися на тій підставі, наприклад, що кореляційне поле для пар (xi; yi) має такий вигляд як на рисунку.

Як бачимо, насправді між ознаками X і Y спостерігаєтьсянетакий тісний в'язок, як це передбачає функціональна залежність. Окремі спостережувані значення у, як правило, відхилятимуться від
b
x
y
x
М
 
соnst


Рис.1 Кореляційне поле


 

передбаченої лінійної залежності під

 

впливом випадкових збудників, які


 

здебільшого є невідомими. Відхилення від передбаченої лінійної форми зв'язку можуть статися внаслідок неправильної специфікації рівняння, тобто ще з самого початку неправильно вибране рівняння, що описує залежністьміж X і Y.

Будемо вважати, що специфікація рівняння вибрана правильно. Ураховуючивпливназначення Y збурювальнихвипадковихфакторів,

лінійнерівнянняізв'язку X і Y можнаподативтакомувигляді:

 


i = b0 + 1 i +e i,

 

де b0, b1 є невідомі параметри регресії, e i


 

(14.1)

 

є випадковою змінною, що


 

характеризує відхилення у від гіпотетичної теоретичної регресії.

 

Отже, в рівнянні (14.1) значення «yi» подається у вигляді суми

 

двох частин: систематичної b0 + b1 i і випадкової e i. Параметри b0, b, є невідомими величинами, а e i, є випадковою величиною, що має нормальний закон розподілу з числовими характеристиками: (e i) =0,

 

D(e i) = s i =. При цьому e i є некорельованими.

 

У результаті статистичних спостережень дослідник дістає

 

 


 

характеристики для незалежної змінної х і відповідні значення залежної змінної.

Отже, необхідно визначити параметри b0, b1. Але істинні значення цих параметрів дістати неможливо, оскільки ми користуємося

 

інформацією, здобутою від вибірки обмеженого обсягу. Тому знайдені значення параметрів будуть лише статистичними оцінками істинних (невідомих нам) параметрів b0, b1. Ці оцінки позначимо b*, b*. Тоді моделі (14.1) відповідатиме статистична оцінка

yi = b*+ b* xi +e i. (14.2)

 

 

2. Визначення параметрів b*, b*

 

Якщо ми прийняли гіпотезу про лінійну форму зв'язку між

 

ознаками X і Y, тооднозначновибратипараметри b*,b*,якієточковими статистичними оцінками відповідно для параметрів b0,b,практично неможливо. І справді, через кореляційне поле (рис. 11) можна

 

провести безліч прямих. Тому необхідно вибрати такий критерій, за яким можназдійснитивибірпараметрівb*,b*.

Напрактицінайчастішепараметри b*, b* визначаютьсязаметодом найменших квадратів, розробка якого належить К.Гауссу і П.Лапласу. Цей метод почали широко застосовувати в економіко-статистичних обчисленнях, відколи була створена теорія регресії.

Відповідно до цього методу рівняння лінійної парної регресії

 

* *

i 0 1 i, необхідно вибрати так, щоб сума квадратів відхилень

 

спостережуваних значень від лінії регресії була б мінімальною. З (14.2) знаходимо:

e i = yi − (b*+ b* xi). (14.3)

 

                                                                                               
   
у
 
   
 
 
 
 
   
 
 
 
 
   
 
 
 
 
   
 
 
 
 
   
 
 
   
 
 
 
 
   
 
 
 
 
   
b
 
b
   
=
   
+
 
y
         
x
 
 
   
 
 
 
 
   
b
   
 
 

Якбачимо,величинаe i єфункцієювідпараметрівb*,


 

*

1. Ці


 

 


 

параметри необхідно добирати так, щоб сума квадратів відхилень å(i)2буламінімальною:åe i)2= min.

Позначивши å(i)2=q(b0,b),розглянемонеобхіднуумовуіснування мінімуму функції q(b0, 1):

 

 

ï¶q(b0,b) =0,

 

í¶q(b0,b) =0. (14.4)î 0

 

 

З (14.4) знаходимо b* = y − b* x;

 

b*= Kxy. x

 

Парний коефіцієнт кореляції визначається як

 

 

Kxyxy

x y

 

 

Основна властивість парного коефіцієнта кореляції: 0< r <1.

 

3. Властивості b*, b*

 

* *

Статистичні оцінки параметрів парної функції регресії 0, 1є незміщенимиоцінкамипараметрівb0,b,дійсно:

 

M (b0) = b0, M (1) = 1.

 

 

Множинна регресія

 

Визначення та кількісна оцінка взаємозв'язку між двома статистичними ознаками за допомогою парної кореляції є дійовим

 

 

80
e
(
e
 
b
ì
 
b
ï
 
ï
 
ï
b
 
 
 
s
 
=
r
.
s s
xy
 
 
b b
 
b
b
*
*


 

засобом статистичного аналізу. Проте соціально-економічні процеси та явища формуються під впливом не одного, а багатьох факторів. Наприклад, на урожайність сільськогосподарських культур впливають метеорологічні умови, кількість унесених добрив, сорт, строки сівби тощо. Продуктивність тварин залежить від рівня та якості годівлі, породи, способів утримання тварин, процесів відтворення стада тощо.

Кореляцію, за допомогою якої вивчається вплив на результативну ознаку двох та більше взаємозв'язаних факторних ознак, називають множинною. При вивченні множинної кореляції можна застосовувати як прямолінійні, так і криволінійні рівняння регресії.

Багатофакторні регресійні моделі дають змогу оцінювати вплив на досліджувану результативну ознаку кожного окремого із включених у рівняння факторів при фіксованому значенні (на середньому рівні) інших факторів. При цьому важливою умовою множинної кореляції є відсутність функціонального зв'язку між факторами.

Важливе значення при множинній кореляції має вибір форми зв'язку та відповідного математичного рівняння множинної регресії. Вибір типу функції має ґрунтуватися на теоретичному аналізі досліджуваного явища або на досвіді попередніх аналогічних досліджень. Ураховуючи, що будь-яку функцію багатьох змінних можна звести до лінійного типу логарифмуванням, рівняння множинної регресії частіше будують у лінійній формі.

Формула лінійного рівняння множинної регресії має такий вигляд:

 

yx = a 0 11+ a 2 x 2+...+ anxn.

 

 

Окремі коефіцієнти регресії цього рівняння характеризують вплив відповідного фактора на результативний показник при фіксованому (елімінованому) значенні інших факторів. Вони показують, наскільки змінюється результативний показник при зміні

 

81
+ a
x


 

відповідного фактора на одиницю. Вільний член рівняння (a 0) не має економічного змісту та не інтерпретується.

Параметри рівняння множинної регресії обчислюють за методом найменших квадратів.

 

Питання для самоконтролю

 

1. Дати визначення статистичної залежності між ознаками X та Y. 2. Що означає кореляційна залежність між ознаками X та Y?

3. Записати модель парної лінійної регресії? 4.Чомудорівнюєb∗,b∗?

 

5. Які числові характеристики дляb∗, b∗?

 

6. Який закон розподілу ймовірностей мають випадкові величиниb∗,b∗дляпарноїлінійноїрегресії?

 

7. Який закон розподілу ймовірностей мають випадкові величиниb∗+b∗ xi?

 

Література

 

 

Обов’язкова: [1]. Додаткова:[1], [4], [7].

 

 



Поделиться:


Последнее изменение этой страницы: 2016-08-12; просмотров: 196; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.145.93.210 (0.046 с.)