Методы корреляционного и регрессионного анализа 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Методы корреляционного и регрессионного анализа



 

Методы корреляционного и регрессионного анализов широко при-меняются для выявления и описания зависимостей между случайными величинами по экспериментальным данным и базируются на теории ве-роятности и математической статистике [1, 25].

 

Корреляционный анализ основывается на предпосылке о том,чтопеременные величины y (выходной параметр) и xi (факторы) являются случайными величинами и между ними может существовать так назы-ваемая корреляционная связь, при которой с изменением одной величи-ны изменяется распределение другой.

 

Для количественной оценки тесноты связи служит выборочный ко-эффициент корреляции.

 

Можно выделить три типа коэффициента корреляции:

 

1. Простой коэффициент корреляции, или коэффициент парной корреляции, определяет величину (тесноту) зависимости между двумя переменными (x или y) и определяется по формуле


 


    å (xi - x)(yi - y)    
    n                  
r = i =1         , (3.5)  
(N -1)× S x    
xy   × S y    
       

где x, y – среднеарифметические значения переменных x, y; N – число опытов; Sx, Sy среднеквадратические отклонения случайных величин:

  N (xi - x )       N (yi - y )        
  å       å        
S x = i -1         ; S y = i =1         . (3.6)  
  N -1     N -1    
                   

Коэффициент корреляции характеризует степень тесноты линейной зависимости. Если случайные величины x и y связаны точной линейной функциональной зависимостью y ˆ = b 0 + b 1 x, то rxy = ±1, при этом знак

 

коэффициента корреляции соответствует знаку коэффициента b 1.

 

В том случае, когда величины x и y связаны произвольной стохас-тической зависимостью, коэффициент корреляции может принимать значение в интервале

-1 £ rxy £ 1. (3.7)

Если rxy = 0, x и y – независимы, корреляции нет. При rxy > 0 суще-

 

ствует положительная корреляционная связь между x и y (с ростом x уве-личивается y), если rxy < 0 – отрицательная (с ростом x уменьшается y).

 

Коэффициент корреляции, существенно отличающийся от ±1, ха-рактеризует слишком большую долю случайности и слишком большую долю криволинейности связи между случайными величинами. О нали-чии или отсутствии корреляции между двумя случайными величинами качественно можно судить по виду поля корреляции (рис. 3.2).

 

 

а б в

Рис. 3.2. Поля корреляции случайной величины:

 

а – сильная положительная корреляция между x и y;

б – слабая корреляция; в – корреляции нет


 


 

Оценка зависимости случайных величин по выборочному коэффи-циенту корреляции называется корреляционным анализом.

При вычислении коэффициента корреляции удобно пользоваться следующими формулами:

å (xi - x )(yi - y ) = å xi yi - å xi å yi ;   (3.8)  
         
                          N   xi)2        
                               
            =   å xi -              
(N - 1) S x 2 = å xi 2 - xi) 2; Sx 2     N   ;  
N     N -1  
                               
                          yi)2        
            = å yi -              
(N - 1) S y 2 = å yi 2 -     yi) 2; Sy 2     N   ,  
  N   N -1    
                               
где N – число опытов; Sx 2 Sy 2 – выборочные дисперсии величин x.  

2. Коэффициент частной корреляции измеряет линейную зависимость между двумя переменными после устранения части зависимости, обуслов-ленный зависимостью этих переменных с другими переменными. При иссле-довании зависимости y от x 1 и x 2 наличие корреляции между x1 и x 2 и между y

и x 2будет влиять на корреляцию между y и x 1.Для того чтобы устранитьвлияние x 2, необходимо измерить корреляцию между y и x 1 при x 2 = const.

 

Частный коэффициент ryx 1× x 2оценивает степень влияния фактора

x 1на y при условии,что влияние x 2на y исключено:

ryx 1× x 2 =   ryx - ryx × rx x ; (3.9)  
             
                     
    (1 - ryx 22)     (1 - rx 21 x 2)              
                   
ryx 2× x 1 =   ryx - ryx × rx x     .    
                   
                 
      (1 - ryx 21)   (1 - rx 21 x 2)            
                 
                                   

3. Множественный коэффициент корреляции определяет величи-ну зависимости одной переменной от нескольких.

 

Коэффициент корреляции показывает, существует ли связь между x

и y,но самого вида функции не дает.Для характеристики формы связипри изучении корреляционной зависимости пользуются уравнением приближенной регрессии.

Регрессионный анализ предполагает(рассматривает)связь междузависимой величиной y и независимыми переменными x1,…, xi. Эта связь представляется с помощью математической модели, т. е. уравнения, ко-торое связывает зависимую и независимые переменные [1, 25].


 


 

Перечислим предпосылки, на которых базируется регрессионный анализ:

1. Результаты наблюдений y 1, y 2,…, yn представляют собой независи-мые, нормально распределенные случайные величины.

2. Входные факторы xi измеряются с пренебрежимо малой ошибкой по сравнению с ошибкой измерения y.

 

3. Выборочные дисперсии S 12, S 22,..., Sn 2 значения выходного парамет-ра у, полученные при одинаковом количестве параллельных опы-тов, должны быть однородны.

 

Обработка экспериментальных данных при использовании корре-ляционного и регрессионного анализа дает нам возможность построить статистическую математическую модель в виде уравнения регрессии. Таким образом, методы корреляционного и регрессионного анализов тесно связаны между собой.

 

Ранее отмечалось, что коэффициент корреляции дает нам меру зависимости между двумя величинами, но не дает вида (формы) взаимосвязи.

Для характеристики формы связи пользуются уравнением рег-рессии.

Постановка задачи

По данной выборке объема n найти уравнение приближенной рег-рессии и оценить допускаемую при этом ошибку. Эта задача решается методом корреляционного и регрессионного анализов.

 

Нужно найти y ˆ = f (x).

 

По сгущениям точек можно найти определенную зависимость, т. е. получить вид уравнения регрессии. Если разброс точек значительный, то регрессии не будет.

Вид уравнения регрессии зависит от выбираемого метода прибли-жения.

Обычно пользуются методом наименьших квадратов:


 

F = N (yi - f ( xi ))   = min,  
å    
  i =            
или              
    N          
F = (yi - y ˆ i) = min,  
å  
  i =          

 

 

(3.10)

 

 

(3.11)

 


где yi, y ˆ i – экспериментальные и расчетные значения выходной вели-чины соответственно.


 


 

При обработке результатов пассивных экспериментов получают линейные и нелинейные эмпирические модели, которые должны доста-точно точно описывать всю совокупность опытных данных. Сложность

в этом случае заключается в правильном выборе вида модели и опреде-лении параметров модели (коэффициентов уравнения).

Рассмотрим различные случаи приближенной регрессии [1, 5, 25].

 



Поделиться:


Последнее изменение этой страницы: 2017-02-08; просмотров: 151; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.116.36.192 (0.034 с.)