ТОП 10:

Корреляционный момент и коэффициент корреляции.



Для характеристики корреляционной зависимости между вели­чинами используются коррекляционный момент и коэффициент корреляции.

О п р е д е л е н и е 2. Корреляционным моментом µxy случайных ве­личин X и Y называют математическое ожидание произведения отклонений этих величин

 

Для вычисления корреляционного момента дискретных величин используется выражение

 

(3.12)

а для непрерывных – выражение

 

(3.13)

З а м е ч а н и е. Корреляционный момент µxy может быть пере­писан в виде

 

(3.14)

Действительно, используя свойства математического ожидания (см. §§ 2.2; 2.6), имеем

 

Т е о р е м а. Корреляционный момент двух независимых случайных величин X и Y равен нулю.

Д о к а з а т е л ь с т в о. Согласно замечанию

 

а так как Х и Y независимые случайные величины, то (см. §§ 2.2; 2.6)

 

и, значит, µxy=0.

Из определения корреляционного момента следует, что он имеет размерность, равную произведению размерностей величин X и Y,т.е. его величина зависит от единиц измерения случайных величин. Поэтому для одних и тех же двух величин величина корреляцион­ного момента может иметь различные значения в зависимости от того, в каких единицах были измерены величины. Для устранения этого недостатка условились за меру связи (зависимости) двух слу­чайных величин X и Yпринять безразмерную величину

(3.15)

где σх=σ(Х), σy=σ(Y), называемую коэффициентом корреляции.

П р и м е р 1. Пусть двумерная дискретная случайная величи­на (X,Y)задана законом распределения:

 

x\y
1\18 1\12 1\36
1\9 1\6 1\18
1\6 1\4 1\12

 

Найдем корреляционный момент и коэффициент корреляции слу­чайных величин X и Y.

Р е ш е н и е. Сложив вероятности по строкам, получим вероят­ности возможных значений X:

 

 

Отсюда закон распределения X:

 

X
p 1\6 1\3 1\2

 

и, значит,

Сложив же вероятности по столбцам, найдем вероятности воз­можных значений Y:

 

 

Отсюда закон распределения Y:

 

Y
p 1\3 1\2 1\6

 

и, значит,

Следовательно,

Таким образом, коэффициент корреляции

Т е о р е м а. Абсолютная величина корреляционного момента двух случайных величин не превосходит произведения их средних квадратических отклонений:

Д о к а з а т е л ь с т в о. Введя в рассмотрение случайную величи­ну где найдем ее дисперсию. Имеем

(любая дисперсия неотрицательна). Отсюда

Введя случайную величину , аналогично найдем

В результате имеем

или

(3.16)

О п р е д е л е н и е 2. Случайные величины X и Y называются некоррелированными, если = 0, и коррелированными, если

П р и м е р 1. Независимые случайные величины Х и Y являются некоррелированными, так как в силу соотношения (3.12) = 0.

П р и м е р 2. Пусть случайные величины Х и Y связаны линей­ной зависимостью Найдем коэффициент корреля­ции. Имеем:

откуда

Поэтому

Таким образом, коэффициент корреляции случайных величин, свя­занных линейной зависимостью, равен ±1 (точнее, =1, если А>0 и =-1, если А<0).

Отметим некоторые свойства коэффициента корреляции.

Из примера 1 следует:

1) Если X и Y — независимые случайные величины, то коэффи­циент корреляции равен нулю.

Заметим, что обратное утверждение, вообще говоря, неверно. (Доказательство см. в работе [2].)

2)Абсолютная величина коэффициента корреляции не превосхо­дит единицы:

Действительно, разделив обе части неравенства (3.16) на произ­ведение , приходим к искомому неравенству.

3) Как видно из формулы (3.15) с учетом формулы (3.14), ко­эффициент корреляции характеризует относительную величину отклонения математического ожидания произведения от про­изведения математических ожиданий М(Х) М(Y) величин X и Y. Так как это отклонение имеет место только для зависимых вели­чин, то можно сказать, чтокоэффициент корреляции характеризует тесноту зависимости между X и Y.

3. Линейная корреляция. Этот вид корреляционной зависимости встречается довольно часто.

О п р е д е л е н и е. Корреляционная зависимость между случай­ными величинами Х и Y называется линейной корреляцией, если обе функции регрессии и являются линейными. В этом случае обе линии регрессии являются прямыми; их называют прямыми регрессии.

Выведем уравнения прямой регрессии Y на X, т.е. найдем коэф­фициент линейной функции

Обозначим М(Х) = а, М(Y) = b, М[(Х - а)2] = , М[(Y –b2)] = . С использованием свойств МО (§§ 2.2; 2.6) находим:

М(Y) = М[g(Х)] = М(АХ + В)= АМ(Х) + В,

т.е. b = Аа + В, откуда В=b-Аа.

Далее, с помощью тех же свойств математического ожидания имеем

М(ХY) = М[Хg(Х)\ = М(АХ2 + ВХ) = АМ(Х2) + ВМ(Х) = АМ(Х2) + (b- Аа)а,

откуда

А=

или, согласно свойству 1 дисперсии (§§ 2.3; 2.6),

Полученный коэффициент называется коэффициентом регрессии Y на X и обозначается через :

(3.17)

Таким образом, уравнение прямой регрессии Y на X имеет вид

(3.18)

Аналогично можно получить уравнение прямой регрессии X на Y

(3.19)

где

(3.20)

есть коэффициент регрессии X на Y.

Уравнения прямых регрессии можно записать в более симмет­ричном виде, если воспользоваться коэффициентом корреляции. С учетом этого коэффициента имеем:

(3.21)

и поэтому уравнения прямых регрессии принимают вид:

Из уравнений прямых регрессии видно, что обе эти прямые проходят через точку (а;b); угловые коэффициенты прямых рег­рессии равны соответственно (рис. 13):

рис. 13

Так как то Это означает, что прямая рег­рессии Y на X имеет меньший наклон к оси абсцисс, чем прямая регрессии X на Y Чем ближе к единице, тем меньше угол между прямыми регрессии. Эти прямые сливаются тогда и только тогда, когда =1.

При = 0 прямые регрессии описываются уравнениями у=b; х = а.

Рис. 13

В этом случае МХ(Y) = b = М(Y); МУ(Х) = а = М(Х).

Из формулы (3.21) видно, что коэффициенты регрессии имеют тот же знак, что и коэффициент корреляции , и связаны соот­ношением







Последнее изменение этой страницы: 2016-04-08; Нарушение авторского права страницы

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 54.236.59.154 (0.007 с.)