Корреляционный момент двумерной случайной величины определяется как 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Корреляционный момент двумерной случайной величины определяется как



.

Коэффициент корреляции определяется как

.

Регрессией на называется функция условное математическое ожидание при условии .

Уравнение линейной регрессии на можно представить в виде

определяет лишь «тенденцию» поведения регрессии на .

Задача 18. Для заданной двумерной случайной величины (X,Y) найти:

a) законы распределения компонент и их числовые характеристики;

b) выяснить, зависят ли друг от друга компоненты Х и Y.

c) условные законы распределения ;

d) регрессию Y на X;

e) коэффициент корреляции;

 

18.1

(X,Y) =1 =4 =5
=-1 0,15 0,2 0,15
=0 0,05 0,1 0,05
=2 0,1   0,2

 

18.2

(X,Y) =-10 =-30
=5 0,125 0,05
=8 0,1 0,025
=12 0,15 0,2
=16 0,25 0,1

 

18.3

(X,Y) =2 =4 =6 =8
=1 0,1 0,15 0,25 0,05
=3 0,05   0,05  
=5   0,1 0,15 0,1

 

18.4

(X,Y) =-1 =-2 =-4
=3 0,15 0,1 0,15
=6 0,05 0,1 0,125
=9 0,15 0,1 0,125

 

18.5

(X,Y) =1 =10 =20 =50
=2 0,15 0,05 0,15  
=4 0,1 0,15 0,2 0,2

 

18.6

(X,Y) =1 =2 =3 =4
=-10 0,2 0,1 0,05 0,05
=-20 0,15 0,05 0,3 0,1

 

18.7

(X,Y) =1 =2 =3 =4
=10 0,15 0,25 0,05 0,15
=20 0,1 0,15 0,05 0,1

 

18.8

(X,Y) =-2 =1 =4
=0 0,03 0,06 0,21
=3 0,01 0,02 0,07
=5 0,06 0,12 0,42

 

18.9

(X,Y) =-1 =0 =1
=2 0,08 0,18 0,08
=4 0,12 0,42 0,12

 

18.10

(X,Y)
0,04 0,01 0,01 0,04
0,06 0,1 0,1 0,06
0,04 0,25 0,25 0,04

Пример решения задачи 18. Для заданной двумерной случайной величины Z=(X,Y)

Z=(X,Y) = -1 =0 =2
=10 0,1 0,1 0,05
=20 0,05 0,5  
=30     0,2

найти:

a) законы распределения компонент и их числовые характеристики;

b) выяснить, зависят ли друг от друга компоненты Х и Y.

c) условные законы распределения ;

d) регрессию Y на X;

e) коэффициент корреляции;

Решение:

a) Найдем законы распределения компонент:

Закон распределения компоненты Х получаем суммированием вероятностей по столбцам:

Табл.1

X, = -1 =0 =2
P(X), 0,15 0,60 0,25

Сразу найдем числовые характеристики компоненты Х:

Математическое ожидание X: .

Дисперсия Х: .

Среднее квадратическое отклонение: .

Закон распределения компоненты Y получаем суммированием вероятностей двумерной случайной величины Z=(X, Y) по строкам:

Табл.2

Y, P(Y),
=10 0,25
=20 0,55
=30 0,20

Убеждаемся, что сумма вероятностей равна единице, как и должно быть для дискретных законов распределения.

Найдем числовые характеристики компоненты Y:

Математическое ожидание Y: .

Дисперсия Y: .

Среднее квадратическое отклонение: .

b) Выясним, зависят ли друг от друга компоненты Х и Y. Предположим, что компоненты не зависят друг от друга, тогда вероятность значения двумерной случайной величины должна являться произведение соответствующих вероятностей компонент, т.е.

,

в этом случае закон распределения двумерной случайной величины

должен бы иметь вид (используем Табл. 1, и Табл.2)

 

Закон распределения

= -1 =0 =2
=10
=20
=30

 

Сравнивая полученный закон распределения величины с заданным в условии примера законом распределения , убеждаемся в их различии, следовательно, наше предположение о независимости компонент X и Y не верно и компоненты X и Y являются зависимыми случайными величинами.

c) Найдем условные законы распределения компоненты Y при фиксированных значениях компоненты X:

Табл. 3

Y, Значения взяты из первого столбца заданного закона распределения Z(X, Y), а сумма по столбцу
=10
=20
=30

Сразу найдем условное математическое ожидание Y при :

.

Табл. 4

Y, Значения взяты из второго столбца заданного закона распределения Z(X, Y), а сумма по столбцу
=10
=20
=30

Найдем условное математическое ожидание Y при :

.

Табл. 5

Y, Значения взяты из второго столбца заданного закона распределения Z(X, Y), а сумма по столбцу
=10
=20
=30

Найдем условное математическое ожидание Y при :

.

Тот факт, что таблицы 3, 4, 5 не совпадаю друг с другом еще раз свидетельствуют о зависимости случайных величин друг от друга.

d) Найдем регрессию Y на X. Для этого построим график зависимости среднего значения y при фиксированном значении x, т.е. график зависимости условного математического ожидания от :

График регрессии Y на Х

30

20

 
 


10


-1 0 1 2 x

e) Найдем коэффициент корреляции случайных величин Y и X:

Коэффициент корреляции определяется как

,

где корреляционный момент может быть найден по формуле

.

Найдем сначала среднее значение произведения компонент X и Y:

воспользовавшись матрицей вероятностей заданного закона распределения двумерной случайной величины Z(X, Y)). Тогда коэффициент корреляции будет равен

,

откуда для коэффициента корреляции получаем значение

.

Таким образом, между случайными величинами X и Y имеется достаточно тесная корреляционная связь. Как известно, теснота корреляционной связи определяется тем, насколько коэффициент корреляции отличается по модулю от единицы. Сам же коэффициент корреляции обладает свойством

.

Чем ближе коэффициент корреляции к единице, тем тесней корреляционная связь компонент X и Y.

 

Задача 19. Для двумерной случайной величины Z(X, Y) Задачи 18 найти уравнение линейной регрессии Y на Х. График этой регрессии построить в тех же осях и на том же рисунке, что и график самой регрессии Y на Х, построенный в Задаче 18. Сравнить эти графики.

 

 

Пример решения задачи 19. Для двумерной случайной величины Z(X, Y) Примера решения задачи 18 найти уравнение линейной регрессии Y на Х. График этой регрессии построить в тех же осях, что и график самой регрессии Y на Х, построенный в Задаче 18. Сравнить эти графики.

 

Решение: График линейной регрессии Y на X представляет собой тенденцию изменения среднего значения величины Y при фиксированном значении X от этого значения X. Более детальная информацию об этой зависимости при этом теряется. Уравнение линейной регрессии Y на X, которую будем обозначать , имеет вид:

,

и представляет собой канонический вид уравнения прямой на плоскости , здесь математические ожидания компонент X и Y, соответственно;

их средние квадратические отклонения;

коэффициент корреляции компонент.

При решении Примера18 все эти параметры были найдены:

; ; .

Подставляя их в уравнение линейной регрессии, запишем его в форме

,

 

из которой следует, что прямая, проходя через точку A(0,35; 19,5), имеет направляющий вектор

График регрессии Y на Х (см. предыдущий Пример) и график линейной регрессии Y на Х практически совпадают

30

20

A

10


-1 0 1 2 x

То, что регрессия являлась практически прямой и привело к тому, что и линейная регрессия , которая является по определению прямой, совпадают.

Задача 20. Найти закон распределения случайной величины и ее числовые характеристики, если случайных величин X и Y, являются компонентами двумерной случайной величины Z(X, Y) Задачи 18. Числовые характеристики найти двумя методами: с помощью свойств числовых характеристик и по определению.

 

Пример решения задачи 20 Найти закон распределения случайной величины и ее числовые характеристики, если случайных величин X и Y, являются компонентами двумерной случайной величины Z(X, Y) Примере 18. Числовые характеристики найти двумя методами: с помощью свойств числовых характеристик и по определению.

Решение: Числовые характеристики компонент X и Y были найдены в примере 18 и записывались в виде:

.

Математическое ожидание случайной величины V найдем, воспользовавшись свойствами математического ожидания:

.

Дисперсию случайной величины V также найдем, воспользовавшись свойствами дисперсии

и свойством корреляционного момента постоянные)

.

Дисперсия случайной величины V принимает значение:

,

или в более простой форме:

.

Для построения закона распределения случайной величины V=5X+Y учтем, что компоненты X, Y являются зависимыми случайными величинами и появления любой пары их значений, дающих в результате значение величины V, может происходить с вероятность , которая задается матрицей вероятности

двумерной случайной величины Z=(X,Y)Примера 18:

Z=(X,Y) = -1 =0 =2
=10 0,1 0,1 0,05
=20 0,05 0,5  
=30     0,2


Закон распределения случайной величины W=5X+Yимеет вид:

W 5 10 15 20 25 30 40
P(W) 0,1 0,1 0,05 0,55 0 0 0,2

Поясним на примере. Так значение может быть реализовано в испытании, только когда значение X=-1, а значение Y=10, вероятность их совместного появления соответствует вероятности P=0,1.

Поскольку значения W=25 и W=30 реализуются в испытаниях с вероятностью P=0, т.е. фактически не реализуются (невозможные события). Их можно исключить из закона распределения.

Закон распределения случайной величины V=5X+Y, таким образом,имеет вид:

W 5 10 15 20 40
P(w) 0,1 0,1 0,05 0,55 0,2

Найдем числовые характеристики случайной величины W, используя их определение и полученный закон распределения.

Математическое ожидание V:

.

Дисперсия W:

.

Как видим, оба способа вычисления числовых характеристик случайной величины V дают один и тот же результат.

Задача 21. Из 20-50 знакомых сверстников (ровесников, соучеников и прочих формальных или неформальных объединений, групп), образующих некоторую выборку, построить вариационный ряд для какого-либо параметра , характеризующего то или иное свойство рассматриваемого сообщества (вес, рост, свойства характера и т.д.). Считая, что этот параметр имеет нормальное распределение, оценить математическое ожидание соответствующей генеральной совокупности по выборочной средней при помощи доверительного интервала и дисперсию этого распределения с надежность 0,95. Оценить вероятность, что наудачу выбранный член сообщества из генеральной совокупности имеет рассматриваемый параметр в интервале .

 

 

Пример решения задачи 21. В одной из учебных спортивных групп веса молодых людей в возрасте от 16 до 18 лет задаются таблицей

                      Объем выборки N=35
Вес, x, кг                      
Частота, n                    

Считая, что параметр х имеет нормальное распределение, оценить математическое ожидание соответствующей генеральной совокупности по выборочной средней при помощи доверительного интервала и дисперсию этого распределения с надежность 0,95. Оценить вероятность, что наудачу выбранный член сообщества из генеральной совокупности имеет рассматриваемый параметр в интервале .

Для рассматриваемой выборки найдем выборочную среднюю (математическое ожидание параметра х в заданной выборке)

.

Выборочная дисперсия вычисляется аналогично:

.

Исправленная дисперсия определяется как

. .

Доверительный интервал для оценки математического ожидания генеральной совокупности с надежностью найдем с помощью таблицы коэффициентов , взятых из приложения 2, по формуле

.

Для значений находим из приложения 2: .

Доверительный интервал для оценки математического ожидания генеральной совокупности с надежностью 0,95 в соответствии с приведенной формулой запишется в виде

 

,

или, окончательно:

 

.

 

Доверительный интервал для дисперсии генеральной совокупности найдем по формуле

,

где коэффициент берем из таблицы приложения 3: . Откуда имеет место неравенство.

.

Доверительный интервал для дисперсии генеральной совокупности с надежностью 0,95 окончательно записывается в виде:

.

 
 


Оценим вероятность, что наудачу выбранный член сообщества из генеральной совокупности имеет рассматриваемый вес в интервале . Возьмем в качестве параметров генеральной совокупности, распределенной по нормальному закону значения , расположенные по середине доверительных интервалов. Плотность распределения случайной величины будет иметь вид

,

a искомая вероятность может быть найдена по формуле

Таким образом, подставляя значения параметров, находим

Из таблицы значений функции Лапласа, (см. Приложение 1), находим значение

,

Таким образом, имеет место оценка:

,

которая означает, что наудачу выбранный молодой человек из генеральной совокупности имеет вес от 62 кг до 100 кг с вероятностью 0,38.


 

ПРИЛОЖЕНИЕ 1.

Значения функции Лапласа .

 

x Ф(x) x Ф(x) Х Ф(x) х Ф(x)
0,00 0,0000 0,45 0,1736 0,90 0,3159 1,35 0,4115
0,05 0,0199 0,50 0,1915 0,95 0,3289 1,40 0,4192
0,10 0,0398 0,55 0,2088 1,00 0,3413 1,45 0,4265
0,15 0,0596 0,60 0,2257 1,05 0,3531 1,50 0,4332
0,20 0,0793 0,65 0,2422 1,10 0,3643 1,55 0,4394
0,25 0,0987 0,70 0,2580 1,15 0,3749 1,60 0,4452
0,30 0,1179 0,75 0,2734 1,20 0,3849 1,65 0,4505
0,35 0,1368 0,80 0,2881 1,25 0,3944 1,70 0,4554
0,40 0,1554 0,85 0,3023 1,30 9,4032 1,75 0,4599
1,80 0,4641 2,00 0,4772 2,40 0,4918 2,80 0,4974
1,85 0,4678 2,10 0,4821 2,50 0,4938 2,90 0,4981
1,90 0,4713 2,20 0,4861 2,60 0,4953 3,00 0,49865
1,95 0,4744 2,30 0,4893 2,70 0,4965 4,00 0,499968
1,99 0,4767 2,38 0,4913 2,78 0,4973 - -

Свойство нечетности функции Лапласа:

;


 

ПРИЛОЖЕНИЕ 2.

Таблица значений

Доверительный интервал для оценки математического ожидания нормального распределения при неизвестном :

 

.

 

0,95 0,99 0,999 0,95 0,99 0,999
  2,78 2,57 2,45 2,37 2,31 2,26   2,23 2,20 2,18 2,16 2,15   2,13 2,12 2,11 2,10 4,60 4,03 3,71 3,50 2,36 3,25   3,17 3,11 3,06 3,01 2,98   2,95 2,92 2,90 2,88 8,61 6,86 5,96 5,41 5.04 4,78   4,59 4,44 4,32 4,22 4,14   4,07 4,02 3,97 3,92 2,093 2,064 2,045 2,032 2,023 2,016   2,009 2,001 1,996 1,001 1,987   1,984 1,980 1,960 2,861 2,797 2,756 2,729 2,708 2,692   2,679 2,662 2,649 2,640 2,633   2,627 2,617 2,576 3,883 3,745 3,659 3,600 3,558 3,527   3,502 3,464 3,439 3,418 3,403   3,392 3,374 3,291

 

 


 

ПРИЛОЖЕНИЕ 3.

 

Таблица значений

Доверительный интервал для оценки среднего квадратического отклонения нормального распределения:

.

0,95 0,99 0,999 0,95 0,99 0,999
    1,37 1,09 0,92 0,80 0,71 0,65   0.59 0,55 0,52 0,48 0,46   0,44 0,42 0,40 0,39 2,67 2,01 1,62 1,38 1,20 1,08   0,98 0,90 0,83 0,78 0,73   0,70 0,66 0,63 0,60 5,64 3,88 2,98 2,42 2,06 1,80   1,60 1,45 1,33 1,23 1.15   1,07 1,01 0,96 0,92     0,37 0,32 0,28 0,26 0,24 0,22   0,21 0,188 0,174 0,161 0,151   0,143 0,115 0,099 0,989 0,58 0,49 0,43 0,38 0,35 0,32   0,30 0,269 0,245 0,226 0,211   0.198 0,160 0,136 0,120 0,88 0,73 0,63 0,56 0,50 0,46   0,43 0,38 0,34 0.31 0,29   0,27 0,211 0.185 0.162

 

 



Поделиться:


Последнее изменение этой страницы: 2017-02-08; просмотров: 660; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.141.244.201 (0.199 с.)