Функциональная, статистическая зависимости системы случайных величин. Условная средняя 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Функциональная, статистическая зависимости системы случайных величин. Условная средняя



Во многих задачах требуется установить и оценить зависимость изучаемой случайной величины Y от одной или нескольких случайных величин.

Две случайные величины X и Y могут быть связаны между собой функциональной, статистической зависимостью или быть независимыми.

Функциональная зависимость (строгая, жесткая) встречается крайне редко, т.к. одна случайная величина или обе подвержены действию случайных факторов. Причем среди случайных факторов могут быть общие. В этом случае возникает статистическая зависимость.

 

Пример.

СВ X зависит от случайных факторов Z1; Z2; Z3

СВ Y зависит от случайных факторов Z2; Z3; Z4; Z5

Т.к. среди этих факторов есть общие, то между случайными величинами X и Y есть статистическая зависимость.

 

Определение.

Статистической зависимостью называется зависимость, при которой изменение одной из величин влечет за собой изменение распределения другой величины.

 

Если статистическая зависимость проявляется в том, что при изменении одной величины, изменяется среднее значение другой, то такая зависимость называется корреляционной. Корреляционная зависимость - это мягкая зависимость в отличии от жесткой функциональной.

 

В качестве оценок математических ожиданий принимают условные средние, которые найдены по данным наблюдений (по выборке).

Определение.

Условным средним  называется среднее арифметическое значение наблюдавшихся значений Y, соответствующих значению X = x.

 

Например, при значении x =2 наблюдавшиеся значения Y: y1=3, y2=7, y3=4.

Условное среднее

Аналогично условным средним называется среднее арифметическое наблюдавшихся значений , соответствующих значению Y = y.

 

 

Линейная корреляционная зависимость. Выборочные уравнения прямой регрессии Y на X. Коэффициент корреляции

В результате n независимых опытов получено n пар чисел (xi; yi).

 

  Xi   X1   X2   …   Xn
  Yi   Y1   Y2   …   Yn

 

Ограничимся приближенным представлением (а точное представление здесь не возможно), что между Х и Y существует корреляционная зависимость, близкая к линейной.

                                                                

Параметры этого линейного уравнения a0 и a1 находят методом наименьших квадратов путем составления и решения системы нормальных уравнений.

Система для МНК (метода наименьших квадратов)

Метод наименьших квадратов «рассчитан» на то, чтобы квадраты отклонений значений (xi;yi) от прямой линии были наименьшими.

 

                   

        

Графическое представление системы (x;y) на плоскости называется полем корреляции.

Определение.

Выборочным уравнением прямой регрессии Y на X называется уравнение

- выборочное уравнение прямой регрессии Y на X;

- среднее арифметическое значение X;

-среднее арифметическое значение Y;

x - переменная величина;

σ x, σ y - средние квадратические отклонения X и Y;

rB - коэффициент корреляции.

                                                        ;

.

Коэффициент корреляции отражает связь между признаками X и Y.

Если коэффициент корреляции близок к нулю (rB ≈0), то X и Y не зависимы и никакого влияния друг на друга не оказывают, т.е. не коррелированные. Если коэффициент корреляции близок к одному (rB ≈1), то между X и Y существует корреляционная зависимость близкая к линейной функциональной.

Оценить значимость коэффициента корреляции можно по критерию Стьюдента.

 

Пример

Проведены 20 независимых опытов по изучению зависимости случайных величин X и Y

а) построить график зависимости (поле корреляции) между переменными X и Y, по которому найти модель уравнения регрессии;

б) рассчитать параметры уравнения регрессии методом наименьших квадратов (МНК);

в) оценить тесноту связи между переменными с помощью показателей корреляции и детерминации:

г) оценить значимость коэффициентов корреляции и регрессии по критерию Стьюдента при уровне значимости  

X -10 -8 -6 -4 -2 0 2 4 6 8
Y -2,6 -3,2 -2,3 -2,0 2,3 -0,5 4,0 5,9 5,3 6,7
X 10 12 14 16 18 20 22 24 26 28
Y 5,4 9,6 10,3 11,7 12,2 13,4 10,5 11,4 14,5 17,8

 

Решение.

а) В прямоугольной системе координат строим график зависимости переменных X и Y

На график наносим точки  координаты которых соответствуют значениям переменных X и Y.

                       

Визуально анализируя характер расположения точек на графике, приходим к выводу, что связь между переменными X и Y может быть выражена линейным уравнением регрессии

       б) Параметры уравнения регрессии находим методом наименьших квадратов, путем составления и решения системы нормальных уравнений:

 

                     

Составим расчетную таблицу.

1 -10 -2,6 100 6,76 26,0
2 -8 -3,2 64 10,24 25,6
3 -6 -2,3 36 5,29 13,8
4 -4 -2,0 16 4,00 8,0
5 -2 2,3 4 5,29 -4,6
6 0 -0,5 0 0,25 0,0
7 2 4,0 4 16,00 8,0
8 4 5,9 16 34,81 23,6
9 6 5,3 36 28,09 31,8
10 8 6,7 64 44,89 53,6
11 10 5,4 100 29,16 54,0
12 12 9,6 144 92,16 115,2
13 14 10,3 196 106,09 144,2
14 16 11,7 256 136,89 187,2
15 18 12,8 324 163,84 230,4
16 20 13,4 400 179,56 268,0
17 22 10,5 484 110,25 231,0
18 24 11,4 576 129,96 273,6
19 26 14,5 676 210,25 377,0
20 28 17,8 784 316,84 498,4
  180 131 4280 1630,62 2564,8

 

Тогда система примет вид:

 

Решим систему по формулам Камера.

 

 

 

Следовательно,  

Таким образом, уравнение регрессии Y на X имеет вид:

Построим линию регрессии Y на X по таблице

 

x 0 -3,57
1,86 0

 

Линия регрессии изображена на рисунке.

 

в) При линейной зависимости степень тесноты связи между X и Y определяется с помощью коэффициента корреляции  где средние арифметические значения:

 

 

 

Найдем:

 

 

Вычислим средние квдратические отклонения  и :

 

 

Отсюда,  

Т.к.  то между признаками связь очень тесная, близкая к линейной функциональной.

Коэффициент детерминации равен  

       г) Оценить значимость коэффициента корреляции.

Нулевая гипотеза  - переменная X не оказывает существенного влияния на Y.

Конкурирующая гипотеза  

Для проверки нулевой гипотезы применим критерий Стьюдента. Уровень значимости  Коэффициент корреляции  Найдем наблюдаемое значение критерия  

По таблице критических точек распределения Стьюдента по уровню значимости  и числу степеней свободы  найдем критическую точку

 двусторонней критической области.

Т.к.  то нулевую гипотезу отвергаем.

Вывод: выборочный коэффициент корреляции значим, случайные величины X и Y коррелированы.



Поделиться:


Последнее изменение этой страницы: 2021-04-12; просмотров: 341; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.145.17.20 (0.02 с.)