Отыскание параметров выборочного уравнения линейной регрессии по сгруппированным данным 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Отыскание параметров выборочного уравнения линейной регрессии по сгруппированным данным



При большом числе опытов одно и то же значение xi может встретиться раз, а одно и то же значение yj соответственно раз. Одна и та же пара значений (xi, yj) может наблюдаться  раз. Поэтому наблюдаемые значения могут быть сгруппированы. Для этого подсчитывают частоты и результаты заносят в таблицу, которая обычно называется корреляционной. Примером корреляционной таблицы является таблица 12.1.

Таблица 12.1.

yj

xi

10 20 30 40 nyj
3 5 7 4 2 - 7 1 2 3 6 - 5 5 3 19 13 5
nxi 6 10 9 13  

На пересечении строк и столбцов указывается частота nij  для пары (xi, yj). Очевидно, что . В этом случае выборочное уравнение прямой линии регрессии Y на X имеет вид:

(12.1)

где  – условная средняя;  и  – выборочные средние признаков X и Y;  и  – выборочные средние квадратические отклонения; rв – выборочный коэффициент корреляции, причем:

(12.2)

 

Выборочное уравнение прямой линии регрессии X на Y имеет вид:

(12.3)

Если данные наблюдений над признаками X и Y заданы в виде корреляционной таблицы с равноотстоящими вариантами, то целесообразно перейти к условным вариантам:

,          ,

где С1 – «ложный нуль» вариант X (новое начало отсчета); в качестве ложного нуля выгодно принять варианту, которая расположена примерно в середине вариационного ряда (условимся принимать в качестве ложного нуля варианту, имеющую наибольшую частоту); h 1 – шаг, т.е. разность между двумя соседними вариантами X; С 2 – ложный нуль вариант Y; h 2 – шаг вариант Y.

В этом случае выборочный коэффициент корреляции:

(12.4)

причем слагаемое  удобно вычислять, используя расчетную таблицу 12.3.

Величины , , ,  могут быть найдены либо методом произведений (при большом числе данных), либо непосредственно по формулам:

, , ,

1. Зная эти величины, можно определить входящие в уравнения регрессии (12.1) и (12.3) величины по формулам:

 

, , ,

Для оценки силы линейной корреляционной связи служит выборочный коэффициент корреляции rв.

Для обоснованного суждения о наличии связи между количественными признаками следует проверить, значим ли выборочный коэффициент корреляции.

Пример 12.1. Найти выборочное уравнение прямой линии регрессии Y на X по данным, приведенным в корреляционной таблице 12.2.

Таблица 12.2

Y

X

ny

20 25 30 35 40
16 4 6 - - - 10
26 - 8 10 - - 18
36 - - 32 3 9 44
46 - - 4 12 6 22
56 - - - 1 5 6
nx 4 14 46 16 20 n = 100

Решение: Составим корреляционную таблицу 12.3 в условных вариантах, выбрав в качестве ложных нулей С 1 = 30 и С 2 = 36 (каждая из этих вариант расположена в середине соответствующего вариационного ряда).

Таблица 12.3

-2 -1 0 1 2
-2 4 6 - - - 10
-1 - 8 10 - - 18
0 - - 32 3 9 44
1 - - 4 12 6 22
2 - - - 1 5 6
4 14 46 16 20 n = 100

Найдем  и :

Найдем вспомогательные величины  и :

Найдем  и :

Найдем , для чего составим расчетную таблицу 12.4.

Таблица 12.4

u

-2

-1

0

1

2

-2

 

-8

 

-6

-

-

-

-14

28

4

6

-8

 

-12

 

-1

-

 

-8

 

0

-

-

-8

8

8

10

-8

 

-10

 

0

-

-

 

0

 

3

 

18

21

0

32

3

9

0

 

0

 

0

 

1

-

-

 

0

 

12

 

12

24

24

4

12

6

4

 

12

 

6

 

2

-

-

-

    1     10

11

22

  1     5  
2     10    

-8

-20

-6

14

16

 

16

20

0

14

32

 
                                   

 Суммируя числа последнего столбца таблицы 12.3, находим:

2. Для контроля вычислений находим сумму чисел последней строки:

3. Совпадение сумм свидетельствует о правильности вычислений.

Пояснения к составлению таблицы 3.

1. Произведение частоты  на варианту u, т.е. , записывают в правом верхнем углу клетки, содержащей значение частоты. Например, в правых верхних углах клеток первой строки записаны произведения: ; .

2. Складывают все числа, помещенные в правых верхних углах клеток одной строки, и их сумму помещают в клетку этой же строки «столбца U». Например, для первой строки .

4. Наконец, умножают варианту v на U и полученное произведение записывают в соответствующую клетку «столбца vU». Например, в первой строке таблицы , , следовательно, .

5. Сложив все числа «столбца vU», получают сумму , которая равна искомой сумме . Например, для таблицы 3, , следовательно, искомая сумма .

Для контроля аналогичные вычисления производят по столбцам: произведения  записывают в левый нижний угол клетки, содержащей значение частоты; все числа, помещенные в левых нижних углах клеток одного столбца, складывают и их сумму помещают в «строку V»; наконец, умножают каждую варианту u на V и результат записывают в клетках последней строки.

Сложив все числа последней строки, получают сумму , которая также равна искомой сумме . Например, для таблицы 12.3, , следовательно, .

Найдем искомый выборочный коэффициент корреляции:

Найдем шаги h 1 и h 2 (разности между любыми двумя соседними вариантами): ;

Найдем  и , учитывая, что С 1 = 30, С 2 = 36:

Найдем  и :

;

Подставив найденные величины в соотношение 12.1, получим искомое уравнение прямой линии регрессии Y на X:

,

или окончательно:

 

Контрольная работа №1

Задача 1. В ящике имеются a белых и b чёрных шаров. Найти вероятность того, что:

1. первый вынутый шар будет белым;

2. все вынутые из ящика k шаров будут черными;

3. среди вынутых из ящика k шаров будет n белых.

Значения a, b, k и n по вариантам представлены в таблице 13.1.

Таблица 13.1

1 2 3 4 5 6 7 8 9 10
a 9 8 7 6 10 9 8 7 6 5
b 5 6 7 8 5 6 7 8 9 8
k 4 5 5 4 3 4 5 6 6 5
n 2 3 4 3 2 2 3 4 5 2

 

Задача 2. Решить задачу согласно варианту (таблице 13.2.). На рисунках к задачам элементы, без которых работа системы невозможна, изображаются как звенья, соединенные «последовательно»; дублирующие друг друга элементы изображаются соединенными «параллельно». Надежность каждого элемента записывается в соответствующем прямоугольнике.

Таблица 13.2

Задача
1 При включении зажигания двигатель начинает работать с вероятностью р. Найти: 1) вероятность того, что двигатель начнет работать только при втором включении зажигания; 2) вероятность того, что для ввода двигателя в работу придется включить зажигание не более двух раз.
2 Сообщение, передаваемое по каналу связи, состоит из n знаков (символов). При передаче каждый знак искажается (независимо от других) с вероятностью р. Для надежности сообщение дублируется (повторяется k раз). Найти вероятность того, что хотя бы одно из переданных сообщений не будет искажено ни в одном знаке.

 

Продолжение таблицы 13.2

3 Сколько нужно взять случайных цифр, чтобы цифра «6» появилась хотя бы один раз с вероятностью, не меньшей 0.9.
4 Имеется радиолокационная система, состоящая из двух самостоятельных станций. Для выполнения задачи необходимо, чтобы хотя бы одна радиолокационная станция, входящая в систему работала безотказно. Требуется определить вероятность того, что система будет работать безотказно, если вероятность безотказной работы каждой радиолокационной станции в течение времени, необходимого для выполнения задания равна 0.9.
5 Вероятность безотказной работы блока, входящего в систему, в течение заданного времени составляет 0.8. Для повышения надежности устанавливают такой же резервный блок. Требуется найти, какой станет вероятность безотказной работы блока с учетом резервного.
6 Прибор состоит из n блоков (рис.13.1). Выход из строя каждого блока означает выход из строя прибора в целом. Блоки выходят из строя независимо друг от друга. Надежность (вероятность безотказной работы) каждого блока равна р. Найти надежность Р прибора в целом. Какова должна быть надежность р1 каждого блока для обеспечения заданной надежности Р1 прибора?
7 Для повышения надежности прибора он дублируется точно таким же прибором (рис.13.2); надежность (вероятность безотказной работы) каждого прибора равна р. При выходе из строя первого прибора происходит мгновенное переключение на второй (надежность переключающего устройства равна единице). Определить надежность Р системы двух дублирующих друг друга приборов.
8 Прибор состоит из трех узлов. В первом узле n1 элементов, во втором n2 и в третьем n3. Для работы прибора безусловно необходим узел I; два других узла II иIII дублируют друг друга (рис.13.3). Надежность каждого элемента одна и та же и равна р. Выход из строя одного элемента означает выход из строя всего узла. Элементы выходят из строя независимо друг от друга. Найти надежность прибора Р.
9 Для повышения надежности прибора он дублируется (n-1) другими такими же приборами (рис. 13.4); надежность каждого прибора р. Найти надежность Р системы. Сколько надо взять приборов, чтобы повысить надежность до заданной Р1?
10 Техническая система состоит из n блоков, надежность каждого р. Выход из строя хотя бы одного блока влечет за собой выход из строя всей системы. С целью повышения надежности системы производится дублирование, для чего выделено еще n таких же блоков. Надежность переключающих устройств полная. Определить, какой способ дублирования дает большую надежность системы: а) дублирование каждого блока (рис. 13.5а); б) дублирование всей системы (рис.13.5б).

 

 

Задача 3. При установившемся технологическом процессе вероятность изготовления детали, удовлетворяющей требованиям стандарта, равна p. Найти вероятность того, что:

1. требованиям стандарта удовлетворяют ровно k деталей и не менее l деталей среди взятых наудачу n деталей.

2. среди взятых наудачу N =10 n деталей требованиям стандарта удовлетворяют ровно K =10 k и не менее L =10 l деталей.

Значения p, n, k и l по вариантам представлены в таблице 13.3.

Таблица 13.3

Вариант 1 2 3 4 5 6 7 8 9 10
p 0.9 0.8 0.7 0.75 0.85 0.95 0.65 0.7 0.8 0.9
n 6 7 5 8 4 5 6 7 6 8
k 4 5 3 6 3 3 3 4 4 5
l 5 6 4 7 2 3 4 5 5 7

 

Задача 4. Случайная величина Х задана функцией распределения F (x) (таблица 13.4). Требуется:

1. используя свойства функции распределения, найти коэффициент a;

2. найти плотность распределения вероятностей f (x);

3. построить графики функций распределения F (x) и плотности распределения вероятностей f (x);

4. найти числовые характеристики случайной величины Х: математическое ожидание, дисперсию, среднеквадратическое отклонение;

5. найти вероятность того, что случайная величина Х отклонится от своего математического ожидания по модулю не более, чем на среднее квадратическое отклонение.

Таблица 13.4

F (x) N F (x)
1 6
2 7
3 8
4 9
5 10

Задача 5. Нормально распределенная случайная величина X задана параметрами a   и σ (. a -математическое ожидание, σ -среднеквадратическое отклонение).

1. запишите плотность распределения вероятностей и постройте её график;

2. найдите

3. найдите

Значения a, σ,α, β и δ по вариантам представлены в таблице 13.5.

 

Таблица 13.5

1 2 3 4 5 6 7 8 9 10
a 7 6 5 4 3 2 1 -1 -2 -3
σ 2 3 4 5 2 3 4 5 2 3
α 4 4 2 0 -2 -1 0 0 -3 -3
β 8 9 8 5 4 4 5 5 0 4
δ 3 4 3 6 2 2 3 6 3 5

 

Контрольная работа №2

Задание 1. Результаты независимых измерений подчинены нормальному закону распределения. Найти доверительный интервал, покрывающий истинное значение величины с надёжностью γ=0,95.

           Значения независимых измерений представлены в таблице 14.1.

Таблица 14.1

1 2 3 4 5 6 7 8 9 10
x1 0.50 1.80 4.40 45.00 7.40 34.00 24.00 41.10 41.30 15.00
x2 0.70 1.90 4.80 46.00 7.10 30.00 26.00 42.20 42.20 16.00
x3 0.75 2.50 5.00 47.00 7.90 32.00 25.00 43.40 43.60 17.00
x4 0.68 1.60 5.10 44.00 7.50 31.70 28.00 39.40 39.60 14.00
x5 0.62 1.70 5.30 42.00 7.30 35.30 30.00 39.60 39.80 12.00
x6 0.72 2.20 4.90 48.00 7.60 31.00 23.00 39.90 40.10 18.00
x7 0.70 2.30 5.20 49.00 7.80 34.40 29.00 42.80 43.00 19.00

 

Задание 2. Найти выборочное уравнение прямой регрессии Y на X  по данной корреляционной таблице (таблица 14.2). На одном графике изобразить полученную прямую и групповые средние . В каждой таблице указаны середины интервалов значений признаков X и Y и соответствующие частоты.


Таблица 14.2

Исходные данные

1

Y

X

ny

4 9 14 19 24 29
10 3 3 - - - - 6
20 5 7 8 - - - 20
30 - 4 10 18 5 - 37
40 - - 4 12 7 - 23
50 - - - 4 3 7 14
nx 8 14 22 34 15 7 n=100

2

Y

X

ny

10 15 20 25 30 35
30 2 4 - - - - 6
40 3 6 8 - - - 17
50 - 2 10 20 4 - 36
60 - - 5 10 8 1 24
70 - - - 7 6 4 17
nx 5 12 23 37 18 5 n=100

3

Y

X

ny

15 20 25 30 35 40
5 4 2 - - - - 6
10 5 6 7 - - - 18
15 - 4 10 15 7 - 36
20 - - 6 10 5 2 23
25 - - - 8 4 5 17
nx 9 12 23 33 16 7 n=100

4

Y

X

ny

5 10 15 20 25 30
20 1 5 - - - - 6
30 4 7 3 - - - 14
40 - 3 10 18 3 - 34
50 - - 6 10 10 3 29
60 - - - 7 5 5 17
nx 5 15 19 35 18 8 n=100

5

Y

X

ny

10 15 20 25 30 35
6 4 1 - - - - 5
12 2 6 8 - - - 16
18 - 5 11 10 5 - 31
24 - - 3 15 9 1 28
30 - - - 9 7 4 20
nx 6 12 22 34 21 5 n=100

6

Y

X

ny

5 10 15 20 25 30
8 2 4 - - - - 6
12 1 3 7 2 - - 13
16 - 2 10 20 12 - 44
20 - - 7 7 8 2 24
24 - - - 4 5 4 13
nx 3 9 24 33 25 6 n=100

7

Y

X

ny

2 7 12 17 22 27
10 4 4 - - - - 8
20 1 6 7 8 - - 22
30 - 3 8 15 8 - 34
40 - - 3 7 10 3 23
50 - - - 2 5 6 13
nx 5 13 18 32 23 9 n=100

8

Y

X

ny

11 16 21 26 31 36
25 3 4 - - - - 7
35 1 8 3 2 - - 14
45 - 2 9 18 5 - 34
55 - - 5 13 10 2 30
65 - - - 4 6 5 15
nx 4 14 17 37 21 7 n=100

9

Y

X

ny

4 9 14 19 24 29
8 3 4 - - - - 7
18 1 6 5 - - - 12
28 - 1 15 4 1 - 21
38 - - 11 12 8 2 33
48 - - 8 7 9 3 27
nx 4 11 39 23 18 5 n=100

10

Y

X

ny

5 10 15 20 25 30
11 4 2 - - - - 6
21 2 6 3 - - - 11
31 - 1 9 20 4 - 34
41 - - 8 10 12 1 31
51 - - - 6 7 5 18
nx 6 9 20 36 23 6 n=100

Задание 3. Предполагается, что случайная величина Х, эмпирическое распределение которой задано, обладает нормальным законом распределения. В таблице 14.3 представлены значения середин интервалов х i и соответствующие им частоты mi по вариантам.

           Вычислить для всех интервалов теоретические частоты; оценить с помощью критерия Пирсона хи-квадрат согласие эмпирического распределения с теоретическим распределением и построить гистограмму для эмпирического и теоретического распределений.

Таблица 14.3

xi

mi

x1 x2 x3 x4 x5 x6 m1 m2 m3 m4 m5 m6
1 10 20 30 40 50 60 5 8 15 11 7 4
2 1,5 2,5 3,5 4,5 5,5 6,5 4 8 15 12 6 5
3 12 22 32 42 52 62 4 7 10 14 9 6
4 25 35 45 55 65 75 5 8 14 12 7 4
5 2,5 3,5 4,5 5,5 6,5 7,5 6 8 14 10 7 5
6 0,5 1,5 2,5 3,5 4,5 5,5 5 7 11 13 9 5
7 5 4 5 6 7 8 4 8 12 14 7 5
8 15 16 17 18 19 20 4 8 15 11 7 5
9 2 3 4 5 6 7 5 9 11 14 6 5
10 2,5 3,5 4,5 5,5 6,5 7,5 6 7 13 10 9 5

 


СОДЕРЖАНИЕ

Введение.. 4

1. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ.. 5

2. Основные теоремы теории вероятностей.. 6

2.1. Основные формулы комбинаторики.. 6

2.2. Теорема сложения вероятностей для НЕсовместных и совместных событий. Вероятность появления хотя бы одного события. Теоремы умножения для двух независимых и зависимых событий.. 7

2.3. Формула полной вероятности.. 9

2.4. Формула Байеса.. 9

3. Повторение независимых испытаний.. 10

3.1. Формула Пуассона.. 11

3.2. Локальная теорема муавра-Лапласа.. 11

3.3. Интегральная теорема МуАВРА-Лапласа.. 11

4. Дискретные случайные величины... 12

4.1. Закон распределения вероятностей дискретной случайной величины.. 12

4.2. Числовые характеристики дискретной случайной величины.. 12

5. Непрерывная случайная величина.. 14

5.1. Интегральная функция распределения: её свойства и график. 14

5.2. Плотность распределения вероятностей. Определение, вероятностный смысл, свойства. 15

5.3. Числовые характеристики непрерывной случайной величины.. 16

5.4. Равномерное, показательное и нормальное распределения непрерывной случайной величины.. 16

6. Задачи математической статистики. Генеральная и выборочная статистические совокупности.. 19

7. Статистические оценки.. 20

7.1. Несмещенные, эффективные и состоятельные оценки.. 20

7.2. Выборочная средняя и выборочная дисперсия. 21

8. Доверительная вероятность, доверительные интервалы... 23

9. Проверка статистических гипотез. 24

10. Задачи теории корреляции.. 26

11. Отыскание параметров выборочного уравнения линейной регрессии по несгруппированным данным... 27

12. Отыскание параметров выборочного уравнения линейной регрессии по сгруппированным данным... 28

13. Контрольная работа №1. 30

14. Контрольная работа №2. 33



Поделиться:


Последнее изменение этой страницы: 2021-04-05; просмотров: 272; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 44.213.80.203 (0.202 с.)