Элементы математической статистики 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Элементы математической статистики



Элементы математической статистики

Математическая статистика – раздел математики, который занимается изучением научно обоснованных методов сбора и обработки информации.

Математика применяется в двух направлениях:

1. Для обработки результатов полученных наблюдением и получения эмпирических законов.

2. Применение математического моделирования для выявления внутренней структуры наблюдаемых явлений, для их прогнозирования и управления различными процессами.

Математической моделью, с формальной точки зрения, можно считать любую совокупность объектов и связывающих их операций.

Структура математического моделирования:

Решение математической задачи
Математическая модель
Содержательная модель
Реальный объект
                                                      

 

 

Математические модели условно можно разделить по математическому аппарату, который применяется для их решения (исследования) и по целям построения этих моделей.

Классификация Полетаева И.А.

1. Поисковые модели, то есть построение моделей для объектов, о которых почти ничего неизвестно и необходимо по типу реакции выяснить их структуру.

2. Портретные модели, то есть модели когда механизм объекта известен, но сам объект труднодоступен для наблюдения, поэтому изучение происходит через копирующую модель.

3. Исследовательские модели – это модели, которые составлены для изучения возможностей данного объекта и прогнозирования наблюдаемых процессов.

С математической точки зрения модели делятся на дискретные и непрерывные.

Для построения и изучения дискретных моделей используются средства дискретной математики, то есть теории множеств, теории матриц и определителей; элементы теории графов и т.д.

Непрерывные модели. Для построения и изучения этих моделей применяются средства математического анализа: теория пределов, элементы дифференциального и интегрального исчисления, теория дифференциальных уравнений.

Пример 1

Составить статистическое распределение по данным измерения длины плеча крыла птенца мухоловки-пеструшки на девятый день жизни, в мм.

1.

2.

10

3.

а) Составим дискретное распределение

б) Вычислим границы интервалов, их середины и относительные частоты.

 и т.д.

 и т.д.

 

Пример 2

xi 52 54 56 58 60 62 64
ni 1 4 8 9 12 5 1

 n = 40

M0 = 60

Me = 58

Наиболее полной (точной) характеристикой является среднее арифметическое М.

В случае дискретного распределения среднее арифметическое вычисляется по формуле:

М =

Если каждое значение варианты в этом распределении не повторяется, то среднее арифметическое находится по формуле: М =

Если распределение интервальное, то для расчета среднего арифметического вместо значения вариант в указанной формуле используется значение середин интервалов (хi/).

Среднее арифметическое имеет то же значение, что и математическое ожидание. Различие между ними заключается в том, что М является характеристикой средней величины, найденное на основе опытного материала и является приближенной величиной математического ожидания.

Лишь при неограниченном увеличении числа обследованных объектов по закону больших чисел М стремится к математическому ожиданию (М МО)

Между собой три названные характеристики совпадают лишь в случае симметричного распределения.

Найдем среднее арифметическое для выше приведенного примера 2:

М =

M =

Пример  расчетной задачи

Известны данные о пределе текучести у 50 марок стали (кг/мм2):

71 77 76 76 47 36 50 49 62 40 106 109 109 110 111 68 88 141 136 129 126 96 100 95 118 107 120 114 113 123 94 84 73 107 94 107 99 100 104 88 84  94 142 98 77 88 94 76 84 125

Построить статистическое распределение выборки; построить полигон и гистограмму частот; дать характеристику распределения признака, вычислив для этого: а) медиану; б) моду; в) среднее арифметическое; г) дисперсию;                 д) среднее квадратичное отклонение. Проверить гипотезу о нормальном распределении выборки, используя метод χ2 Пирсона.

РЕШЕНИЕ

1. Среди данных определим самое маленькое значение и самое большое:

xmin = 36, xmax = 142.

2. Вычислим ширину интервалов статистического распределения h:

, n – объём выборки, т.е. количество измерений данных по условию задачи.

3.Составим статистическое распределение:

xi S
ni 2 3 7 8 15 9 4 2 n = 50
xi 36 52 68 84 100 116 132 148  
 

 

4. Построим полигон и гистограмму полученного статистического распределения.

 

5. Найдём основные математические характеристики:

а) Мода М0 = 100, т.к. это значение xi соответствует наибольшей частоте ni = 15.

б) Медиана Ме =  = 92, т.к. количество интервалов в распределении чётное  (k = 8), то в качестве медианы берём среднее арифметическое двух центральных значений xi.

в) Среднее арифметическое М:            

 =  =

г) Дисперсия

;             

д) Среднее квадратическое отклонение

6. Проверим гипотезу о нормальном распределении выборки.

М = 95, ϭ = 26, h = 16, n = 50 =>

Составим таблицу:

 

xi ni ui = φ(ui) niT =
36 2 - 2,27 0, 0303 0,9323 1,22
52 3 - 1,65 0, 1023 3,1477 0,007
68 7 - 1,04 0, 2323 7,1477 0,003
84 8 - 0,42 0, 3652 11,2369 0,93
100 15 0,19 0, 3918 12,0554 0,72
116 9 0,81 0, 2874 8,8431 0,003
132 4 1,42 0, 1456 4,48 0,05
148 2 2,04 0, 0498 1,5323 0,14
S n = 50        = 3,073

 

u 1 = - 2,27; u 2 = - 1,65; u 3 = - 1,04 и т.д. 

Заполняя четвёртый столбец таблицы, φ(ui) находим по таблице значений дифференциальной функции Лапласа, используя приложение 1.

Число степеней свободы k = m – 3 = 8 – 3 = 5, где m – это число интервалов в полученном распределении нашей выборки. По уровню значимости α = 0,05 и числу степеней свободы из таблицы критических точек распределения Пирсона «хи-квадрат»

 (приложение 2) находим значение χ2 = 11, 07.

Сравниваем значения  и χ2. Так как  < χ2, то делаем вывод, что гипотеза о нормальном распределении выборки подтверждается.

 

ОТВЕТ: а) М0 = 100; б) Ме = 92; в) М =95; г) D = 680,36; д)


Контрольная работа

Вариант 0

Известны данные о посевных площадях картофеля (тыс. гектаров) по районам Курганской области: 

1,5 1,5 0,5 1,2 0,9 0,9 0,8 0,5 1,2 1,1 0,6 1,1
1,2 0,9 1,5 1,2 0,8 0,4 1,0 0,1 1,1 0,8 0,1 1,5
0,5 1,2 0,8 0,3 0,4 1,3 0,7 0,1 0,3 1,6 0,8  

Построить статистическое распределение выборки; построить полигон и гистограмму частот; дать характеристику распределения признака, вычислив для этого: а) медиану; б) моду; в) среднее арифметическое; г) дисперсию;                 д) среднее квадратичное отклонение. Проверить гипотезу о нормальном распределении выборки, используя метод χ2 Пирсона.

 

 Вариант 1

На 10 мая 1982 года по районам Пермской области было посеяно яровых культур (в процентах к площади):  

61 58 55 32 41 45 36 43 51 50 34

27

22 22 16 29 22 17 20 27 13 45 15

13

6 9 15 4 15 20 13 3 4 7 6 6 11

Построить статистическое распределение выборки; построить полигон и гистограмму частот; дать характеристику распределения признака, вычислив для этого: а) медиану; б) моду; в) среднее арифметическое; г) дисперсию;                  д) среднее квадратичное отклонение. Проверить гипотезу о нормальном распределении выборки, используя метод χ2 Пирсона.

 

 

 


Вариант 2

При сверлении отверстий одним и тем же сверлом и последующем измерении диаметров, получены следующие данные (в мм): 

40,25 40,35 40,45 40,35 40,37 40,35 40,44
40,35 40,33 40,41 40,35 40,30 40,28 40,30
40,40 40,36 40,29 40,33 40,31 40,33 40,41
40,40 40,33 40,37 40,35 40,34 40,32 40,34
40,28 40,46 40,39 40,37 40,29 40,39 40,37
40,44 40,27 40,38        

Построить статистическое распределение выборки; построить полигон и гистограмму частот; дать характеристику распределения признака, вычислив для этого: а) медиану; б) моду; в) среднее арифметическое; г) дисперсию;                 д) среднее квадратичное отклонение. Проверить гипотезу о нормальном распределении выборки, используя метод χ2 Пирсона.

 

 Вариант 3

Имеются данные о размерах основных фондов (в млн. руб.) 30 предприятий:

0,42 0,24 0,49 0,67 0,45 0,27 0,39 0,21 0,58
0,40 0,28 0,73 0,44 0,66 1,21 0,62 0,70 0,81
1,07 0,68 0,94 0,76 0,63 0,88 0,65 1,14 0,46
1,38 0,72 0,91            

Построить статистическое распределение выборки; построить полигон и гистограмму частот; дать характеристику распределения признака, вычислив для этого: а) медиану; б) моду; в) среднее арифметическое; г) дисперсию;                 д) среднее квадратичное отклонение. Проверить гипотезу о нормальном распределении выборки, используя метод χ2 Пирсона.

 


Вариант 4

Имеются данные интервалов между разрядами нейрона зрительной коры кролика в м/сек:   

200 8 14 53 256 56 74 35 23 19 39
15 11 18 63 19 30 30 15 5 13 50
25 4 42 26 16 46 36 27 50 10 130
70 43 5 45 2 8 19 44 54 49 32
55 53 47 73 11 58 121 144 53 265 9
57 75 108 65 14 11 7 98 140    

Построить статистическое распределение выборки; построить полигон и гистограмму частот; дать характеристику распределения признака, вычислив для этого: а) медиану; б) моду; в) среднее арифметическое; г) дисперсию;                  д) среднее квадратичное отклонение. Проверить гипотезу о нормальном распределении выборки, используя метод χ2 Пирсона.

 

 Вариант 5

Имеются данные о величине латентного периода (в сек.) механического ответа при даче светового сигнала в первом предъявлении:   

0,11 0,54 0,30 0,33 0,36 0,61 0,23 0,25
0,48 0,28 0,57 0,29 0,29 0,41 0,35 0,36
0,51 0,74 0,35 0,44 0,27 0,36 0,34 0,34
0,38 0,31 0,33 0,32 0,37 0,30 0,36 0,35
0,37 0,35 0,40 0,37 0,39 0,39 0,53 0,45
0,28 0,34            

Построить статистическое распределение выборки; построить полигон и гистограмму частот; дать характеристику распределения признака, вычислив для этого: а) медиану; б) моду; в) среднее арифметическое; г) дисперсию;                 д) среднее квадратичное отклонение. Проверить гипотезу о нормальном распределении выборки, используя метод χ2 Пирсона.

 

 

 Вариант 6

Имеются данные измерения длины плеча (в мм) мухоловки пеструшки на 5-й день жизни:  

13,7 14,3 10,3 13,0 13,0 12,0 17,3 13,4
12,1 10,1 14,0 11,3 16,3 11,7 13,0 10,4
15,0 14,1 13,1 16,3 11,6 11,5 13,2 14,3
13,5 10,4 12,3 11,3 11,0 13,1    

Построить статистическое распределение выборки; построить полигон и гистограмму частот; дать характеристику распределения признака, вычислив для этого: а) медиану; б) моду; в) среднее арифметическое; г) дисперсию;                  д) среднее квадратичное отклонение. Проверить гипотезу о нормальном распределении выборки, используя метод χ2 Пирсона.

 

 Вариант 7

Имеются данные измерения (в сек.) скорости механического ответа при комплексном свето-звуко-тактильном раздражении:  

0,44 0,28 0,41 0,36 0,32 0,39 0,35 0,39 0,29
0,30 0,38 0,34 0,29 0,35 0,51 0,40 0,37 0,31
0,30 0,33 0,34 0,34 0,36 0,41 0,41 0,31 0,42
0,35 0,43 0,38            

Построить статистическое распределение выборки; построить полигон и гистограмму частот; дать характеристику распределения признака, вычислив для этого: а) медиану; б) моду; в) среднее арифметическое; г) дисперсию;                 д) среднее квадратичное отклонение. Проверить гипотезу о нормальном распределении выборки, используя метод χ2 Пирсона.

 

 Вариант 8

Имеются данные измерения величин интенсивности порогового раздражения глаз при длительности дачи света в 0,002 сек:  

0,76 2,37 2,70 3,64 4,45 4,71 4,78 4,81
5,08 5,11 6,27 1,19 1,22 1,29 1,44 1,50
1,56 1,64 1,70 1,85 1,94 1,96 2,00 2,11
2,18 2,34 2,20 3,98 4,12 4,25 4,34 3,20
3,28 3,51 2,76 2,80 2,81 2,92 2,95 2,97
2,90 3,02 3,07 3,11 3,14 3,15 2,83 2,76
3,13 2,76            

Построить статистическое распределение выборки; построить полигон и гистограмму частот; дать характеристику распределения признака, вычислив для этого: а) медиану; б) моду; в) среднее арифметическое; г) дисперсию;                 д) среднее квадратичное отклонение. Проверить гипотезу о нормальном распределении выборки, используя метод χ2 Пирсона.

 

Вариант 9

Имеются данные измерения латентных периодов механического ответа (в сек.) при даче светового сигнала во втором предъявлении: 

0,39 0,41 0,61 0,19 0,23 0,20 0,34
0,42 0,21 0,19 0,37 0,25 0,24 0,27
0,66 0,22 0,35 0,24 0,29 0,31 0,38
0,20 0,36 0,26 0,28 0,32 0,24 0,28
0,25 0,27 0,30 0,33 0,27 0,29 0,26
0,30 0,33 0,29 0,31 0,33 0,32 0,33

Построить статистическое распределение выборки; построить полигон и гистограмму частот; дать характеристику распределения признака, вычислив для этого: а) медиану; б) моду; в) среднее арифметическое; г) дисперсию;                  д) среднее квадратичное отклонение. Проверить гипотезу о нормальном распределении выборки, используя метод χ2 Пирсона.

 


Вопросы к экзамену

1. Понятие о статистической совокупности, выборке. Статистическое распределение выборки.

2. Полигон и гистограмма. Эмпирическая функция распределения.

3. Характеристики эмпирического распределения (мода, медиана, средняя выборочная, среднее квадратическое отклонение) и их вычисление.

4. Оценки параметров генеральной совокупности по её выборке. Точность оценки параметров.

5. Проверка статистических гипотез. Сравнение эмпирических распределений с нормальным и другими теоретическими распределениями.

6. Понятие о корреляционной зависимости, о функции регрессии, о линиях регрессии.

 

 


Примеры тестовых заданий на проверку теоретических знаний

1. Ломаная, которая соединяет точки с координатами или называется …

а) гистограммой; б) полигоном; в) медианой; г) модой.

2. Совокупность прямоугольников, основаниями которых являются интервалы значений наблюдаемой величины, а высотой величина или , называется …

а) гистограммой; б) полигоном; в) медианой; г) модой.

3. Значение наблюдаемого признака, который встречается чаще всего, т.е. обладает наибольшей частотой называется …

а) гистограммой; б) полигоном; в) медианой; г) модой.

4. Значение наблюдаемого признака, которое находится посередине статистического распределения выборки или совокупности, называется …

а) гистограммой; б) полигоном; в) медианой; г) модой.

5. Среднее арифметическое статистического распределения вычисляется по формуле:

а) σ =  = ; б) n = ; в) М = ; г) P(A) = .

6. Среднее квадратическое отклонение статистического распределения вычисляется по формуле …

а) σ =  = ; б) n = ; в) М = ; г) P(A) = .

7. Некоторая совокупность объектов, которые являются однородными по структуре и изучаются по одному и тому же качественному или количественному признаку, называется...

а) генеральной статистической совокупностью; б) выборкой; в) модой; г) медианой.

8. Для изучения свойств всей генеральной совокупности чаще всего выбирают лишь часть объектов, эта часть называется …

а) генеральной статистической совокупностью; б) выборкой; в) модой; г) медианой.                                                                                                                                           

9. Если выделить некоторые количественные или качественные признаки для конкретной выборки и провести изучение выборки по выделенным признакам, то их значение принято называть …

а) вариантой; б) выборкой; в) модой; г) медианой.

10. Метод χ2 проверки гипотезы о нормальном законе распределения выборки носит имя …

а) Колмогорова; б) Пирсона; б) Фишера; г) Стьюдента


Литература

1. Баврин И. И. Высшая математика. – М.: Издательский центр «Академия», 2002.

2.  Гмурман В. Е. Руководство к решению задач по теории вероятностей и математической статистике: Учеб. пособие – 12-е изд., переаб. – М.: Высшее образование, 2006.

3.  Ильин В. А. Высшая математика. – М.: Проспект, 2002.

4.  Ильин В. А., Куркина А. В. Высшая математика. – М., 2004.

5. Лобоцкая Н. Л. Основы высшей математики. – Минск: Высшая школа, 1978.

6. Маркович Э. С. Курс высшей математики с элементами теории вероятностей и математической статистики. – М.: Высшая школа, 1982.

7. Суходольский Г. В. Основы математической статистики для психологов.

 


Приложение 1

Таблица значений функции


Приложение 2

Таблица критических точек распределения Пирсона «хи-квадрат»

k /α 0,01 0,025 0,05 0,95 0,975 0,99
1 6,63490 5,02389 3,84146 0,00393 0,00098 0,00016
2 9,21034 7,37776 5,99146 0,10259 0,05064 0,02010
3 11,34487 9,34840 7,81473 0,35185 0,21580 0,11483
4 13,2767 11,14329 9,48773 0,71072 0,48442 0,29711
5 15,08627 12,8325 11,0705 1,14548 0,83121 0,55430
6 16,81189 14,44938 12,59159 1,63538 1,23734 0,87209
7 18,47531 16,01276 14,06714 2,16735 1,68987 1,23904
8 20,09024 17,53455 15,50731 2,73264 2,17973 1,64650
9 21,66599 19,02277 16,91898 3,32511 2,70039 2,08790
10 23,20925 20,48318 18,30704 3,94030 3,24697 2,55821
11 24,72497 21,92005 19,67514 4,57481 3,81575 3,05348
12 26,21697 23,33666 21,02607 5,22603 4,40379 3,57057
13 27,68825 24,7356 22,36203 5,89186 5,00875 4,10692
14 29,14124 26,11895 23,68479 6,57063 5,62873 4,66043
15 30,57791 27,48839 24,99579 7,26094 6,26214 5,22935
16 31,99993 28,84535 26,29623 7,96165 6,90766 5,81221
17 33,40866 30,19101 27,58711 8,67176 7,56419 6,40776
18 34,80531 31,52638 28,86930 9,39046 8,23075 7,01491
19 36,19087 32,85233 30,14353 10,11701 8,90652 7,63273
20 37,56623 34,16961 31,41043 10,85081 9,59078 8,26040
21 38,93217 35,47888 32,67057 11,59131 10,2829 8,89720
22 40,28936 36,78071 33,92444 12,33801 10,98232 9,54249
23 41,63840 38,07563 35,17246 13,09051 11,68855 10,19572
24 42,97982 39,36408 36,41503 13,84843 12,40115 10,85636
25 44,31410 40,64647 37,65248 14,61141 13,11972 11,52398
26 45,64168 41,92317 38,88514 15,37916 13,84391 12,19815
27 46,96294 43,19451 40,11327 16,15140 14,57338 12,87850
28 48,27824 44,46079 41,33714 16,92788 15,30786 13,56471
29 49,58788 45,72229 42,55697 17,70837 16,04707 14,25645
30 50,89218 46,97924 43,77297 18,49266 16,79077 14,95346
31 52,19139 48,23189 44,98534 19,28057 17,53874 15,65546
32 53,48577 49,48044 46,19426 20,07191 18,29076 16,36222
33 54,77554 50,72508 47,39988 20,86653 19,04666 17,07351
34 56,06091 51,96600 48,60237 21,66428 19,80625 17,78915
35 57,34207 53,20335 49,80185 22,46502 20,56938 18,50893
36 58,61921 54,43729 50,99846 23,26861 21,33588 19,23268
37 59,89250 55,66797 52,19232 24,07494 22,10563 19,96023
38 61,16209 56,89552 53,38354 24,8839 22,87848 20,69144
39 62,42812 58,12006 54,57223 25,69539 23,65432 21,42616
40 63,69074 59,34171 55,75848 26,5093 24,43304 22,16426
41 64,95007 60,56057 56,94239 27,32555 25,21452 22,90561
42 66,20624 61,77676 58,12404 28,14405 25,99866 23,65009
43 67,45935 62,99036 59,30351 28,96472 26,78537 24,39760
44 68,70951 64,20146 60,48089 29,78748 27,57457 25,14803
45 69,95683 65,41016 61,65623 30,61226 28,36615 25,90127
46 71,20140 66,61653 62,82962 31,43900 29,16005 26,65724
47 72,44331 67,82065 64,00111 32,26762 29,95620 27,41585
48 73,68264 69,02259 65,17077 33,09808 30,75451 28,17701
49 74,91947 70,22241 66,33865 33,93031 31,55492 28,94065
50 76,15389 71,42020 67,50481 34,76425 32,35736 29,70668


Обычно такая точность (5 знаков после запятой) не требуется. Достаточно 1-2 знаков после запятой.

Элементы математической статистики

Математическая статистика – раздел математики, который занимается изучением научно обоснованных методов сбора и обработки информации.

Математика применяется в двух направлениях:

1. Для обработки результатов полученных наблюдением и получения эмпирических законов.

2. Применение математического моделирования для выявления внутренней структуры наблюдаемых явлений, для их прогнозирования и управления различными процессами.

Математической моделью, с формальной точки зрения, можно считать любую совокупность объектов и связывающих их операций.

Структура математического моделирования:

Решение математической задачи
Математическая модель
Содержательная модель
Реальный объект
                                                      

 

 

Математические модели условно можно разделить по математическому аппарату, который применяется для их решения (исследования) и по целям построения этих моделей.

Классификация Полетаева И.А.

1. Поисковые модели, то есть построение моделей для объектов, о которых почти ничего неизвестно и необходимо по типу реакции выяснить их структуру.

2. Портретные модели, то есть модели когда механизм объекта известен, но сам объект труднодоступен для наблюдения, поэтому изучение происходит через копирующую модель.

3. Исследовательские модели – это модели, которые составлены для изучения возможностей данного объекта и прогнозирования наблюдаемых процессов.

С математической точки зрения модели делятся на дискретные и непрерывные.

Для построения и изучения дискретных моделей используются средства дискретной математики, то есть теории множеств, теории матриц и определителей; элементы теории графов и т.д.

Непрерывные модели. Для построения и изучения этих моделей применяются средства математического анализа: теория пределов, элементы дифференциального и интегрального исчисления, теория дифференциальных уравнений.



Поделиться:


Последнее изменение этой страницы: 2021-04-12; просмотров: 143; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.223.32.230 (0.121 с.)