Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Построение вариационного ряда

Поиск

Введение

 

Наука, изучающая закономерности массовых случайных событий, называется теорией вероятностей. Применение теории вероятностей к обработке больших совокупностей чисел называется математической статистикой. Основная задача математической статистики состоит в разработке методов, позволяющих обобщать результаты наблюдений. Статистические совокупности могут быть взяты из самых разнообразных областей, поэтому математическая статистика находит себе применение во всевозможных исследованиях: в физике, астрономии, биологии, метеорологии, демографии, экономике, современном производстве и технике и т.д.

Любое статистическое исследование состоит из нескольких основных этапов:

1) организация и планирование статистических наблюдений;

2) сбор статистических данных;

3) анализ статистических данных;

4) принятие решений, рекомендаций и выводов;

5) прогнозирование случайных явлений;

6) статистический контроль регулирования хода технологических процессов, оценка качества партий продукции.

Цель методических указаний – формирование навыков статистической обработки экспериментального материала, которые могут быть использованы при выполнении исследовательских работ по различным учебным дисциплинам, при выполнении курсовых работ и дипломном проектировании, в научных исследованиях. Эти навыки будут полезны студентам всех специальностей и различных форм обучения.


Задания к РГР:

1. По результатам выборки построить вариационный ряд.

2. Представить графическое изображение вариационного ряда (полигон и гистограмму).

3. Составить эмпирическую функцию распределения и нарисовать ее график.

4. Вычислить основные выборочные характеристики.

5. Найти точечные и интервальные оценки параметров распределения.

6. На основе полученных результатов выдвинуть гипотезу о виде распределения (нормальное распределение).

7. С помощью критерия согласия Пирсона проверить гипотезу о нормальном распределении признака генеральной совокупности.

8. Построить эмпирическую кривую распределения.


Основные понятия математической статистики

 

Генеральной совокупностью называется совокупность всех наблюдений, которые могли быть сделаны при данном реальном комплексе условий измерений. Число членов, образующих генеральную совокупность, называется объемом генеральной совокупности N.

Генеральная совокупность является понятием модельным. Говоря о распределении случайной величины X в генеральной совокупности, мы можем делать различные предположения о функции распределения случайной величины или о параметрах этой функции.

Выборочной совокупностью или просто выборкой объема n называется совокупность n объектов, отобранных из исследуемой генеральной совокупности.

Пусть имеется выборка результатов испытаний.

 

8,91 7,36 9,10 9,80 8,43 10,10 7,45 9,01 8,07 8,86 10,19 10,71 9,68 9,33 8,93 9,03 10,11 7,46 9,30 8,62 8,92 7,33 8,63 9,24 8,66 8,44 9,54 8,02 8,62 8,12 9,73 8,43 7,95 9,89 9,93 8,49 6,75 8,38 8,72 9,57 9,96 9,42 9,24 9,56 8,29 7,13 9,42 9,84 8,06 8,67
8,98 8,43 9,04 10,60 9,63 10,97 8,77 9,07 8,91 10,38 9,31 9,29 9,04 10,13 9,68 8,66 8,88 9,43 8,81 8,20 10,43 8,97 9,18 10,33 10,04 9,14 10,22 9,10 8,25 8,66 9,68 10,50 9,51 9,88 8,16 8,98 8,13 7,21 9,33 10,60 8,99 9,13 9,14 10,25 6,84 8,72 10,35 8,12 9,94 7,41

 

В данном примере объем выборки n =100.

Для того чтобы суждения о законах распределения случайной величины X или об их числовых характеристиках были объективны, необходимо, чтобы выборка была представительной (репрезентативной), т.е. достаточно хорошо представляла исследуемую случайную величину. В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществить случайно: каждый объект выборки отобран случайно из генеральной совокупности, если все объекты имеют одинаковую вероятность попасть в выборку. Выборка считается большой, если ее объем n >30.

Показатели рассеяния

Для характеристики отклонения значений признака от среднего арифметического используются:

1) Дисперсия определяется по формуле:

.

В нашем случае:

.

2) Среднее квадратическое отклонение определяется по формуле:

.

В нашем случае: 0,89.

3) В качестве относительной характеристики рассеяния используют коэффициент вариации, который показывает, насколько велико рассеяние значений по сравнению со средней арифметической. Коэффициент вариации определяется по формуле:

В отличие от дисперсии и среднего квадратического отклонения коэффициент вариации – величина безразмерная, что позволяет сравнивать изменчивость признаков как в пределах одной совокупности, так и разных совокупностей, независимо от единиц измерения разных сопоставляемых признаков.

Совокупность считается однородной, если коэффициент вариации не превышает 33 % (для распределений, близких к нормальному).

Исходя из величины коэффициента вариации, можно установить характеристику изменчивости, например, по следующей схеме:

Коэффициент вариации, до 5% 6–10% 11–20% 21–50% 50%
Изменчивость слабая умеренная значительная большая очень большая

В нашем случае:

.

Изменчивость умеренная, совокупность однородна.

Предварительный выбор закона распределения

 

Большинство применяемых в практике контроля статистических методов основано на предложении, что распределение контролируемого признака подчиняется определенному теоретическому закону (нормальному, биноминальному, пуассоновскому и так далее) с параметрами, либо оцениваемыми по выборке, либо заранее известными. Применению этих методов должна предшествовать проверка по данным выборочных наблюдений гипотезы о законе распределения. Проверка гипотезы о законе распределения значения признака в генеральной совокупности осуществляется с помощью критериев согласия.

Чаще всего на практике имеют дело с нормальным распределением. Чем это объясняется? Ответ на этот вопрос дан А.М.Ляпуновым в центральной предельной теореме теории вероятности. Приведем следствие из нее: если случайная величина представляет собой сумму очень большого числа взаимно независимых случайных величин, влияние каждой из которых на всю сумму ничтожно мало, то имеет распределение, близкое к нормальному.

Функция плотности нормального закона распределения имеет вид , а интегральная функция распределения –

У нормального распределения два параметра (количество параметров ): математическое ожидание и среднее квадратическое отклонение . Их оцениваем по выборке: .

Кривая нормального распределения симметрична относительно прямой .

1) Для нормального закона средняя арифметическая , мода и медиана равны как характеристики центра распределения:

У нас: 9,0548; 9,115; 9,097.

Как видно, значения этих величин практически не отличаются друг от друга.

2) У кривой нормального распределения коэффициенты асимметрии и эксцесса равны нулю.

У нас: –0,3; –0,25.

Как видно, значение коэффициента асимметрии и значение коэффициента эксцесса отличаются от нуля. (Замечание: считается, что число , если 1.)

3) В случае нормального распределения справедливо следующее условие:

Проверим выполнение этого условия для нашего примера.

;

.

Условия выполняется.

4) На практике для выдвижения гипотезы о нормальном распределении используют правило 3-х сигм: если случайная величина распределена нормально, то абсолютная величина её отклонения от математического ожидания не превосходит утроенного среднеквадратического отклонения, т.е. все значения случайной величины должны попасть в интервал: :

Рисунок 5. – Правило 3-х сигм.

В нашем случае все значения величин попадают в интервал , равный , то есть в интервал (6,3848; 11,7248), так как 6,75, 10,97.

Таким образом, у нас есть основания предположить, что изучаемая случайная величина распределена по нормальному закону (нулевая гипотеза):

,

где – опытные частоты, – теоретические частоты, – длина интервала, – объём выборки, – среднее квадратическое отклонение, – табулированная функция, .

Приложение 1

Таблица значений функции

 

 

                     
0.0 0.3989                  
0.1                    
0.2                    
0.3                    
0.4                    
0.5                    
0.6                    
0.7                    
0.8                    
0.9                    
1.0 0.2420                  
1.1                    
1.2                    
1.3                    
1.4                    
1.5                    
1.6                    
1.7                    
1.8                    
1.9                    
2.0 0.0540                  
2.1                    
2.2                    
2.3                    
2.4                    
2.5                    
2.6                    
2.7                    
2.8                    
2.9                    
3.0 0.0044                  
3.1                    
3.2                    
3.3                    
3.4                    
3.5                    
3.6                    
3.7                    
3.8                    
3.9                    

 

Приложение 2

 

Критические точки распределения χ2

 

Число степеней свободы Уровень значимости α
0.01 0.025 0.05 0.95 0.975 0.89
  6.6 5.0 3.8 0.0039 0.00098 0.00016
  9.2 7.4 6.0 0.103 0.051 0.020
  11.3 9.4 7.8 0.352 0.216 0.115
  13.3 11.1 9.5 0.711 0.484 0.297
  15.1 12.8 11.1 1.15 0.831 0.554
  16.8 14.4 12.6 1.64 1.24 0.872
  18.5 16.0 14.1 2.17 1.69 1.24
  20.1 17.5 15.5 2.73 2.18 1.65
  21.7 19.0 16.9 3.33 2.70 2.09
  23.2 20.5 18.3 3.94 3.25 2.56
  24.7 21.9 19.7 4.57 3.82 3.05
  26.2 23.3 21.0 5.23 4.40 3.57
  27.7 24.7 22.4 5.89 5.01 4.11
  29.1 26.1 23.7 6.57 5.63 4.66
  30.6 27.5 25.0 7.26 6.26 5.23
  32.0 28.8 26.3 7.96 6.91 5.81
  33.4 30.2 27.6 8.67 7.56 6.41
  34.8 31.5 28.9 9.39 8.23 7.01
  36.2 32.9 30.1 10.1 8.91 7.63
  37.6 34.2 31.4 10.9 9.59 8.26
  38.9 35.5 32.7 11.6 10.3 8.90
  40.3 36.8 33.9 12.3 11.0 9.54
  41.6 38.1 35.2 13.1 11.7 10.2
  43.0 39.4 36.4 13.8 12.4 10.9
  44.3 40.6 37.7 14.6 13.1 11.5
  45.6 41.9 38.9 15.4 13.8 12.2
  47.0 43.2 40.1 16.2 14.6 12.9
  48.3 44.5 41.3 16.9 15.3 13.6
  49.6 45.7 42.6 17.7 16.0 14.3
  50.9 47.0 43.8 18.5 16.8 15.0

 

 

ЛИтература

 

1. Гмурман В.Е. Теория вероятностей и математическая статистика: учеб. пособие для вузов / В.Е. Гмурман. – 12-е изд., перераб. – М.: Высш. образование, 2005. – 479 с.

2. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике: учеб. пособие для вузов / В.Е. Гмурман. - 11-е изд., перераб. - М.: Высш. образование, 2007. - 404 с.

3. Баранова И.М., Часова Н.А. Основы теории вероятностей и математической статистики: учеб. пособие. Ч. 1 Теория вероятностей. / И.М.Баранова [и др.]. – Брянск, 2011. – 140 с.


СОДЕРЖАНИЕ

 

Введение. 4

1. Основные понятия математической статистики. 6

2. Построение вариационного ряда. 7

3. Графическое изображение вариационных рядов. 8

4. Эмпирическая функция распределения. 10

5. Основные выборочные характеристики. 12

6. Точечные и интервальные оценки параметров генеральной совокупности 18

7. Статистическая проверка гипотез. 22

8. Предварительный выбор закона распределения. 25

9. Проверка гипотезы о виде распределения. 28

Приложение 1. 32

Приложение 2. 33

ЛИтература.. 34


Баранова И.М., Часова Н.А.

 

 

МАТЕМАТИКА

 

Статистическая обработка
экспериментальных данных

 

Методические указания к выполнению расчетно-графической работы

для студентов всех направлений подготовки бакалавров
очной и заочной форм обучения

 

 

Формат Объем Тираж Заказ

 

 

Брянск, Станке Димитрова 3, Редакционно-издательский отдел

Отпечатано: Печатный цех БГИТА

 

 

Введение

 

Наука, изучающая закономерности массовых случайных событий, называется теорией вероятностей. Применение теории вероятностей к обработке больших совокупностей чисел называется математической статистикой. Основная задача математической статистики состоит в разработке методов, позволяющих обобщать результаты наблюдений. Статистические совокупности могут быть взяты из самых разнообразных областей, поэтому математическая статистика находит себе применение во всевозможных исследованиях: в физике, астрономии, биологии, метеорологии, демографии, экономике, современном производстве и технике и т.д.

Любое статистическое исследование состоит из нескольких основных этапов:

1) организация и планирование статистических наблюдений;

2) сбор статистических данных;

3) анализ статистических данных;

4) принятие решений, рекомендаций и выводов;

5) прогнозирование случайных явлений;

6) статистический контроль регулирования хода технологических процессов, оценка качества партий продукции.

Цель методических указаний – формирование навыков статистической обработки экспериментального материала, которые могут быть использованы при выполнении исследовательских работ по различным учебным дисциплинам, при выполнении курсовых работ и дипломном проектировании, в научных исследованиях. Эти навыки будут полезны студентам всех специальностей и различных форм обучения.


Задания к РГР:

1. По результатам выборки построить вариационный ряд.

2. Представить графическое изображение вариационного ряда (полигон и гистограмму).

3. Составить эмпирическую функцию распределения и нарисовать ее график.

4. Вычислить основные выборочные характеристики.

5. Найти точечные и интервальные оценки параметров распределения.

6. На основе полученных результатов выдвинуть гипотезу о виде распределения (нормальное распределение).

7. С помощью критерия согласия Пирсона проверить гипотезу о нормальном распределении признака генеральной совокупности.

8. Построить эмпирическую кривую распределения.


Основные понятия математической статистики

 

Генеральной совокупностью называется совокупность всех наблюдений, которые могли быть сделаны при данном реальном комплексе условий измерений. Число членов, образующих генеральную совокупность, называется объемом генеральной совокупности N.

Генеральная совокупность является понятием модельным. Говоря о распределении случайной величины X в генеральной совокупности, мы можем делать различные предположения о функции распределения случайной величины или о параметрах этой функции.

Выборочной совокупностью или просто выборкой объема n называется совокупность n объектов, отобранных из исследуемой генеральной совокупности.

Пусть имеется выборка результатов испытаний.

 

8,91 7,36 9,10 9,80 8,43 10,10 7,45 9,01 8,07 8,86 10,19 10,71 9,68 9,33 8,93 9,03 10,11 7,46 9,30 8,62 8,92 7,33 8,63 9,24 8,66 8,44 9,54 8,02 8,62 8,12 9,73 8,43 7,95 9,89 9,93 8,49 6,75 8,38 8,72 9,57 9,96 9,42 9,24 9,56 8,29 7,13 9,42 9,84 8,06 8,67
8,98 8,43 9,04 10,60 9,63 10,97 8,77 9,07 8,91 10,38 9,31 9,29 9,04 10,13 9,68 8,66 8,88 9,43 8,81 8,20 10,43 8,97 9,18 10,33 10,04 9,14 10,22 9,10 8,25 8,66 9,68 10,50 9,51 9,88 8,16 8,98 8,13 7,21 9,33 10,60 8,99 9,13 9,14 10,25 6,84 8,72 10,35 8,12 9,94 7,41

 

В данном примере объем выборки n =100.

Для того чтобы суждения о законах распределения случайной величины X или об их числовых характеристиках были объективны, необходимо, чтобы выборка была представительной (репрезентативной), т.е. достаточно хорошо представляла исследуемую случайную величину. В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществить случайно: каждый объект выборки отобран случайно из генеральной совокупности, если все объекты имеют одинаковую вероятность попасть в выборку. Выборка считается большой, если ее объем n >30.

Построение вариационного ряда

 

Пусть изучается некоторая дискретная или непрерывная случайная величина, закон распределения которой известен. Статистический материал, полученный в результате измерений представляют в виде таблицы, состоящей из двух строк, в первой из которых находятся расположенные в возрастающем порядке значения признаков (для дискретной случайной величины) или интервалов (для непрерывной случайной величины), а во второй – их частота ; (число одинаковых значений дискретной случайной величины или число наблюдений в i -м интервале в случае непрерывной случайной величины). Такое представление признака и частот называется вариационным рядом.

На основе имеющейся выборки составляем интервальный статистический ряд.

Для выбора оптимальной длины интервалов h воспользуемся формулой: где и – соответственно максимальное и минимальное значения признака в выборке; l – количество интервалов, причём в данной работе мы будем использовать следующую формулу: , где n – объём выборки.

Для нашего случая: 6,75, 10,97,

Найдём количество интервалов: .

Найдём длину интервалов (шаг): (10,97–6,75)/10=0,422 0,43.

Нижнюю границу первого интервала принимаем 6,75.

Зная нижнюю границу первого интервала и длину интервала , построим весь интервальный ряд

Проанализируем каждое значение имеющейся выборки на факт попадания в определённый интервал, а число значений, попавших в интервал, запишем в столбец «Частота » таблицы 1. Проведём проверку полученных значений частот: .

Найдем середину каждого интервала, используя формулу: , где и – конечное и начальное значения определённого интервала. Результаты занесем в таблицу 1.

Таблица 1.

Интервалы Середина интервала Частота
[6,75; 7,18) 6,97 ***  
[7,18; 7,61) 7,40 ******  
[7,61; 8,04) 7,83 **  
[8,04; 8,47) 8,26 **************  
[8,47; 8,9) 8,69 **************  
[8,9; 9,33) 9,12 ************************  
[9,33; 9,76) 9,55 **************  
[9,76; 10,19) 9,98 ************  
[10,19; 10,62) 10,41 *********  
[10,62; 11,05) 10,84 **  

 



Поделиться:


Последнее изменение этой страницы: 2016-08-26; просмотров: 469; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.191.162.73 (0.009 с.)