Этап 2. Первичная обработка данных. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Этап 2. Первичная обработка данных.



1) Исключение ложных данных.

При больших выборках лучше всего использовать таблицу распределения Стьюдента. Критерием проверки служат неравенства:

, где вычисляют по формулам (4) или (5), а по формуле (6):

, где

, где для n=200 -критическое значение распределения Стьюдента.

При выполнении неравенства (1) рассматриваем значение выборка никогда не исключают. При выполнении неравенства (2) рассматриваемые значения можно исключить, если для исключения есть дополнительные доводы экспериментатора. При выполнения неравенства (3) рассматриваемые значения исключают всегда как ложные. Для больших выборок процедуру исключения нужно повторять до невыполнения неравенств (2) или (3), каждый раз пересчитывая статистики и

Проделывая данный алгоритм для нашей выборки, исключаем 6 значений: 19,93; 20,18; 20,76; 20,93; 21,84; 21,91. Следовательно, объем выборки стал m=194.

2) Делаем статистическую проверку случайности и независимости результатов наблюдения с помощью критерия серий и критерия «восходящих» и «нисходящих» серий.

а) Критерий серий, основанный на медиане выборки.

В качестве выборочного значения медианы берем средний по расположению элемент упорядоченной выборки. Воспользуемся формулой (7) для m=194 – четного:

.

Затем возвращаемся к первоначальной неупорядоченной выборке с исключенными ложными значениями и вместо каждого xiставим знак «+», если , и «-», если . Полученная последовательно плюсов и минусов характеризуется числом серий и диной самой длинной серии , где под серией понимают последовательность подряд идущих плюсов или подряд идущих минусов.

Выдвинем гипотезы H0 – исходные результаты наблюдения являются стохастически независимыми, H1 - исходные результаты наблюдения не являются стохастически независимыми.

Примем уровень значимости , тогда решение вопроса о стохастической независимости результатов наблюдения основываем на следующих неравенствах:

После проделывания данной процедуры, получили , .

Следовательно, гипотеза H0отвергается, H1 принимается.               

б) Критерий «восходящих» и «нисходящих» серий.

Так же, как и в предыдущем критерии, исследуется последовательность знаков – плюсов и минусов, о правило построения этой последовательности другое: исходным пунктом является последовательность результатов наблюдения с исключенными ложными значениями x1, x2,…, xm. На i-м месте этой последовательности ставится знак плюс, если xi+1-xi> 0, и минус, если xi+1-xi< 0. Критерий основан на соображении, что если выборка случайна, то в построении последовательности знаков общее число серий не может быть слишком малым, а их длина слишком большой.

Выдвинем гипотезы H0 – исходные результаты наблюдения являются стохастически независимыми, H1 - исходные результаты наблюдения не являются стохастически независимыми.

 Примем уровень значимости , тогда количественное выражение этого правила примет вид:

После проделывания данной процедуры, получили , .

Следовательно, гипотеза H0отвергается, H1 принимается.       

3) Построение интервального ряда.

Для определения длины интервала воспользуемся формулой Стерджеса:

Сделаем отступ слева по формуле , тогда получим ряд:

Интервал ni – частота
[22,328; 26,392) 6
[26,392; 30,456) 20
[30,456; 34,519) 12
[34,519; 38,584) 16
[38,584; 42,648) 56
[42,648; 46,712) 60
[46,712; 50,776) 2
[50,776; 54,839) 12
[54,839; 58,904) 8
[58,904; 62,968] 2

4) Нахождение точечных и интервальных оценок мат. ожидания и дисперсии.

а) Точечную оценку мат. ожидания и дисперсии найдем по формулам:

- несмещенная и состоятельная оценка мат. ожидания;

 - несмещенная и состоятельная оценка дисперсии

$- среднеквадратичное отклонение.

б) Интервальную оценку мат. ожидания найдем по формуле:

, где , тогда

- интервальная оценка мат. ожидания

- Интервальную оценку дисперсии найдем по формуле:

, где , n=194, тогда

.

5) Рассчитаем эмпирическую частоту и найдем эмпирическую функцию распределения, результаты приведены в Таблице 1:

Интервал ni nx F` pi*
[22,328; 26,392) 6 0 0 0,030928
[26,392; 30,456) 20 6 0,030928 0,103093
[30,456; 34,519) 12 26 0,134021 0,061856
[34,519; 38,584) 16 38 0,195876 0,082474
[38,584; 42,648) 56 54 0,278351 0,28866
[42,648; 46,712) 60 110 0,56701 0,309278
[46,712; 50,776) 2 170 0,876289 0,010309
[50,776; 54,839) 12 172 0,886598 0,061856
[54,839;58,904) 8 184 0,948454 0,041237
[58,904;62,968] 2 192 0,989691 0,010309

Таблица 1

ni– эмпирическая частота;

nx– накопленная эмпирическая частота;

- эмпирическая функция распределения;

- относительная эмпирическая частота.

6) Построение гистограммы.

По виду гистограммы выдвинем гипотезы о законе распределения:

H0 – данные подчиняются нормальному закону распределения;

H1 – данные не подчиняются нормальному закону распределения.

7)Для дальнейших рассуждений объединим интервалы, у которых частота n<5, получим:

Интервал ni – частота
[22,328; 26,392) 6
[26,392; 30,456) 20
[30,456; 34,519) 12
[34,519; 38,584) 16
[38,584; 42,648) 56
[42,648; 46,712) 60
[46,712; 54,839) 14
[54,839; 62,968) 10

 

8) Рассчитаем теоретическую частоту и найдем теоретическую функцию распределения, результаты приведены в Таблице 2:

Интервал ni nx F` pi* ni` nx` F*
[22,328; 26,392) 6 0 0 0,030928 5,455243 0 0
[26,392; 30,456) 20 6 0,030928 0,103093 10,88342 5,455243 0,02812
[30,456; 34,519) 12 26 0,134021 0,061856 22,26216 16,33867 0,08422
[34,519; 38,584) 16 38 0,195876 0,082474 34,53831 38,60083 0,19897
[38,584; 42,648) 56 54 0,278351 0,28866 40,64453 73,13914 0,37701
[42,648; 46,712) 60 110 0,56701 0,309278 36,28136 113,7837 0,58651
[46,712; 54,839) 14 170 0,876289 0,072165 37,1823 150,065 0,77353
[54,839; 62,968] 10 184 0,94854 0,051546 6,752673 187,2473 0,96519

Таблица 2

 - теоретическая частота, где

nx`– накопленная теоретическая частота;

- теоретическая функция распределения.

Этап 3. Проверка гипотезы по критерию

1. Вычисляем выборочное значение статистики критерия:

.

2. Выберем уровень значимости .

3. По таблице - распределения находим критическую точку , где m=8 – число интервалов выборки, r=2 – число параметров, предполагаемого распределения.

4. , следовательно, гипотеза H0 отвергается.



Поделиться:


Последнее изменение этой страницы: 2021-06-14; просмотров: 96; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.191.103.143 (0.014 с.)