Числовые характеристики выборки 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Числовые характеристики выборки



 

Выборочное среднее – среднее арифметическое всех значений выборки, находится по формуле

.

Выборочная дисперсия вычисляется по формуле

.

Выборочное СКО вычисляется по формуле

.

Исправленная выборочная дисперсия вычисляется по формуле

.

Исправленное выборочное СКО вычисляется по формуле

.

 

Для группированной выборки формулы примут вид:

, , ,

где – средняя точка интервала группированного ряда.

 

Доверительным интервалом называют интервал , который покрывает неизвестный параметр а с заданной вероятностью g; здесь – оценка параметра а, концы и доверительные границы (они оценивают возможную погрешность), число g – доверительная вероятность или надежность. Число характеризует точность оценки.

Доверительный интервал для математического ожидания при большом объеме выборки и неизвестном среднем квадратическом отклонении выражается формулой

,

где – функция, обратная функции Лапласа (приложение 1), т.е. такое значение аргумента в таблице функции Лапласа, для которого функция Лапласа равна g.

Замечание. Если использовать таблицу значений функции Лапласа , то точность оценки находится по формуле .

 

Проверка статистической гипотезы о нормальном законе распределения генеральной совокупности с помощью критерия Пирсона

 

Постановка задачи. Относительно некоторой генеральной совокупности Х высказывается гипотеза Н (о возможных значениях числовых характеристик, о виде закона распределения…) которую называют статистической гипотезой. Из этой генеральной совокупности извлекается выборка . Требуется указать правило, при помощи которого можно было бы по каждой данной выборке решить вопрос о том, следует ли отклонить гипотезу Н или принять ее.

Нулевой гипотезой (основной) называют основную выдвигаемую гипотезу .

Конкурирующей (альтернативной) называют гипотезу , которая противоречит нулевой гипотезе .

Для проверки нулевой гипотезы используют специально подобранную случайную величину, которая рассчитывается по экспериментальной выборке, точное или приближенное распределение которой известно. Эту случайную величину К называют статистическим критерием.

Зная закон распределения К можно определить вероятность попадания К в любой интервал, т.е. для любых значений а и b.

Обозначим: .

Уровнем значимости a называют условное достаточно малое значение вероятности , соответствующее практически невозможному событию . При этом область называют критической областью.

Областью допустимых значений считают область , так как достаточно велика при малых a.

Итак: при выбранном значении a для данной гипотезы известна критическая область , в которую с вероятностью критерий К попасть не должен.

Если вычисленный по выборке критерий К оказался в критической области , говорят о несоответствии гипотезы фактическим данным, т.е. об отсутствии оснований принять гипотезу . Если критерий К оказался вне критической области , говорят о соответствии гипотезы фактическим данным, т.е об отсутствии оснований отвергать гипотезу .

При статистической проверке правильности выдвигаемой гипотезы могут быть допущены ошибки двух родов: ошибка первого рода состоит в том, что гипотеза отвергнута, а она верна; ошибка второго рода состоит в том, что гипотеза принята, а она не верна.

 

Критерием согласия называют критерий проверки статистической гипотезы о предполагаемом законе неизвестного распределения СВ.

 

Критерий согласия Пирсона (критерий ).

 

Пусть выдвигается простая гипотеза , полностью определяющая вид функции распределения исследуемой СВ Х. При этом имеется выборка достаточно большого объема, которой соответствует определенный статистический ряд.

В качестве критерия проверки справедливости гипотезы выбирается СВ:

,

где – теоретические относительные частоты появления величины , вычисленные в предположении гипотезы по известной плотности распределения вероятностей ; – теоретические абсолютные частоты появления .

Эта величина при распределена по закону с r степенями свободы

,

где s – число различных значений СВ Х (количество интервалов группированной выборки), l – число параметров предполагаемого закона распределения.

Распределение не обладает симметрией, поэтому критическая область выбирается односторонней , значение полностью определяются по уровню значимости a и данному значению по таблице распределения (приложение 2).

Критерий использует тот факт, что случайная величина имеет распределение, близкое к нормальному . Чтобы это утверждение было достаточно точным, необходимо, чтобы для всех интервалов группированного статистического ряда выполнялось условие . Если в некоторых интервалах это условие не выполняется, то их следует объединять с соседними. Так как после объединения остается меньше интервалов, то число степеней свободы следует вычислять, используя число вновь полученных интервалов.

 

Пример

Результаты измерений некоторой физической величины представлены в таблице:

i                
1;3,5 3,5;6 6;8,5 8,5;11 11;13,5 13,5;16 16;18,5
               

1. Найти функцию распределения выборки и построить ее график.

2. Построить гистограмму относительных частот.

3. Найти числовые характеристики выборки: выборочное среднее и исправленную выборочную дисперсию .

4. Используя функцию Лапласа, построить доверительный интервал для математического ожидания, соответствующий доверительной вероятности .

5. С помощью критерия (Пирсона) проверить гипотезу о нормальном распределении генеральной совокупности при уровне значимости .

Решение

Объем выборки , длина интервала . Для нахождения эмпирической функции распределения , построения гистограммы относительных частот и вычисления числовых характеристик выборки дополним заданную таблицу следующими строками: строкой, в которой расположим средние точки каждого интервала, строкой относительных частот , строкой накопленных относительных частот и строкой, в которой вычислим высоты столбиков гистограммы относительных частот .

Таблица 1

 

i                
1;3,5 3,5;6 6;8,5 8,5;11 11;13,5 13,5;16 16;18,5
               
2,25 4,75 7,25 9,75 12,25 14,75 17,25
0,03 0,08 0,14 0,27 0,2 0,16 0,07 0,05
0,03 0,11 0,25 0,52 0,72 0,88 0,95  
0,012 0,032 0,056 0,108 0,08 0,064 0,028 0,02

 

1. Эмпирическая функция распределения определяется по значениям накопленных относительных частот, которые расположены в шестой строке таблицы 1. Эта функция имеет скачки в точках – серединах интервалов группированного статистического ряда.

Аналитическое выражение эмпирической функции распределения имеет вид:

.

График эмпирической функции распределения изображен на рис. 1.

  1 0,95 0,88     0,72   0,52     0,25     0,11 0,03

-0,25 2,25 4,75 7,25 9,75 12,25 14,75 17,25 х

 

Рис. 1

 

2. Построим гистограмму относительных частот, для этого на каждом интервале группированной выборки строим столбики, высоты которых вычислены в седьмой строке таблицы 1. График гистограммы изображен на рис. 2.

 

 
 
 
 
 
hi

0,108

 
 

 

 


0,08

 

 

0,064

 
0,056

 
 

 


0,032 0,028

0,02

0,012

 

 
х

 
-1,5 1 3,5 6 8,5 11 13,5 16 18,5

 

Рис. 2

 

 

3. Найдем числовые характеристики выборки. Выборочное среднее находим по формуле , в нашем случае

Исправленную выборочную дисперсию находим по формуле , в нашем случае

.

 

4. При большом объеме выборки доверительный интервал для математического ожидания имеет вид

.

Используя таблицу значений функции Лапласа (приложение 1) находим .

Вычислим , тогда доверительный интервал для математического ожидания имеет вид

или

.

 

5. Выдвигаем простую гипотезу о нормальном распределении генеральной совокупности. В качестве критерия проверки справедливости гипотезы выбирается случайная величина

,

где находятся по формуле вероятности попадания случайной величины в интервал в предположении гипотезы о нормальном законе

,

где – функция Лапласа.

Замечание. Если использовать таблицу значений функции Лапласа , то вероятности попадания случайной величины в интервал в предположении гипотезы о нормальном законе распределения находится по формуле .

Для соблюдения условия полагают , .

Для вычисления критерия составим расчетную таблицу:

 

Таблица 2

 

I                
1;3,5 3,5;6 6;8,5 8,5;11 11;13,5 13,5;16 16;18,5
               
2,25 4,75 7,25 9,75 12,25 14,75 17,25
  3,5   8,5   13,5  
  3,5   8,5   13,5  
0,5803 1,1849 1,7895
0,5803 1,1849 1,7895
0,438 0,764 0,926  
0,438 0,764 0,926
0,033 0,0755 0,1565 0,2255 0,2285 0,163 0,081 0,037
3,3 7,55 15,65 22,55 22,85 16,3 8,1 3,7
    10,85 15,65 22,55 22,85 16,3 11,8  
  0,15 4,45 0,2  
  0,0225 2,7225 19,8025 8,1225 0,09 0,04  
  0,0020 0,1739 0,8781 0,3554 0,0055 0,0033  

Находим сумму элементов 11-ой и 12-ой строк таблицы 2, получаем .

Критерий равен сумме элементов последней строки таблицы 12:

.

Находим критическую область . Так как уровень значимости по условию, число степеней свободы , то согласно таблице распределения - , критическая область имеет вид .

Так как критерий не попал в критическую область , то нет оснований отвергать гипотезу о нормальном законе распределения генеральной совокупности.

 



Поделиться:


Последнее изменение этой страницы: 2016-04-21; просмотров: 2209; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.223.172.252 (0.064 с.)