Статистическая проверка гипотез 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Статистическая проверка гипотез



 

При разработке планов статистического контроля и регулирования качества, а также при статистическом анализе полученных результатов приходится решать задачи сравнения. Например, сравнение точности работы станка или измерительной системы со стандартом, сравнение качества продукции нескольких станков и так далее. Для решения этих задач по данным выборочных наблюдений используют статистические критерии, то есть методы статистической проверки гипотез. Рассмотрим некоторые общие положения.

Статистической гипотезой называют любое предположение о виде или параметрах неизвестного закона распределения.

Нулевой гипотезой называют выдвинутую гипотезу, которую нужно проверить, а гипотезу противоположную нулевой, называют конкурирующей.

Под статистическим критерием понимают однозначно определенное правило, устанавливающее условия, при которых проверяемую гипотезу по результатам наблюдений следует либо отвергнуть, либо не отвергнуть. Основу критерия составляет специально составленная выборочная характеристика (статистика) точное или приближенное распределение которой известно, где выборочные наблюдения. Каждый критерий разбивает все множество возможных значений статистики на две непересекающиеся области: критическую область и область принятия гипотезы. Если наблюдаемое значение статистики критерия попадает в критическую область, то гипотезу отвергают. В противном случае гипотезу не отвергают. При использовании статистического критерия возможны четыре случая:

- гипотеза верна и ее принимают согласно критерию;

- гипотеза неверна и ее отвергают согласно критерию;

- гипотеза верна, но ее отвергают согласно критерию (ошибка первого рода);

- гипотеза неверна, но ее принимают согласно критерию (ошибка второго рода).

Статистический критерий не дает логического доказательства или опровержения гипотезы. Так как гипотеза проверяется по результатам выборочных наблюдений, то неизбежно имеет место некоторая, хотя бы и очень малая, вероятность ошибочного решения как первого, так и второго рода. При неограниченном увеличении объема выборки и использовании обоснованного критерия возможно добиться как угодно малых вероятностей обеих ошибок. Однако наиболее часто в практических задачах контроля имеют дело с фиксированным объемом выборки, когда задаются вероятностью ошибки первого рода - так называемым уровнем значимости α.

Выбор уровня значимости ос зависит от сопоставления потерь, связанных с ошибками первого и второго рода. Следует учитывать, что уменьшение α приводит к росту вероятности ошибки второго рода. Поскольку в большинстве практических задач определить величину потерь оказывается весьма затруднительно, то, как правило, пользуются некоторыми стандартными уровнями значимости. К таким значениям можно отнести: 0.1, 0.05, 0.01, 0.005, 0.001. Наиболее часто используют значение α=0.05, которое означает, что в среднем в 5 случаях из 100 мы можем допустить ошибку и отвергнуть гипотезу , в то время, как она справедлива.

Остановимся на правилах выбора критической области. Критическую область следует выбирать так, чтобы вероятность показания в нее была равна уровню значимости ос, если верна нулевая гипотеза , и максимальна, если верна конкурирующая гипотеза . Второе условие выражает требование максимума мощности критерия.

Под мощностью критерия понимают вероятность того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза, то есть вероятность не допустить ошибку второго рода (β – вероятность ошибки второго рода).

С целью обеспечения максимума мощности критерия в зависимости от гипотезы выбирают правостороннюю, левостороннюю или двустороннюю критические области. Границы критической области при заданном уровне значимости α находят из соотношений:

- для правосторонней критической области

,

- для двусторонней критической области

,

где - левосторонняя, а - правосторонняя границы критической области.

Статистические критерии позволяют либо отвергнуть гипотезу (высказанная гипотеза противоречит данным наблюдений), либо не отвергнуть (гипотеза не противоречит данным наблюдений, а поэтому ее можно принять в качестве одного из допустимых решений). При этом неотрицательный результат не означает, что наше предположение (гипотеза) является единственно подходящим. Поэтому статистически проверенную гипотезу следует рассматривать как достаточно правдоподобное, не противоречащее опыту утверждение.

Предварительный выбор закона распределения

 

Большинство применяемых в практике контроля статистических методов основано на предложении, что распределение контролируемого признака подчиняется определенному теоретическому закону (нормальному, биноминальному, пуассоновскому и так далее) с параметрами, либо оцениваемыми по выборке, либо заранее известными. Применению этих методов должна предшествовать проверка по данным выборочных наблюдений гипотезы о законе распределения. Проверка гипотезы о законе распределения значения признака в генеральной совокупности осуществляется с помощью критериев согласия.

Чаще всего на практике имеют дело с нормальным распределением. Чем это объясняется? Ответ на этот вопрос дан А.М.Ляпуновым в центральной предельной теореме теории вероятности. Приведем следствие из нее: если случайная величина представляет собой сумму очень большого числа взаимно независимых случайных величин, влияние каждой из которых на всю сумму ничтожно мало, то имеет распределение, близкое к нормальному.

Функция плотности нормального закона распределения имеет вид , а интегральная функция распределения –

У нормального распределения два параметра (количество параметров ): математическое ожидание и среднее квадратическое отклонение . Их оцениваем по выборке: .

Кривая нормального распределения симметрична относительно прямой .

1) Для нормального закона средняя арифметическая , мода и медиана равны как характеристики центра распределения:

У нас: 9,0548; 9,115; 9,097.

Как видно, значения этих величин практически не отличаются друг от друга.

2) У кривой нормального распределения коэффициенты асимметрии и эксцесса равны нулю.

У нас: –0,3; –0,25.

Как видно, значение коэффициента асимметрии и значение коэффициента эксцесса отличаются от нуля. (Замечание: считается, что число , если 1.)

3) В случае нормального распределения справедливо следующее условие:

Проверим выполнение этого условия для нашего примера.

;

.

Условия выполняется.

4) На практике для выдвижения гипотезы о нормальном распределении используют правило 3-х сигм: если случайная величина распределена нормально, то абсолютная величина её отклонения от математического ожидания не превосходит утроенного среднеквадратического отклонения, т.е. все значения случайной величины должны попасть в интервал: :

Рисунок 5. – Правило 3-х сигм.

В нашем случае все значения величин попадают в интервал , равный , то есть в интервал (6,3848; 11,7248), так как 6,75, 10,97.

Таким образом, у нас есть основания предположить, что изучаемая случайная величина распределена по нормальному закону (нулевая гипотеза):

,

где – опытные частоты, – теоретические частоты, – длина интервала, – объём выборки, – среднее квадратическое отклонение, – табулированная функция, .



Поделиться:


Последнее изменение этой страницы: 2016-08-26; просмотров: 431; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 52.14.224.197 (0.015 с.)