Идентификация формы распределения результатов измерений. Критерии согласия 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Идентификация формы распределения результатов измерений. Критерии согласия



 

Допустим, что статистический ряд выравнен с помощью некоторой теоретической кривой f(x) (рис.1.1). Обычно в качестве такой кривой принимается функция распределения F(x). Как бы хорошо ни была подобрана теоретическая кривая, между ней и статистическим распределением всегда будут некоторые расхождения. Встает вопрос: чем объясняются эти расхождения? Случайными обстоятельствами, в первую очередь, связанными с малым количеством наблюдений, или неправильно подобранной функцией f(x) º F(x), определяющей эту кривую. Для ответа на этот вопрос служат так называемые критерии согласия.

Известен целый ряд таких критериев, предложенных разными авторами. Но идея их применения одинакова и заключается в следующем. Выбирается некоторая величина U, характеризующая степень расхождения между статистическим рядом (распределением), обозначим его F*(x), и теоретическим F(x). Эта величина может быть выбрана различными способами:

например, ею может быть простая разница (отклонения) между теоретическим значением функции F(x) и соответствующим этому же значению аргумента х эмпирическим значением F*(x), определенным на основе статистического ряда (гистограммы);

максимальная разница F*(x) и F(x);

сумма квадратов рассмотренных отклонений;

сумма квадратов отклонений, взятых с некоторыми коэффициентами (весами) и др.

Очевидно, что величина U, зависящая от СВ F*(x), в свою очередь, также является СВ и закон распределения этой СВ зависит от закона распределения СВ Х, над которой производились измерения (наблюдения), и от числа опытов n. Оказывается, что при некоторых способах выбора меры расхождения U закон ее распределения обладает простыми свойствами и при достаточно большом n практически не зависит от вида функции F(x). Именно такими мерами расхождения и пользуются в математической статистике в качестве критериев согласия.

 

 

КРИТЕРИЙ ПИРСОНА

Рассмотрим один из наиболее часто применяемых критериев согласия – так называемый критерий c2 (критерий Пирсона).

Пусть требуется проверить, согласуются ли экспериментальные данные статистического ряда (табл.1.1.) с гипотезой о том, что СВ Х имеет данный закон распределения, соответствующий выбранной нами теоретической функции распределения F(x) или плотности распределения вероятности f(x). Зная теоретический закон распределения, можно найти теоретические вероятности попадания СВ в каждый из интервалов:

.

Для проверки согласованности теоретического и статистического распределений, исходим из расхождений между теоретическими вероятностями и наблюденными частотами . Представляется естественным выбрать в качестве меры расхождения сумму квадратов отклонений ( - ), взятых с некоторыми «весами» :

Веса интервалов вводятся потому, что отклонения, относящиеся к различным интервалам, нельзя считать равноправными по значимости. Действительно, одно и то же по абсолютной величине отклонение может быть мало значительным, если сама вероятность велика, и очень заметным, если она мала. Поэтому веса берутся обратно пропорционально вероятностям интервалов . Но как же все-таки выбирать веса? К.Пирсон показал, что если их выбирать по формуле

,

то при больших n закон распределения величины U обладает простыми свойствами: он практически не зависит от теоретической функции распределения F(x) и от числа опытов n, а зависит только от числа интервалов , и при увеличении n приближается к так называемому распределению c2.

При таком способе выбора коэффициентов мера расхождения обычно обозначается c2:

,

где , - число значений в -ом интервале.

Распределение c2 зависит от параметра , называемого числом степеней свободы распределения. Оно равно числу интервалов минус число независимых условий (связей), наложенных на частоты . Примерами таких условий могут быть

= 1.

Это условие накладывается всегда, следовательно, во всех случаях, при любых критериях от числа интервалов надо отнимать единицу.

Если мы требуем, чтобы совпадали теоретические и статистические средние значения и дисперсии распределений, то необходимо, чтобы выполнялись условия

, .

Для определения числа степеней свободы можно записать следующее выражение , где - количество параметров в теоретическом распределении, на соответствие (согласие) которому проверяется эмпирическое распределение (статистический ряд). Нормальный закон имеет два таких параметра: математическое ожидание и дисперсию, следовательно, у него .

Для распределения c2 составлены специальные таблицы (табл.П.1.2). Если бы выбранное теоретическое распределение F(x) для всех столбцов совпадало с экспериментальными данными, то все разностей были бы равны нулю, а следовательно, и значение критерия c2 также было бы равно нулю. Таким образом, c2 есть мера суммарного отклонения между теоретическим и экспериментальным распределением.

Если вычисленная по опытным данным мера расхождения c2 меньше определенного по табл.П.1.2 значения для заданной вероятности Р, то гипотеза о совпадении экспериментального и выбранного теоретического распределения принимается. Это не значит, что гипотеза верна. Можно лишь утверждать, что она правдоподобна, то есть не противоречит опытным данным. Если же c2 больше значения , то гипотеза отвергается как противоречащая опытным данным.

Данные соображения применимы в тех случаях, когда количество опытов n достаточно велико, больше 50, при этом достаточно большим должно быть не только общее число опытов, но и число наблюдений в отдельных интервалах. На практике рекомендуется иметь в каждом интервале не менее 5-10 наблюдений. Если количество наблюдений в некоторых интервалах очень малы (1¸2), то их объединяют между собой или с соседними интервалами так, чтобы количество наблюдений в интервале было не менее 5.

С учетом вышеизложенного схема применения критерия c2 к оценке согласованности теоретического и статистического распределений сводится к следующему:

1. Определяются оценки среднего арифметического значения и среднего квадратического отклонения (СКО) s по формулам

2. Группируются результаты измерений (наблюдений) по интервалам длиной h, число которых определяют так же, как и при построении гистограммы.

3. Определяются границы интервалов .

4. Для каждого интервала находятся вероятности попадания в него наблюдений. Если в качестве теоретического используется нормальное распределение вероятностей СВ Х, то используются формулы.

,

 

где - функция Лапласа, определяемая по таблице П.1.3, при и .

Для распределений, отличающихся от нормального, используются другие формулы.

5. Определяется количество наблюдений , попавших в каждый -й интервал. Если в какой-либо интервал попадает меньше 5 наблюдений, то его объединяют с соседним.

6. Заполняется таблица 1.2 на основе табл.1.1, используемой при построении статистического ряда (п.1.1.1).

Таблица 1. 2.

 

Таблица расчета критерия согласия c2

 

Интервал,
Количество значений
Значения
Значения

 

7. Определяется мера расхождения c2 по ранее приведенной формуле.

8. Определяется число степеней свободы , и задается вероятность Р, которая обычно выбирается равной 0,95 или 0,9.

9. По числу степеней свободы и вероятности из табл.П.1.2 находится критическое значение .

10. Сравнивается рассчитанное c2 и критическое значение , найденное по таблице, если при этом

c2 < , то гипотеза о соответствии выбранной теоретической функции распределения F(x) и статистической F*(x) с вероятностью Р принимается, и функцию F(x) можно использовать для описания статистического распределения, если

c2 > , то гипотеза с вероятностью Р отвергается и выбранную теоретическую функцию распределения F(x) нельзя использовать для описания статистического распределения.

 

 

КРИТЕРИЙ КОЛМОГОРОВА

 

 

Кроме критерия Пирсона, для оценки степени согласованности теоретического и эмпирического(статистического) распределений на практике применяется еще и ряд других критериев. Рассмотрим кратко критерий Колмогорова.

В качестве меры расхождения между теоретическим и статистическим распределениями А.Н. Колмогоров рассматривает максимальное значение модуля разности между статистической функцией распределения F*(x) и выбранной теоретической функции распределения F(x) (рис.1.3):

 

Основанием для выбора в качестве меры расхождения величины D является простота ее вычисления и достаточно простой закон распределения. Колмогоров доказал, что какова бы ни была функция распределения F(x) непрерывной СВ Х, при неограниченном возрастании числа независимых наблюдений n вероятность неравенства

 

стремится к пределу

Значения вероятности , подсчитанные по этой формуле, приведены в таблице1.3.

 

Таблица 1.3

Значения критерия Колмогорова

 

0,0 0,1 0,2 0,3 0,4 0,5 0,6   1,000 1,000 1,000 1,000 0,997 0,964 0,864     0,7 0,8 0,9 1,0 1,1 1,2 1,3   0,711 0,544 0,393 0,270 0,178 0,112 0,068   1,4 1,5 1,6 1,7 1,8 1,9 2,0   0,040 0,022 0,012 0,006 0,003 0,002 0,001

 

 

Схема применения критерия Колмогорова следующая:

1. Строятся статистическая функция распределения F*(x) и предполагаемая теоретическая функция распределения F(x) (рис.1.3). Для их построения составляется таблица с результатами расчетов этих функций по форме табл. 1.4.

Функции рассчитываются для нижних границ интервалов, полученных при построении статистического ряда (табл.1.1), используемого затем для построения гистограммы. Оттуда же берутся и вероятности F*(x) равные соответствующим частотам . Значения теоретической функции распределения F(x) рассчитываются по функции, описывающей выбранное для сравнения распределение СВ Х.

При выборе нормальной функции распределения ее значения определяются с использованием функции Лапласа , значения которой табулированы и приведены в табл. П.1.3. Порядок использования этой таблицы аналогичен порядку, применяемому при расчете критерия Пирсона.

 

Таблица 1.4

Результаты расчета статистической F*(x) и теоретической F(x) функций распределения

 

Значение контролируемого параметра
Значение статистической функции распределения F*(x)  
Значение теоретической функции распределения F(x)    

 

 

2. Определяется максимум D модуля разности между функциями F*(x) и F(x) (рис. 1.3).

3. Определяется величина

.

4. По табл.1.3 при выбранной вероятности (обычно выбирается, как и ранее, близкой к 0,9 или 0,95) определяется критическое значение .

5. Сравниваются значения и . Если при этом

< то гипотеза о соответствии выбранной теоретической функции распределения F(x) и статистической F*(x) с вероятностью Р принимается, и функцию F(x) можно использовать для описания статистического распределения, если

> ., то гипотеза с вероятностью Р отвергается и выбранную теоретическую функцию распределения F(x) нельзя использовать для описания статистического распределения.

Критерий Колмогорова своей простотой выгодно отличается от описанного ранее критерия c2, поэтому его часто применяют на практике. Однако, этот критерий можно применять только в том случае, когда гипотетическое распределение F(x) полностью известно из каких-либо теоретических соображений. Такой случай на практике встречается довольно редко. Обычно известен только общий вид функции распределения F(x), а входящие в нее числовые параметры (у нормального закона это 2 параметра: математическое ожидание и дисперсия) определяются по исследуемому статистическому материалу.

При применении критерия Пирсона это обстоятельство учитывается соответствующим уменьшением числа степеней свободы распределения c2. Критерий же Колмогорова такого не предусматривает. Если все же применять этот критерий в тех случаях, когда параметры теоретического распределения выбираются по статистически данным, критерий дает заведомо завышенные значения вероятности . Поэтому в ряде случаев мы рискуем принять неверную гипотезу за верную.

 

 

СОСТАВНОЙ КРИТЕРИЙ

Этот критерий применяется для проверки соответствия статистического распределения только нормальному закону и при числе измерений (наблюдений) 15 < n < 50 (допускается от 10), при этом он включает последовательную проверку выполнения двух критериев: критерия 1 и критерия 2.

Критерий 1.

1. Вычисляется отношение

.

2. Проверяется условие

,

где и - квантили распределения, определенные по табл.П.4 для количества измерений n и принятого уровня значимости = (1, 5 или 10)%. Соответственно Р = будет равно (99, 95 или 90)%. Проверка условия выполняется для нескольких уровней значимости, чтобы найти тот уровень, при котором условие выполняется.

Если условие выполняется, то гипотеза о том, что исследуемое статистическое распределение соответствует нормальному закону, принимается, в противоположном случае отвергается.

Критерий 2.

Данный критерий вводится для дополнительной проверки «концов» распределений.

Можно считать, что результаты измерений подчиняются нормальному закону, если не более разностей, равных превзошли значение , то есть выполняется условие

,

где -среднее квадратическое отклонение (см. выше критерий Пирсона);

- верхняя квантиль распределения нормированной функции Лапласа для доверительной вероятности Р, которая определяется в зависимости от выбранного уровня значимости и объема выборки (количества результатов измерений) .

Значение , определяет количество разностей , по которым необходимо проверять выполнение вышерассмотренного условия.

Его проверка ведется в следующем порядке.

1. Задаются уровнем значимости. Он выбирается из таких же соображений, как и при выборе уровня для расчета критерия 1. Для заданного уровня значимости и объема выборки по табл. П.1.5. определяется уровень доверительной вероятности Р и значение .

2. С учетом найденного уровня доверительной вероятности Р вычисляется значение Р/2 и по табл. П.1.3 для него определяется верхняя квантиль .

3. Определяется произведение .

4. В зависимости от найденного значения по выборке результатов измерений находятся одна или две наибольшие разности , и для каждой из них проверяется условие (см. выше).

Если оно выполняется, то на уровне значимости результаты измерений по критерию 2 соответствуют нормальному закону распределения вероятностей.

Гипотеза о нормальности распределения по составному критерию принимается, если выполняются оба критерия. Результирующий уровень значимости составного критерия равен

.

Величина устанавливается в пределах 2¸10%.

 

ПОРЯДОК ВЫПОЛНЕНИЯ РАБОТЫ

ОБОРУДОВАНИЕ:

1.Универсальный цифровой измеритель-мультиметр типа М 832, М 838.

2. Набор (не менее 30шт) дискретных элементов – резисторов.

 

ХОД РАБОТЫ

 

1. Получить у преподавателя измерительный прибор- мультиметр и внимательно изучить инструкцию по эксплуатации прибора.

2. Получить исследуемые элементы - резисторы, проверить их количество.

3. Установить переключатель пределов измерения прибора в нужное положение и провести измерения сопротивлений всех выданных резисторов, записывая результаты в таблицу по форме табл. 1.5.

Таблица 1..5.

Результаты измерений сопротивлений резисторов

 

Номер измерения    
Значение сопротивления

 

4. Окончив измерения, сдать мультиметр и резисторы преподавателю.

 



Поделиться:


Последнее изменение этой страницы: 2016-12-28; просмотров: 715; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.81.30.41 (0.099 с.)