Проверка гипотезы о законе распределения 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Проверка гипотезы о законе распределения



       На практике часто приходится решать задачу определение закона распределения случайной величины. Эта задача решается так. Предполагается, что случайная величина X распределена по закону с плотностью где a, b – параметры распределения. Если эти параметры не известны, то их следует оценить по опытным данным, на пример, по методу наибольшего правдоподобия. Затем по опытным данным строится статистическая функция распределения или гистограмма и с использованием соответствующего критерия согласия проверяется соответствие теоретического закона распределения (гипотезы) статистическому закону распределения.

Между гипотезой и статистическим распределением неизбежны расхождения. Для ответа на вопрос, являются ли эти расхождения случайными, или закономерными следут воспользоваться соответствующим критерием согласия.

Таким образом, задача формулируется так: вводится гипотеза H что величина Х имеет функцию распределения f(a, b, x). Для того, чтобы принять или отвергнуть эту гипотезу рассмотрим некоторую величину U, характеризующую степень расхождения между этим и статистическим распределением. Очевидно, что это есть случайная величина. Её закон распределения зависит от закона распределения Х.

Допустим, что этот закон распределения нам известен. Обнаружено, что величина U приняла значение u. Спрашивается, можно ли объяснить это отклонение случайностью? Вычислим вероятность события . Если эта вероятность мала, то гипотезу Н следует отвергнуть, в противном случае – принять.

Оказывается, что при некоторых способах выбора U, её закон распределения обладает простыми свойствами и для достаточно больших выборок практически не зависит от закона распределения случайной величины X.

Рассмотрим критерий согласия Пирсона - c2. Предположим, что произведено n независимых опытов, в каждом из которых случайная величина Х приняла определённое значение. Выделены k интервалов, построена гистограмма распределения и оформлен статистический ряд.

 

Интервалы х0; x1 х1;x2 xk-1;xk
pi* p1* p2* pk*

 

Здесь xi – границы интервалов, - опытные частоты.

Требуется проверить, согласуются ли экспериментальные данные с гипотезой о том, что случайная величина Х имеет данный закон распределения.

Зная теоретический закон распределения, можно найти вероятности попадания случайной величины в каждый из разрядов:

Проверяя согласованность теории и статистики, будем исходить из расхождений между теоретическими вероятностями p и наблюдёнными частотами p*. Выберем в качестве U сумму квадратов отклонений.

с – веса разрядов берутся обратно-пропорциональными вероятностям разрядов.

При таком выборе коэффициентов мера расхождения обычно обозначается c2:

Учитывая, что

                                   (9.2.1)

К.Пирсон показал, что U как случайная величина с ростом n имеет асимптотическое распределение с плотностью

.                   (9.2.2)

Это распределение называется  распределением и является частным случаем рассмотренного ранее гамма распределения (7.4.8) с параметрами и α= r/2. Единственный параметр   распределения r называется числом степеней свободы и определяется по формуле

,                                                           (8.2.3)

где k – число интервалов в гистограмме, по которым сгруппированы данные выборки, а s – число условий, накладываемых на частоты pi*.

       Примеры условий:

То есть число условий равно числу оцененных по выборке параметров плюс условие нормировки вероятностей к единице.

Для распределения c2 составлены специальные таблицы, позволяющие по числу степеней свободы r и уровню значимости  определить допустимое значение меры расхождения U для принятия гипотезы о законе распределения (гипотезы H).

Схема применения критерия c2:

1. Выборка значений случайной величины X  разбивается по интервалам и строится статистический ряд и гистограмма.

2. Оцениваются параметры предполагаемого распределения.

3. Рассчитываются теоретические вероятности попадания случайной величины в соответствующие интервалы

.                             (9.2.4)

4. Определяется мера расхождения U по формуле (9.2.1).

5. Определяется число степеней свободы r по формуле (9.2.3).

6. Принимается соответствующее значение уровня значимости .

7. По  и r по таблице для распределения (9.2.2) определяется допустимое значение меры расхождения , где  удовлетворяет уравнению

.            (9.2.5)

8.  Если ,то гипотеза о законе распределения  принимается как непротиворечащая опытным данным. Если , то гипотеза отбрасывается как неправдоподобная.

 

Пример. Имеется выборка реализаций случайной величины X  объемом n =50:

7.42 6.65 9.00 7.89 7.37 6.52 8.07 6.92 6.37 6.12 7.13 6.03 7.08 8.05 6.37 8.33 6.47 6.99 9.01 7.02 7.49 6.20 6.46 7.81 7.66 5.88 7.72 8.28 6.89 5.95 8.28    9.03 7.34 8.17 8.33 6.79 7.56 7.64 7.82 6.81 6.00 8.66 8.51 7.22 6.46 7.54 7.73 5.20 7.82 7.18

 

       Оценим параметры распределения в предположении, что случайная величина X  подчиняется закону Симпсона, для которого плотность распределения имеет вид:

Это распределение имеет два параметра a и b, которые оценим по методу моментов из следующих уравнений:

.

По выборке реализаций случайной величины Х определяем:

;

0.

Таким образом, для определения параметров a и b имеем два уравнения:

.

В результате решения этой системы получаем, что .

       Построим теперь по выборке статистический ряд.

Крайние значения выборки . Размах выборки . Разобьем диапазон изменения значений выборки на 5 интервалов с шагом 1 от 5 до 10 и проведем группирование данных выборки по интервалам. Результаты такого группирования отражены в таблице 9.2.1.

 

 

Таблица 9.2.1

 

Интервалы От 5 до 6 От 6 до 7 От 7 до 8 От 8 до 9 От 9 до 10
mi   3 16 19 9 3
0.06 0.32 0.38 0,18 0.06
0.06 0.32 0.38 0,18 0.06
pi 0.082 0.289 0.396 0.207 0.026
npi 4.11 14.43 19.79 10.37 1.29
0.302 0.171 0.031 0.180 2.246

 

m i – это частота i -го интервала (число данных выборки, попавшее в i -ый интервал); - частость (относительная частота или статистическая вероятность) значений выборки из i -го интервала; - теоретические вероятности попадания значения случайной величины Х в соответствующий интервал, рассчитанные по формуле (9.2.4). Мера отклонения статистических вероятностей от теоретических, рассчитанная по формуле (9.2.1), равная сумме значений пятой строки таблицы 9.2.1, U =2.931.

       Если принять уровень значимости , то пользуясь уравнением (8.2.5) или соответствующей таблицей для -распределения для отмеченного значения α  и числа степеней свободы r =5-3=2 получаем, что

       Так как  , то гипотеза о законе распределения Симпсона не противоречит опытным данным и ее можно принять.


Системы случайных величин

    10.1.Понятие о системе случайных величин

    На практике распространены ситуации, когда случайное явление характеризуется несколькими случайными величинами. Например, надежность режущего инструмента характеризуют стойкостью T в минутах времени резания и временем восстановления T в в мин. Габаритные размеры произвольной детали, обрабатываемой на токарном станке характеризуются длиной L и диаметром D. Габаритные размеры корпусной детали характеризуются тремя размерами: длиной L, шириной B, высотой H. Сила резания характеризуется тремя составляющими , то есть проекциями силы резания на соответствующие оси координат станка.

    В общем случае систему случайных величин можно рассматривать как многомерную случайную величину, каждое возможное ее значение представляется в виде точки в пространстве с соответствующем числом измерений, координаты которой и есть соответствующие случайные величины. Рассмотрим подробнее двумерный случай.



Поделиться:


Последнее изменение этой страницы: 2021-12-15; просмотров: 28; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.139.240.142 (0.012 с.)