Критерій Колмогорова при складній гіпотезі 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Критерій Колмогорова при складній гіпотезі



а) Оцінку скалярного або векторного параметра розподілу F (x, θ) можна обчислювати методом максимальної правдоподібності на підставі формули .

б) Значення статистики Колмогорова SK або її мінімума розраховують по формулі Sk = на підставі формул Dn = max(), при та .

в) Розподіл G(SK½H0) вибирають з таблиці А.7. Критичні значення критерію Sα при заданому α можуть бути взяті з таблиці А.8.

д) Гіпотезу про узгодженість не відкидають, якщо P {S > S*K} = 1 - G (SK ½ H0) > α (або S*K < Sα)

Критерій Смирнова при складній гіпотезі

Особливості застосування критерію типу Смирнова наступні.

а) Оцінку скалярного або векторного параметра розподілу F (x, θ) обчислюють методом максимальної правдоподібності

б) Значення статистики Смирнова Sm обчислюють за формулою Sm = на підставі формул та .

в) Розподіл G(Sm½H0) вибирають з таблиці А.11. Критичні значення критерію Sα при заданому α можуть бути взяті з таблиці А.12.

г) Гіпотезу про згоду не відкидають, P {S > S*m} = 1 - G (Sm ½ H0) > α (або S*m < Sα).

Вплив обсягу вибірки на розподіл при складних і простих гіпотезах

У разі перевірки простих гіпотез граничними розподілами статистик критеріїв Колмогорова і Смирнова можна користуватися при n > 20. Дослідження методами статистичного моделювання залежності розподілів статистик всіх розглянутих тут непараметричних критеріїв від обсягу вибірки при перевірці різних як простих, так і складних гіпотез показує, що це справедливо у всіх випадках.

Наприклад, малюнок 1 іллюструє, як при збільшенні обсягу вибірки (n = 5, 10, 20) міняється розподіл G (Sn ½ H 0) статистики Колмогорова Sk в разі перевірки простої гіпотези про приналежність вибірки нормальному закону. На цьому малюнку відображено також граничний розподіл статистики - функція розподілу Колмогорова K(S). Емпіричні розподіли G (Sn ½ H 0) при великих n практично зливаються з K(S), і на малюнку вони не показані. Як видно, при малих n розподіл істотно відрізняється від граничного, але вже при n ≥ 15 - 20 помилка при обчисленні ймовірності узгодження P {S > S*} виявляється досить малою.

Малюнок 1 - Залежність від n розподілів G (Sn ½ H 0) статистики SK Колмогорова при простій гіпотезі (H0 - нормальний розподіл): n = 5, 10, 20. K(S) - функція граничного розподілу Колмогорова

 

Та ж сама картина спостерігається у випадку перевірки складних гіпотез про згоду. На малюнку 2, при n = 5, 10, 20, 1000 представлені розподіли G (Sn ½ H 0) статистики SK в разі перевірки аналогічною, але вже складною, гіпотезою про нормальність.

Малюнок 2 - Залежність від n розподілів G (Sn ½ H 0) статистики SK Колмогорова при складній гіпотезі; n = 5, 10, 20, 1000

Малюнок 3 - Залежність від n розподілів G (Sn ½ H 1) статистики Sm Смирнова при складній гіпотезі (H0 - нормальний розподіл; H1 - логістичний); n = 20, 100, 500, 1000

 

Малюнок 4 - Функції розподілу нормального і логістичного законів

 

 

При малих n найбільші відхилення від граничних розподілів спостерігаються на «хвостах». І при простих, і при складних гіпотезах із зростанням n розподілу G (Sn ½ H 0) рівномірно сходяться до граничного. Але якщо у випадку простих гіпотез із зростанням n збільшується ймовірність великих значень статистик, то у випадку складних зростають ймовірності і великих, і малих значень статистик.

Таким чином, розподілу G (Sn ½ H 0) статистик непараметричних критеріїв при простих та складних гіпотезах із зростанням n дуже швидко сходяться до граничних, і вже при n ≥ 15 - 20 можна, не побоюючись великих помилок, користуватися цими граничними законами при аналізі даних.

Для надійного розрізнення близьких законів розподілу, зокрема за допомогою критерію згоди Колмогорова, може знадобитися вибірка досить великого обсягу.

Приклади

1. Перевірити гіпотезу про однорідність двох вибірок.

X: 3.49 3.5 3.52 3.62 3.79 3.8 3.81 3.99 4.01
Y: 3.8 3.81 3.83 3.85 3.86 3.9 4.1 4.38 4.66

 

Розв’язок:

Так як вибірка є незгрупованою, то для перевірки гіпотези однорідності вибірок X і Y можна скористатися критерієм однорідності Смирнова. Задамо рівень значущості .

Статистика критерію однорідності Смирнова: , де підпорядковується розподілу Колмогорова . – емпірична функція розподілу по першій вибірці, – по другій. Проводячи обчислення, отримуєм: , , . Знаходимо за табличкою критичне значення статистики Смирнова при : . Оскільки , то нема підстав для відхилення гипотези про однородності вибірок X и Y.

  0.1 0.05 0.01
K(S) 1.2238 1.3581 1.6276

 

2. Перевірити просту гіпотезу про приналежність вибірки експоненціальному закону.

Впорядкована вибірка обсягом 100 спостережень має вигляд:

0,0041 0,0051 0,0058 0,0074 0,0082
0,0110 0,0160 0,0191 0,0263 0,0279
0,0294 0,0323 0,0411 0,0452 0,0688
0,0741 0,0805 0,0809 0,1026 0,1124
0,1220 0,1226 0,1233 0,1317 0,1323
0,1368 0,1379 0,1475 0,1515 0,1598
0,1710 0,1789 0,2010 0,2014 0,2072
0,2102 0,2194 0,2205 0,2297 0,2300
0,2302 0,2373 0,2375 0,2397 0,2415
0,2492 0,2869 0,2908 0,2976 0,3058
0,3060 0,3073 0,3096 0,3278 0,3553
0,3620 0,3679 0,3833 0,3921 0,3985
0,4078 0,4080 0,4119 0,4169 0,4208
0,4568 0,4707 0,4880 0,4942 0,5214
0,5277 0,5878 0,6146 0,6180 0,6263
0,6415 0,6757 0,7156 0,7157 0,7207
0,7351 0,7485 0,7535 0,7541 0,7728
0,8875 0,9021 0,9581 0,9868 1,0440
1,2226 1,2402 1,2641 1,3034 1,3328
1,3553 1,4006 1,5586 1,6296 2,5018

 

Розв’язок:

Перевіряюча гіпотеза має вигляд Н0 : при

А) Критерій Колмогорова. Значення статистики розраховують за формулою

Sk = : S * K = 0,8269. При цьому значенні статистики обчислюють ймовірність P { S >S*K } = 1 - K (S * K)= 0,5011.

Б) Критерій Смирнова. Значення статистики розраховують за формулою Sm = : S *m = 2,7349. При цьому значенні статистики обчислюють ймовірність P { S m >S* m} =

Як бачимо, при заданні рівня значущості α <0,2548 (для критерію Смирнова), немає підстав для відхилення перевіряючої гіпотези за критеріями згоди.

 

 

3. Перевірити складну гіпотезу про приналежність вибірки з прикладу 2 експоненціальному закону

Перевіряюча гіпотеза має вигляд Н0 : при

А) Критерій Колмогорова. Значення статистики розраховують за формулою

Sk = : S * K = 0,5188. З таблиці А.7 знаходять, що розподіл статистики критерію добре апроксимується логарифмічно нормальним розподілом з параметрами θ0 = 0,2545; θ1 = - 0,3422. При знайденому значенні статистики по логарифмічно нормальному закону обчислюють ймовірність P { S>S*K }= 0,8914.

Б) Критерій Смирнова. Значення статистики розраховують за формулою Sm = : S *m = 1,0767. З таблиці А.11 видно, що розподіл статистики критерію апроксимується логарифмічно нормальним розподілом з параметрами θ0 = 0,6951; θ1 = 0,226. При знайденому значенні статистики обчислюють ймовірність P {Sm> S*m} = 0,5866.

По критеріям згоди вибірки з експонентним законом досить задовільні.

 

Висновок

В даній курсовій роботі мною було розглянуто один з непараметричних критеріїв,оснований на аналізі емпіричного розподілу і функції розподілу в генеральній сукупності, а саме критерій Колмогорова-Смирнова,який застосовується в математичній статистиці з метою перевірки простих і складних гіпотез.

Було розглянуто відмінність окремо критерію Колмогорова та окремо критерію Смирнова. На основі теоретичної частини я розглянула декілька практичних моментів з застосуванням приведених вище алгоритмів кожного з параметрів.



Поделиться:


Последнее изменение этой страницы: 2016-08-01; просмотров: 221; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.133.156.156 (0.018 с.)