Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь
FAQ
Написать работу

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву

Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

Главная Избранные Случайная статья Познавательные Новые добавления Обратная связь FAQ Написать работу

Основна ідея перевірки статистичних гіпотез

↑

⇐ ПредыдущаяСтр 2 из 3Следующая ⇒

Множину Y всіх значень, які може приймати випадкова величина Т_n, розіб’ємо на дві неперетинаючихся підмножини Y₀та Y₁ (Y = Y₀È Y₁) так, щоб імовірність попадання значення статистики Т_nу множину Y₁за умови справедливості гіпотези Н₀ була достатньо малою. Якщо виявилося, що Т_n(x) = Т_n(x₁, x₂, …, x_n) Î Y₁, то в припущенні справедливості гіпотези Н₀ трапилась малоімовірна подія, і ця гіпотеза повинна бути відкинутою як така, що протирічить статистичним даним. У протилежному випадку (тобто якщо Т_n(x) Î Y₀) немає причин не прийняти гіпотезу Н₀, і слід вважати, що спостереження не виявляють протиріч з Н₀.

Найчастіше імовірність попадання у множину Y₁ вибирається рівною або не вищою ніж 0,01 або 0,05 або 0,1. Таку імовірність називають рівнем значущості (a); множину Y₁ – критичною областю; Y₀ – областю прийняття гіпотези, а правило перевірки – критерієм згоди.

Якщо Т_n – неперервна випадкова величина, то критична область Y₁ задовольняє рівності:

P{ Т_n Î Y₁ | Н₀} = a (7.1)

де вираз у лівій частині позначає імовірність прийняття статистикою Т_nзначення у множині Y₁ за умови справедливості гіпотези Н₀.

Зауважимо, що на практиці замість рівності (7.1) часто використовується нерівність (≤) або наближена рівність.

Доцільний вибір критичної області, окрім співвідношення (7.1), може залежати ще й від альтернативної гіпотези Н₁. Найчастіше за критичну область Y₁ вибирають множину:

(правосторонній критерій)

(лівосторонній критерій)

(двосторонній критерій)

де - квантиль рівня a умовного розподілу статистики Т_n (умовного в припущенні справедливості Н₀). Точки, які розділяють множини Y₀та Y₁, називають критичними точками.

В результаті перевірки статистичних гіпотез можуть бути зроблені помилки двох типів. Помилка першого роду полягає в тому, що буде відкинута вірна гіпотеза Н₀. Її імовірність a дорівнює Р{ Т_n Î Y₀ | Н₀}, якщо виконується (7.1). У випадку, коли замість (7.1) виконується нерівність (≤) або наближена рівність, імовірність помилки 1-го роду може бути відповідним чином оцінена, а не точно визначена. Помилка другого роду виникає тоді, коли ми приймаємо гіпотезу Н₀, в той час, коли справедлива альтернативна гіпотеза. Імовірність b помилки другого роду дорівнює Р{ Т_n Î Y₁ | Н₁}.

Перевірка гіпотези відносно імовірності

Нехай А – деяка випадкова подія. Маючи результати n незалежних випробувань, в яких подія А спостерігалась m разів, ми хочемо перевірити гіпотезу, що імовірність події А дорівнює заданому числу р₀, тобто Н₀= { P(A)=p₀ }. На практиці до цієї гіпотези ми приходимо, наприклад, при перевірці відповідності технологічного процесу заданим умовам (наприклад - відсутності систематичної похибки вимірювань).

Нехай гіпотеза Н₀ справедлива. Тоді маємо схему Бернуллі:

успіх – подія А відбулась;

невдача – відбулась подія .

K_n – число успіхів в n випробуваннях;

тоді, як відомо з курсу теорії імовірностей: MK_n=np₀; DK_n=np₀q₀; q₀=1-p₀.

Користуючись нормальним наближенням біноміального розподілу (теорема Муавра - Лапласа), одержуємо:

(7.2)

(статистика Т_nмає наближено нормальний розподіл з параметрами 0; 1).

При альтернативній гіпотезі Н₁ ={ P(A)¹p₀ } і рівні значущості a критична область буде мати вигляд:

(7.3)

(для нормального розподілу U_a =-U_1-_a, U_a - квантиль рівня a -розподілу). Область прийняття гіпотези у₀– це інтервал (, ).

Якщо значення статистики Т_n, знайдене за вибірковими даними, належить області Y₀, то гіпотеза Н₀ приймається, в протилежному випадку, коли Т_nÎ Y₁, то гіпотеза Н₀ відхиляється.

Приклад 1. Нехай потрібно перевірити відсутність систематичної похибки терезів, тобто Н₀= { P(п) = P(н)=p₀=1/2 }, де P(н) - імовірність недоважування, P(п) - імовірність переважування.

В досліді проведено 280 зважувань і із них виявилось 151 недоважувань і 129 переважувань.

При справедливості гіпотези Н₀ маємо р=1/2; q=1/2 і згідно (7.2) одержимо:

Виберемо рівень значущості a=0,05, тоді 1-a/2=0,975; U_0,975=1,96 – квантиль рівня 0,975 N(0;1)-розподілу. Тоді із рівності (7.3) одержуємо критичну область . Допустима область Y₀ = (-1,96, 1,96).

При кількості успіхів (недоважувань) m=151 отримаємо:

Таким чином, Т₂₈₀ Î Y₀ і гіпотеза Н₀приймається (Н₀ не суперечить спостереженням).

Зауваження. На практиці наведену вище процедуру перевірки гіпотези відносно імовірностей можна використовувати коли n>=50; np>=10.

Перевірка гіпотези про середнє значення нормального розподілу. Критерій Стьюдента

Нехай x₁, x₂, …, x_n - ряд незалежних спостережень над випадковою величиною x, яка має нормальний розподіл N(m, s). Параметри m, s - невідомі. Потрібно перевірити гіпотезу H₀= { Mx=m₀}, де m₀ – деяке задане число. Такого типу задачі часто виникають на практиці, наприклад тоді, коли потрібно визначити наявність систематичних відхилень від номіналу параметрів виробів деякого технологічного процесу.

На підставі вибірки обчислимо

, (7.3)

Розглянемо статистику

(7.4)

Відомо (див. лаб. роботу № 6), що випадкова величина T_n має розподіл, який називається t - розподілом Стьюдента з (n-1) ступенями волі. Звідси випливає критерій перевірки гіпотези Н₀ – критерій Стьюдента. При рівні значущості a вибираємо із таблиць квантилів t-розподілу Стьюдента - квантиль рівня розподілу Стьюдента з (n-1) ступенями волі.

Тоді при альтернативній гіпотезі Н₁ ={ Mx¹m₀ } і рівні значущості a критична область відповідно до (7.2) буде мати вигляд:

(7.5)

Допустима область:

Якщо статистика T_n в (7.4) при m=m₀ попадає в область Y₁, то гіпотезу H₀= { Mx=m₀} відхиляємо, якщо T_n Î Y₀, то кажемо, що гіпотеза H₀ не суперечить експериментальним даним.

Приклад 2. Стьюдент у класичній роботі про t – розподіл наводить наступні дані про додаткові години сну 10 пацієнтів, викликані дією снодійних засобів та .

Таблиця 7.1

Пацієнт	X	Y	Різниця X-Y
	1.9	0.7	1.2
	0.8	-1.6	2.4
	1.1	-0.2	1.3
	0.1	-1.2	1.3
	-0.1	-0.1	0.0
	4.4	3.4	1.0
	5.5	3.7	1.8
	1.6	0.8	0.8
	4.6	0.0	4.6
	3.4	2.0	1.4

Виникає запитання, чи існує істотна різниця між дією снодійних засобів та . Якщо припустити, що різниця ξ між додатковими годинами сну розподілена нормально, то вибірка буде вибіркою об’єму n=10 нормального розподілу N(0, σ) при умові справедливості гіпотези H₀= { Mx=0 }, тобто коли між снодійними засобами X та Y немає різниці. При цій же умові величина має t – розподіл Стьюдента з 9 ступенями волі; , - відповідно середнє значення та вибіркове середнє квадратичне відхилення вибірки .

Обчислення згідно формул (7.3) та (7.4) для вибірки дають: =1.11; =1.58; .

При α=0.05 та 9 ступенях волі t_кр= =2.26, тоді . Ясно, що і гіпотезу Н₀ відхиляємо, тобто різниця між снодійними засобами та значуща.

Завдання до лабораторної роботи №7

1. Для заданої вибірки x₁, x₂, …, x_n спостережень над випадковою величиною x (див. лаб. роботу №1) перевірити її симетричність відносно середнього значення m.

Точніше, гіпотеза полягає в тому, що імовірність прийняття величиною x значення, не більшого від m, дорівнює імовірності прийняття нею значення, не меншого від m (таким чином, обидві імовірності дорівнюють 1/2). Скорочений запис:

Нехай: А = { x ≤ m };

тоді Н₀= { P(A)=1/2 },

В якості величини m можна взяти значення .

Перевірку гіпотези Н₀ провести при рівнях значущості a=0,05 та a=0,1.

2. Для заданої вибірки x₁, x₂, …, x_n спостережень над нормально розподіленою випадковою величиною x (див. лаб. роботу № 6) перевірити гіпотезу H₀= { Mx=m₀} при рівнях значущості a=0,05 та a=0,1. За величину m₀ взяти значення m₀= (x_min+ x_max)/2.

Контрольні питання до лабораторної роботи №7

1. Дати пояснення основних понять перевірки статистичних гіпотез: основна гіпотеза, статистика критерія, рівень значущості, критична і допустима області, помилки 1-го і 2-го роду.

2. Навести загальну схему перевірки гіпотез.

ЛАБОРАТОРНА РОБОТА № 8

Тема: Перевірка статистичних гіпотез - 2. Гіпотеза про нормальність розподілу імовірностей

Мета роботи: Навчитися перевіряти гіпотези про нормальність розподілу випадкової величини

Теоретичні відомості

Випадкова величина має нормальний розподіл (позначення x N(μ, s)), якщо її щільність розподілу визначається за формулою:

де μ, s - деякі числа. Імовірнісний зміст параметрів μ, s:

μ – математичне сподівання випадкової величини x,

s - середнє квадратичне відхилення випадкової величини x.

Графік щільності розподілу випадкової величини x має дзвіноподібну форму і є симетричним відносно прямої х= μ (див. рис.8.1)

Рис.8.1

Припустимо, що є заданою вибірка значень x₁, x₂, …, x_n випадкової величини x, отримана при тих чи інших спостереженнях. Треба вирішити, чи можна на підставі наявних даних зробити обгрунтоване припущення про нормальність розподілу величини x (інакше – про нормальність теоретичного розподілу імовірностей). Таким чином, мова йде про перевірку гіпотези Н₀={теоретичний розподіл імовірностей є нормальним}, або скорочено:

H₀= { x N(·, ·) }

(позначення N(·, ·) замість N(μ, σ) вживається, коли мова йде про нормальність розподілу взагалі, без припущень щодо конкретних значень параметрів цього розподілу).

З багатьох відомих критеріїв узгодження емпіричних даних з гіпотезою про нормальність теоретичного розподілу в даній роботі треба використати лише два. Основні принципи, на яких базуються вказані критерії і відповідні дії, що потрібно виконати, формулюються нижче.

1. Візуальний аналіз графічного зображення вибірки

При візуальному дослідженні графічного зображення вибірки(“стеблина з листям”, гістограми, полігони) необхідно звернути увагу на відповідність побудованих рисунків графіку щільності нормального розподілу.

Показниками доброї відповідності є:

а) наявність однієї вибіркової моди, відносно якої розташування даних майже симетричне;

б) поступове спадання графіків до нульового значення при віддаленні від модального значення.
Показниками поганої відповідності є:

а) наявність явної полімодальності (тобто наявність декількох модальних значень);

б) явна асиметрія у побудованих графіках;

в) наявність обривчастих кінців у графіках вибіркових розподілів.

За даними візуального аналізу графічних зображень вибірки можна дати висновок відносно гіпотези нормальності розподілу в наступних термінах:

а) добра відповідність;

б) погана відповідність;

в) нема підстав як для позитивної так і для негативної відповіді.

2. Порівняння вибіркових та очікуваних частот. Критерій c².

Одним з основних способів перевірки гіпотези про нормальність є порівняння вибіркових та очікуваних частот. Гіпотезу потрібно відхилити, якщо ці частоти сильно відрізняються між собою.

Одним з варіантів втілення цієї ідеї є критерій c².

Гіпотеза, що перевіряється: H₀ = {x ~ N(·, ·) }, причому параметри μ і s невідомі.

Для використання критерію c²у нашому випадку необхідно спочатку знайти оцінки невідомих μ і s. За оцінки цих параметрів візьмемо відповідно вибіркове середнє та вибіркове середнє квадратичне відхилення s, отримані за згрупованою вибіркою (див. лаб. роботу № 4).

Потім числову вісь розіб’ємо на інтервали так, щоб в кожному з них знаходилось би не менше ніж 8 вибіркових значень. Так, зокрема, для знаходження кінців інтервалів групування можна використати деякі з кінців інтервалів групування, визначених в лабораторній роботі №2.

Приклад 1.

Нехай вибірка задається таблицею “групування - частоти”.

Таблиця 8.1

Номер інтервала	Границі інтервалів	Середні точки	Абсолютні частоти
	2.5	5.5
	5.5	8.5
	8.5	11.5		3.5
	11.5	14.5		5.5
	14.5	17.5
	17.5	20.5
	20.5	23.5
	23.5	26.5

На інтервалі немає вибіркових значень. Тому спочатку необхідно розглянути інтервал .

На цьому інтервалі тільки 3 вибіркових значення, що нас не влаштовує. Приєднаємо до розглянутого наступний інтервал групування і розглянемо інтервал . У цей інтервал попадає 5 вибіркових значень, що також нас не влаштовує. Якщо розглянемо інтервал , то одержимо в ньому 8.5 вибіркових значень. Таким чином, перша точка нового групування b₁=11.5. Наступним буде інтервал , який містить 10.5 значеньі за b₂ беремо значення 17.5. Продовжуючи аналогічним чином, одержуємо вторинне групування (див. табл.. 8.2).

Таблиця 8.2

Номери інтервалів	Границі інтервалів	Абсолютні частоти
		11.5	8.5
	11.5	17.5	10.5
	17.5	20.5
	20.5

Статистика критерію T_n_,_r обчислюється за формулою:

де n – об’єм вибірки;

m_i – кількість вибіркових значень, що належать і-му інтервалу;

p_i – імовірність того, що випадкова величина (з розподілом N(, S)) належить і-му інтервалу;

(Нагадуємо, що імовірність влучення випадкової величини x ~ N(, S) в інтервал [b_i,b_i₊₁] обчислюється за формулою:

де функція - це інтеграл імовірностей:

Замість функції можна використовувати функцію ψ:

ψ .

Зауваження. При розрахунках слід врахувати, що на відміну від рівностей для функції :

, ,

для функції ψ мають місце співвідношення:

ψ , ψ .

Можна вважати, що статистика T_n_,_r при n > 50 добре наближується розподілом c²_r-3 (розподілом c² з r-3 ступенями волі). Критична область для критерія c² правостороння. Відповідними критичними точками є точки U_1-_a - квантиль розподілу c²з r-3 ступенями волі рівня 1-a, де a - заданий рівень значущості.

Приклад 2.

Нехай рівень значущості a = 0.05 і нам потрібно перевірити гіпотезу про нормальність вибірки, відносно якої відомо, що ; S=9.71; n=200 і яка задається таблицею:

Таблиця 8.3

Номер інтервалу	Границі інтервалів	Абсол. частоти m_i	Очікувані імовірності p_i	Очікувані частоти
		-15		0.023	4.60	9.75	1.25
	-15	-10		0.048	9.50	2.30	0.24
	-10	-5		0.098	19.54	20.52	1.05
	-5			0.162	32.68	69.40	2.13
				0.198	33.58	86.42	2.24
				0.195	39.90	4.39	0.11
				0.142	28.38	5.69	0.20
				0.083	16.62	0.17	0.01
				0.053	10.52	0.25	0.03
				1.000		194.93	7.19

Значення T_n_,_r= T_200,9=7,19.

Критичною точкою є (див. додаток. № 4 до методичних вказівок).

Значення статистики критерію 7.19 належить області прийняття гіпотези. Завдяки цьому можна стверджувати, що дані не протирічать гіпотезі про нормальність вибірки.

Завдання до лабораторної роботи №8

Зауваження.Для виконання роботи використовувати вибірку з лабораторної роботи №1.

1. Провести візуальний аналіз графічного зображення вибірки. Зробити висновок про відповідність вибіркових даних гіпотезі, що висунута.

2. Перевірити гіпотезу про нормальність розподілу імовірностей за допомогою критерію c² (α = 0.1, α = 0.05).

Контрольні питання до лабораторної роботи №8

1. Що означає: випадкова величина має нормальний розподіл?

2. Який імовірнісний зміст числових параметрів, що входять до виразу щільності нормального розподілу?

3. Як відбувається візуальна перевірка вибірки на нормальність?

4. Сформулювати основні положення методики c²перевірки статистичних гіпотез окремо для випадків простої і складної основної гіпотези.

5. Яка саме гіпотеза перевіряється у даній роботі? Чи є вона простою, чи складною? Чому кількість ступенів волі розподілу c²дорівнює тут саме r-3?

6. Сформулювати основні теоретичні положення, на яких базується методика c²(граничні теореми К. Пірсона та Р. Фішера).

7. Сформулювати основні положення методу c²при перевірці нормальності теоретичного розподілу.

⇐ Предыдущая 123 Следующая ⇒

Познавательные статьи:

Техника нижней прямой подачи мяча

Комплекс физических упражнений для развития мышц плечевого пояса

Стандарт Порядок надевания противочумного костюма

Общеразвивающие упражнения без предметов

Последнее изменение этой страницы: 2016-08-15; просмотров: 386; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 13.59.54.188 (0.009 с.)