Елементи регресійного аналізу 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Елементи регресійного аналізу



МНК дозволяє одержати точкові оцінки коефіцієнтів прийнятої залежності Y = j (X). Але тому, що коефіцієнти рівняння регресії - величини випадкові, вимагають перевірки й сама залежність і її коефіцієнти.

1. Перевірка адекватності рівняння регресії експериментальним даним виконується за критерієм Фішера

(10.20)

де Dya – дисперсія адекватності. Вона визначається за формулою:

,

де n - число дослідів;

s - кількість шуканих параметрів апроксимуючої залежності;

yip - розрахункове значення функції в i-й точці при апроксимації залежністю Y = j(X);

myi - середнє значення y в i-м досліді;

Dyo - дисперсія досліду. Вона визначається на підставі даних паралельних дослідів:

,

де m - число паралельних дослідів в i-й точці;

n - число дослідів;

m*n - загальне число вимірів;

Dyi – дисперсія i-го досліду, обумовлена за формулою

де myi – середнє значення У у i-м досліді.

Отримане значення F порівнюють із табличним Fт. Якщо F < Fт, то гіпотеза про адекватність не відкидається.

 

Тема 11. Перевірка статистичних гіпотез

 

Статистичні гіпотези

Будь-яка інформація, отримана в результаті обробки статистичних даних, носить імовірнісний характер. Зокрема, оцінка генеральної середньої є величиною випадковою, розподіленою нормально з параметрами `х і . Оцінка генеральної дисперсії також випадкова. Тому будь-який висновок, заснований на статистичних даних, є науковим припущенням і називається статистичною гіпотезою. Статистичні гіпотези підлягають перевірці, ціль якої - визначити, чи не суперечить висунута гіпотеза вихідному статистичному матеріалу (вибірці).

Основну гіпотезу, сформульовану в результаті обробки статистичного матеріалу, називають нульовою гіпотезою й позначають Н0. На противагу нульовій гіпотезі призначають одну або декілька альтернативних (конкуруючих) гіпотез. Їх позначають Н1, Н2, … і т.д.

Наприклад, якщо перевіряється гіпотеза про рівність параметра а деякому заданому значенню а0, то як альтернативні гіпотези можна розглянути гіпотези, що а більше або менше а0:

Н0: а = а0;

Н1: а > а0;

Н2: а < а0;

Н3: а ¹ а0.

Вибір альтернативної гіпотези обумовлюється формулюванням задачі.

В якості критеріїв для перевірки статистичних гіпотез використовують випадкові величини (статистики), особливість яких полягає в тому, що кожна з них має свій закон розподілу, що не залежить від закону розподілу генеральної сукупності й вибірки, а залежить від умов обробки вибіркових даних. Значення цих випадкових величин, позначимо їх Z, з відповідними їм ймовірностями приводяться в довідкових таблицях.

 

Z
На підставі вибіркових даних визначають значення критерію Z і порівнюють його з табличним значенням, що відповідає умовам обробки даних. Перевірка статистичної гіпотези заснована на принципі, відповідно до якого малоймовірні події вважаються неможливими, а події, що мають більшу ймовірність, - достовірними. Якщо імовірність розрахункового значення критерію досить велика, тобто факт цілком імовірний, то говорять, що гіпотеза не суперечить даним спостереження. Якщо ж ця ймовірність мала, тобто подія практично неможлива, то говорять, що нульова гіпотеза суперечить даним спостереження, і її відхиляють.

Питання про те, яку ймовірність варто вважати досить великою або малою, вирішується не з математичних міркувань, а залежить від наслідків того, що прийнята гіпотеза виявиться невірною. Мала ймовірність, при якій значення критерію вважається практично неможливим, позначається a і називається рівнем значущості. У практичних задачах звичайно призначають рівень значущості a = 0,05-0,15. Область значень критерію Z, що відповідає рівню значущості a, називають критичною областю. Область значень критерію Z, що відповідають імовірності 1-a, називають областю прийняття гіпотези. Значення критерію, що відокремлює область прийняття гіпотези від критичної області називається критичною точкою zk (рис. 11.1).

Z

 

 

Рис. 11.1 – Розташування значень критерію Z.

 

Залежно від того, як сформульовані конкуруючі гіпотези, критична область може бути однобічною (лівосторонньою або правобічною) і двосторонньою. Відповідно критерій може мати одну або дві критичні точки (рис. 11.2).

 

 


Рис. 11.2- Критичні області

 

Таким чином, перевірка гіпотези заснована на факті, що критерій прийняв значення з імовірністю більшою або меншою a. Помітимо, що імовірність даного факту не дорівнює одиниці, а виходить, він не є достовірною подією. Таким чином, результат перевірки гіпотези може виявитися помилковим. Прийнято розрізняти помилки двох видів:

1) помилка 1-го роду - відкинута нульова гіпотеза, в той час як вона була правильною;

2) помилка 2-го роду - прийнята нульова гіпотеза, в той час як вона була невірною.

Якщо перевірка гіпотези показала, що вона не погодиться з вибірковими даними й повинна бути відкинута, а задача все-таки вимагає рішення, то для цього переглядають рішення задачі, використовують іншу вибірку з генеральної сукупності або збільшують обсяг вибірки. Тобто, проблема все-таки може бути вирішена.

Гірше вирішується питання, якщо зроблено помилку другого роду, тобто, прийнята невірна гіпотеза. Імовірність помилки 2-го роду позначається b. Ця ймовірність повинна бути як можна меншою. Тоді ймовірність того, що помилка 2-го роду не буде зроблена, визначиться як 1-b. Величина ймовірності b залежить від якості використовуваного для перевірки гіпотези критерію. Імовірність 1-b називається потужністю критерію, чим вона більше, тим краще використовуваний критерій, вище надійність перевірки.

Ми розглянемо чотири критерії (нормальний розподіл, t-критерій Стьюдента, F-критерій Фішера й c2-критерій Пірсона), які використовуються найбільше часто. Який з названих критеріїв варто використовувати, залежить від характеру розв'язуваної задачі, тобто від формулювання нульової гіпотези Н0. Розглянемо ряд типових задач.

 



Поделиться:


Последнее изменение этой страницы: 2017-02-07; просмотров: 148; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.222.121.170 (0.006 с.)