Однофакторний ДА з нерівною кількістю спостережень 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Однофакторний ДА з нерівною кількістю спостережень



Загальна схема аналізу лишається такою ж, деякі зміни вносяться лише у формули, за якими обчислюються оцінки середніх і суми квадратів відхилень:

(15)

(16)

(17)

(18)

(19)

Якщо величина F-критерію перевищила критичне значення , то нульова гіпотеза відхиляється. В цьому випадку допускають, що існує, в крайньому разі, хоч би одна пара середніх, наприклад, і , для яких .

Більш загальний розв’язок задачі дає метод Шеффе(S- метод). За його допомогою можна побудувати довірчі інтервали для будь-якої лінійної комбінації середніх:

(20)

Фунція , визначена таким чином, називається контрастом. Вибіркову оцінку знайдемо шляхом заміни величинами (21)

Як і раніше, будемо допускати, що належні і нормально розподілені, а , звідси випливає, що

(23)

Вибірковою оцінкою D(H) є величина

, де (24)

, (25)

- об’єм вибірки, що відповідає j- й градації, досліджуваного фактору. Довірчий інтервал велечини визначається наступним співвідношенням:

, де

(26)

Коли провести таких порівняннь, то можна виділити всі „контрастні” значення і тим самим виявити джерело неоднорідності середніх.

 

Двофактоний ДА

Складнішою моделлю дисперсійного аналізу є вивчення впливу на результати експерименту кількох факторів. Зокрема при аналізі впливу двох факторів структура моделі набуває вигляду:

(27)

де, - значення ознаки y в і -му експеременті j -му рівні впливу фактора А і на k -му рівні впливу фактора В; -загальна середня величина ознаки у; -ефект впливу факторів А на і -му рівні,

-ефект впливу фактора В на j- му рівні;

-ефект одночасного впливу факторів А і В;

-випадкова компонента (варіація в середині окремої групи).

В двофакторному аналізі розрізняють багатосторонню (перехресну) класифікацію, коли таблиці вхідних даних кожний j -й стовпець (j -та градація фактора В) містить однакову кількість груп, що відповідають градаціям і -го фактора А, та ієрахічну класифікацію, коли фактор В (другосторонній в рамках даної задачі) згрупований всередині головного А. В ієрархічній класифікації число градацій фактора В, що фіксуються всередині різних градацій фактора А, може бути поодиноким.

В умовах моделі 1 фактори А, В, розглядаються, як фіксовані, щодо моделі 2 – як випадкові. Для змішаної моделі одному із факторів приписується систематичний вплив, другому випадковий. Для визначеності, допускають, що в моделі 3 фактор В - фіксований, а фактор А, і їх взаємодія АВ - випадковий.

Загальна схема двофакторного дисперсійного аналізу (перехідна класифікація з повтореннями)

1. обчислюються вибіркові середні:

середнє значення ознаки у для кожного блока; (28)

середнє значення ознаки у за (29)

стовпцями;

середнє значення ознаки у за (30)

рядками;

загальна середня ознаки у (31)

де .

2. Визначаються суми квадратів відхилень, що обумовлені впливом різних факторів:

а) -вплив фактору А; (32)

б) - вплив фактору В; (33)

в) -вплив взаємодії факторів АВ; (34)

г) -зміни, пов’язані з (35) відмінностями всеридині комірки;

д) -загальна зміна, даної ознаки. (36)

Справедлива рівність . Величина відповідає (g-1) -степеней вільностей;

.

3.Тепер неважко знайти середні квадрати відхилень:

(37)

Перевірка гіпотез

Модель 1.

Перевірка гіпотез здійснюється за критерієм:

Якщо вірна то дані величини підлягають F розподілу.

Якщо виконується то вплив відповідно факторів а,в і їх взаємодія вважаються суттєвими.

Модель ІІ

Нульові гіпотези, що перевіряються запишемо так:

 

(41)

Відповідні критерії мають вигляд:

(42)

,

В умовах нульової гіпотези відношення , і мають F -розподіл з відповідними степенями вільності. Гіпотези , , відхиляються (при заданому рівні значущості ), якщо

(43)

Модель ІІI.

Перевіряються нульові гіпотези:

,

(44)

Критерій для перевірки нульових гіпотез:

(45)

.

Прийняття рішення здійснюється так, як і в моделях 1 і 2.

Існують ще різновиди перехресної класифікації. А саме:

Ø перехресна класифікація (ПК) з одним повторенням в комірці.

Ø ПК з нерівною кількістю спостережень в комірках.

Ієрархічна класифікація результатів спостережень застосовується в дисперсійному аналізі в тих випадках, коли один фактор згрупований всередині іншого „головного” фактора.

основне рівняння прийнятої моделі дисперсійного аналізу мають вигляд:

(46)

де -математичне сподівання всіх результатів спостережень;

-ефект і -ої градації фактора А;

-ефект j -го рівня фактора В в межах і -ої градації фактора А;

-ефект неконтрольованих факторів.

Дисперсію у запишемо у вигляді суми:

(47)

Перевіряємо гіпотези:

(48)

Визначаємо суми квадратів відхилень:

(49)

(50)

(51)

де (52)

(53) (54)

Величина відображає вплив фктора А, -вплив фактору В, -характеризує зміну всередині комірок. Середні квадрати знаходяться за формулами:

(55)

(56)

Статистики при виконанні відповідних нульових гіпотез, мають F -розподіл з степенями вільності

(57)

Коваріаційний аналіз.

Коваріація між двома вибірками випадкових величин обчислюється за формулою:

(1)

де компоненти векторів х та у, п - чисельність вибірки.

Коваріація вибірки самої з собою називається дисперсією. Коваріація може бути як додатньою, так і від’ємною.

В більш широкому змісті коваріацією називають сукупність трьох статичних показників: середніх арифметичних та , сум квадратів відхилень і і суми добутків відхилень . Паралельний розклад цих величин за факторами змін і складає суть коваріаційного аналізу.

Коваріаційний аналіз включає три основних етапи:

1) дисперсійний аналіз X, Y та добутків XY;

2) розклад залишкової дисперсії Cz за рядом у (залишок 1) на суму квадратів відхилень, обумовлену регресією Y по X, що позначається Cb ісуму квадратів відхилень від регресії (залишок 2);

(2)

3) приведення фактичних середніх за рядом Y до повного вирівнювання умов експерименту за рядом Х.

коваріаційний аналіз (КА) – це статистичний метод оцінки впливу на випадкову величину різних одночасно діючих факторів, одні з яких задані якісно, а інші можуть бути виміряні кількісно. Тобто, КА можна розглядати, як комбінацію дисперсійного та регресійного аналізів.

Суму квадратів відхилень, зумовлену регресією Y на X визначають за формулою:

(3)

Суму квадратів випадкового змінювання, тобто суму квадратів відхилень від регресії, знаходить як різницю .

Коеіцієнт регресії (4)

Результативну ознаку вирівнюють за співвідношенням

(5)

Y1 – коректоваі дані; byx – коефіцієнт регресії;

Y – фактичні дані; - різниця між середнім значенням незалежної змінної х та її фактичним значенням.

(2.) Основна модель КА, що узагальнює дисперсійний та регресійний підходи, має вигляд:

(6)

де Y, X, β мають той же зміст, що і моделі ДА;

а zγ – визначає вклад факторів, що піддаються кількісному дослідженню, при цьому z – значення факторів (регресорів), γ – коефіцієнти регресії Y на z.

Далі будемо допускати, що коефіцієнти регресії не залежать від градацій якісного фактору, що задають розбиття вхідних даних на р груп:

.

Основні припущення КА:

1) Y має нормальний розподіл з параметрами

2) Y має нормальний розподіл з параметрами

Як і в дисперсійному і регресійному аналізах, розподіл e також допускається нормальним з параметрами .

Припущення (1) відповідає нульовій гіпотезі , а припущення (2) – гіпотезі . Якщо виконується, то перевірка зводиться до загального дисперсійного аналізу.

Якщо ж відхиляється, то перед перевіркою треба внести деякі корективи, що виключають ефект регресії.

Основна модель КА зручно розглядати на прикладі одно факторного аналізу з однією незалежною змінною (регресором):

(7)

де - ефект і - ї градації фактора А;

- ефект, обумовлений дією змінної z;

- коефіцієнт регресії;

- ефект неконтрольованих факторів; .

Перевірка гіпотези : g = 0 здійснюється за наступною схемою:

І. Визначаємо суми квадратів і добутків відхилень, що відображають змінювання Y і z,

а) Всередині груп (градацій)

;

(8)

де ; (9)

б) Між групами:

; (10)

(11)

де ;

(12)

ІІ. Якщо гіпотеза вірна, то статистика що обчислюється за формулою:

(13)

має F-розподіл з f1=1, f2=N-p-1 степенями вільності. Гіпотеза про рівність нулю коефіцієнта регресії g відхиляється, якщо обчислене значення критерія перевищить табличне .

Перевірка гіпотези в умовах ;

.

Суми квадратів „між групами” і „всередині груп” повинні бути скореговані так, щоб вплив незалежної змінної z було б виключено:

а=а12; b=b1+b2; c=c1+c2 (14)

Відповідно:

; ; (15)

Статистика в умовах гіпотези має F- розподіл з f1=p-1, f2=N-p-1 степенями вільності.

Розглянуту схему можна узагальнити на випадок, коли класифікація спостережень виконана за двома і більше факторами.



Поделиться:


Последнее изменение этой страницы: 2016-09-18; просмотров: 241; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.135.183.187 (0.077 с.)