Спостереження за двома змінними 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Спостереження за двома змінними



Пробіт-графік.

 

Будується наступним чином.:
Маємо на вході вибірку

Обчислимо емпіричну функцію розподілу (Сімейство розподілів F з базовою функцією )

Пробіт-графік – графік функції

Використовується для:

1) Перевірки гіпотези

У випадку, коли справедлива гіпотеза пробіт-графік повинен уявляти собою майже пряму.

 

Пояснення: маємо:

       
 
 
   

 

 


2) Виявлення наявності аномальних спостережень у вибірці.

 

 

 

@Лекція 2

Імовірнісний графік

 

Ідея та ж сама. Зі спотвореною віссю у. Маємо множину , яку розтягують за правилом , де

Папір, де спотворюється масштаб називається імовірнісним папером.

Якщо в якості розподілу взяти нормальний розподіл, то такий папір називається нормальним імовірнісним папером.

Будуємо графік функції для спостереження величини
1. У випадку, коли , то отримаємо майже пряму. Якщо маємо точки, що лежать осторонь, то перевіряємо їх на аномальність.
2.Виявляємо наявність аномальних спостережень

Висячі гістобари

Використовується для перевірки нормальності вибірки. Нехай по вибірці підраховано мат. сподівання та вибіркова дисперсія .

Найбільш узгодженим нормальним розподілом для спостережень за будемо називати такий нормальний розподіл .

Спочатку будуємо графік щільності з вибірки

В центрах групування даних до графіка підвішуються прямокутні гістобари, довжина яких пропорційна відносній частоті потрапляння у відповідний інтервал групування. Якщо основа цих гістобар не суттєво відхиляється від осі Ох – гіпотеза про нормальність вибірки приймається.

 

 

 

Підвішена коренеграма

 

Для кожного інтервалу групування даних визначають - емпірична частота потрапляння в інтервал, а також теоретичне значення частоти згідно гіпотези про найбільш узгоджений нормальний розподіл. Потім на графіку відкладають такі різниці: . І якщо ці значення не значно відхиляються від нуля, то гіпотеза про нормальність вибірки приймається.

 

Спостереження за двома змінними

Використовуються

1) Діаграма розсіювання.

2) Таблиця спряженості.

 

Діаграми розсіювання.

Маємо дві вибірки та . Використовуються для з’ясування класу залежності між парою кількісних змінних, а також для з’ясування наявності аномальних спостережень у вибірці.

 

Таблиця спряженості

Використовуються для представлення спостережень над номінальними, ординальними, кількісними дискретними (скінченими), кількісними неперервними (згрупованими змінними).
Нехай є змінна яка має - градацій, та змінна яка має - градацій.

      ... r1
  n11 n12    
  n21        
  nij    
r2        
  n

Де - кількість таких спостережень ., позначимо та

 

Попередня обробка

До попередньої обробки відносять:

- розвідувальний аналіз;

- обчислення основних характеристик спостережуваних величин;

- видалення аномалій;

- перевірка основних гіпотез;

- перевірка на стохастичність вибірки.

 

Квантиль та процентні точки

Квантилем рівня для неперервної випадкової величини називається значення

Квантилем рівня для дискретної випадкової величини називається будь-яке значення , для границь якого виконується та

Вибіркові квантилі визначаються як квантилі відповідних емпіричних розподілів.

Q-процентною точкою для неперервної випадкової величини. називається значення
Q-процентною точкою для дискретної випадкової величини. називається довільне значення , для границь якого виконується та

 

Квантиль та процентна точка пов’язані певним співвідношенням, а саме

та

Введемо додаткові характеристики розподілу, похідні від перших двох.

Приклади квантилей:

  1. Медіаноюназивається квантиль рівня 0,5 .
  2. , - верхній та нижній квартилі відповідно.
  3. Значення називаються децилями.
  4. процентилі
  5. Інтерквантильною широтою рівня називається величина .
  6. Інтерквартильною широтою називається величина , тобто (Половина інтерквантильної широти ,називається імовірнісним відхиленням.)

Класичний регресій ний аналіз

Постановка: в якості апроксимації береться функція, лінійна по параметрах: (1)

.

.

– регресори. Деяка функція від векторів незалежних змінних

.

Тоді (2) можна переписати у вигляді: (3)

 

Теорема Андерсона-Тейлора

Вважаємо, що об’єм спостережень може зростати, тоді (3) можна переписати у вигляді
(8)
Оцінки з об’ємом збігається до з ймовірністю 1 - (нульова матриця)

 

Доведемо деякі властивості оцінок
1 а)
Згідно (4) (9)


1 б) Потрібно визначити розмір компоненти

Згідно а) , де ,

Лема1

Нехай , , , тоді виконується (*)


співпадає з квадратичною формою (*)

 

Застосуємо лему 1 до оцінки

 

3 а) ,

б) , , де , а

 

Довірчі області та інтервали для невідомих параметрів моделі.

І. Довірча область для з рівнем довіри
З властивості 2 маємо
(*)

Згідно 4б)
, де ,
маємо , де
тому (10)
Покажемо, що : ,
отже маємо (11)
і отже (**),
візьмемо

Лема2
Нехай , , - матриці розмірності , тоді наступні квадратичні форми та будуть незалежні тоді і тільки тоді, коли

Якщо, що (*) та (**) незалежні

- довірча область (12)

 

ІІ Довірчий інтервал для
За властивістю 1б) маємо (***)
Позначимо
отже - статистично незалежні.

Лема3
Нехай , , тоді наступні квадратичні форми та будуть незалежні тоді і тільки тоді, коли ( не обов’язково квадратна)

 


довірчий інтервал для (13)

 

@Лекція 12

III. Інтервали Бонфероні

Якщо для кожної компоненти побудувати довірчий інтервал з рівнями довіри , .

- ймовірність того, що і-та компонента своєму довірчому інтервалу, який побудований за (13).

- всі компоненти своїм довірчим інтервалам.

Треба знайти .

(Знак в ланцюжку з’являється внаслідок того, що ).

Звідси .

Пробіт-графік.

 

Будується наступним чином.:
Маємо на вході вибірку

Обчислимо емпіричну функцію розподілу (Сімейство розподілів F з базовою функцією )

Пробіт-графік – графік функції

Використовується для:

1) Перевірки гіпотези

У випадку, коли справедлива гіпотеза пробіт-графік повинен уявляти собою майже пряму.

 

Пояснення: маємо:

       
 
 
   

 

 


2) Виявлення наявності аномальних спостережень у вибірці.

 

 

 

@Лекція 2

Імовірнісний графік

 

Ідея та ж сама. Зі спотвореною віссю у. Маємо множину , яку розтягують за правилом , де

Папір, де спотворюється масштаб називається імовірнісним папером.

Якщо в якості розподілу взяти нормальний розподіл, то такий папір називається нормальним імовірнісним папером.

Будуємо графік функції для спостереження величини
1. У випадку, коли , то отримаємо майже пряму. Якщо маємо точки, що лежать осторонь, то перевіряємо їх на аномальність.
2.Виявляємо наявність аномальних спостережень

Висячі гістобари

Використовується для перевірки нормальності вибірки. Нехай по вибірці підраховано мат. сподівання та вибіркова дисперсія .

Найбільш узгодженим нормальним розподілом для спостережень за будемо називати такий нормальний розподіл .

Спочатку будуємо графік щільності з вибірки

В центрах групування даних до графіка підвішуються прямокутні гістобари, довжина яких пропорційна відносній частоті потрапляння у відповідний інтервал групування. Якщо основа цих гістобар не суттєво відхиляється від осі Ох – гіпотеза про нормальність вибірки приймається.

 

 

 

Підвішена коренеграма

 

Для кожного інтервалу групування даних визначають - емпірична частота потрапляння в інтервал, а також теоретичне значення частоти згідно гіпотези про найбільш узгоджений нормальний розподіл. Потім на графіку відкладають такі різниці: . І якщо ці значення не значно відхиляються від нуля, то гіпотеза про нормальність вибірки приймається.

 

Спостереження за двома змінними

Використовуються

1) Діаграма розсіювання.

2) Таблиця спряженості.

 

Діаграми розсіювання.

Маємо дві вибірки та . Використовуються для з’ясування класу залежності між парою кількісних змінних, а також для з’ясування наявності аномальних спостережень у вибірці.

 

Таблиця спряженості

Використовуються для представлення спостережень над номінальними, ординальними, кількісними дискретними (скінченими), кількісними неперервними (згрупованими змінними).
Нехай є змінна яка має - градацій, та змінна яка має - градацій.

      ... r1
  n11 n12    
  n21        
  nij    
r2        
  n

Де - кількість таких спостережень ., позначимо та

 

Попередня обробка

До попередньої обробки відносять:

- розвідувальний аналіз;

- обчислення основних характеристик спостережуваних величин;

- видалення аномалій;

- перевірка основних гіпотез;

- перевірка на стохастичність вибірки.

 

Квантиль та процентні точки

Квантилем рівня для неперервної випадкової величини називається значення

Квантилем рівня для дискретної випадкової величини називається будь-яке значення , для границь якого виконується та

Вибіркові квантилі визначаються як квантилі відповідних емпіричних розподілів.

Q-процентною точкою для неперервної випадкової величини. називається значення
Q-процентною точкою для дискретної випадкової величини. називається довільне значення , для границь якого виконується та

 

Квантиль та процентна точка пов’язані певним співвідношенням, а саме

та

Введемо додаткові характеристики розподілу, похідні від перших двох.

Приклади квантилей:



Поделиться:


Последнее изменение этой страницы: 2016-08-01; просмотров: 320; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.144.97.189 (0.315 с.)