Перевірка гіпотези про закон розподілу 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Перевірка гіпотези про закон розподілу



Розглядаємо задачу про встановлення теоретичного закону розподілу випадкової величини за емпіричним розподілом

Теоретичний закон розподілення буває:

· нормальний

· student

Перевіряємо чи відповідає емпіричний розподіл теоретичному нормальному розподілу.

Критерій узгодженості χ­2­ Пірсона

Статистичний критерій:

nwi – емпірична частота (змінну представляємо у вигляді інтервалів, від 0 до 10, від 10 до 20 і скільки з них сюди потрапить)

npi – теоретична частота

n – кількість інтервалів для значень змінної формулювання гіпотези.

 

Перевіряємо якщо змінна має менш 30 значень, обов’язково чи є розподіл нормальним

Н0 – розподіл значень змінної відповідає теоретичному нормальному розподілу

Н1 – розподіл значень змінної не відповідає теоретичному нормальному розподілу.

Перевірка гіпотези про середнє значення

Всі значення підпорядковуються нормальному закону розподілу.

Припускаємо, що значення розподілу за нормальним законом.

Якщо значень більше 30, то автоматично вважається, що розподіл є нормальним.

1. Порівнюємо за середнім значенням 2 вибірки, використовуючи t-тест для незалежних вибірок

2. Порівнюємо 2 вибірки (однофакторний дисперсійний аналіз)

3. Для однієї вибірки використовуємо простий (одиничний t-тест)

При формулюванні гіпотези ми формулюємо твердження про всю вибірку.

Загальний огляд параметричних та непараметричних методів

Всі критерії розподіляються на 3 групи.

1. Критерії відмінності між незалежними вибірками

2. Відмінність між залежними вибірками

3. Критерії оцінки залежності між змінними

При порівняння 2-х вибірок (і більше) один з основних критеріїв – залежність вибірок. Якщо елементу з 1-ї вибірки відповідає один і тільки один елемент з 2-ої вибірки, то така вибірка називається залежною. (столиця-країна) Якщо взаємозв’язок відсутній, то така вибірка називається незалежною.

Критерії відмінності між незалежними групами

 

2 вибірки

більше 2 вибірок

параметричні непараметричні параметричні непараметричні
t - student критерій Манна Уітні дисперсійний аналіз ранговий критерій Краскела Уоліса
  Калмогарова - Смірнова   медіанний тест

 

Критерії відмінності між залежними групами

2 вибірки

більше 2 вибірок

параметричні непараметричні параметричні непараметричні
t – student для залежних вибірок критерій значення (знаків) дисперсійний аналіз з повторюванням дисперсійний аналіз Фрідмана

 

Залежність між змінними

Вибріки

Параметрчині

· коефіцієнт кореляції Пірсона (сила взаємозв’язку між двома змінними)

Непараметричні

· коефіцієнт Спірмена

· коефіцієнт Гамма

· статистика Кендела

Непараметричні методи - це такі статистичні процедури для перевірки гіпотез, які не потребують нормального розподілу значень змінної.

Параметричні методи - це статистичні процедури, які вимагають нормального розподілу.

Переваги непараметричних методів

· не потрібно припущення про нормальний розподіл

· непотрібно перетворювати дані у форму з нормальни розподілом

· можна використовувати порядкові дані

· якщо розподіл відрізняється від нормального розподілу, то непараметричні методи мають більшу ефективність в порівнянні з параметричними.

Недоліки непараметричних методів

· якщо розподіл відповідає нормальному, то маємо меншу ефективність методу в порівнянні з параметричним

Ефективність - показує наскільки повністю використовуються дані, які використовуються для аналізу

Що б визначити чи до параметричних чи не до параметричних, то треба це робити за допомогою критерію хі квадрат Пірсона. Якщо відповідає нормальному, то звертаємось до параметричних.

Якщо розмір вибірки 30 елементів, то нормальний розподіл вважається вже наявним

 

Метод Манна Уітні

Маємо дві вибірки, і хочемо їх порівняти.

Непараметричний статистичний метод який використовується для оцінки розходжень між двома вибірками за рівнем певної ознаки. (кількісної)

Цей метод визначає зону розходжень між двома вибірками та зону перехресних значень між двома вибірками.

Чим менше значення критерію тим більша імовірність, що розходження між значеннями параметра у вибірках достовірні.

Обмеження на використання критерію:

· у кожній вибірці повинно бути не менше 3 значень. Допускається якщо в одній вибірці 2 значення, то в іншій повинно бути не менше 5.

Алгоритм:

1. сортуємо від найменшого до найбільшого

2. ранжуємо обидві вибірки разом з найменшого до найбільшого. Якщо однакові значення, то тоді пишемо, наприклад, не 8 і 9 порядковий номер, а 8,5 і 8,5. проте потім буде йти не 9 порядковий номер, а вже 10.

3. Потім складаємо все по першому стовпчику і по другому. Сумуємо, так сказати, ранги.

4. Рахуємо.

Формула за якою знаходимо фактичне значення:

n1 – розмір одної вибірки

n2 – розмір іншої вибірки

nmax – кількість значень у тій вибірці, де сума рангів (які ми рахували на попердньому етапі) вища

Tmax – ось ця максимальна сума рангів.

Критичне значення – дивимось за таблицею

5. Для даного критерію, якщо фактичне значення, обчислене за формулою менше критичного значення, знайденого за таблицею, то ми відхиляємо основну гіпотезу Н0 і навпаки. Якщо дорівнює - то приймаємо.

Дисперсійний аналіз

Однофакторний дисперсійний аналіз використовується для перевірки значимої відмінності у випадку більше двох вибірок.

Для перевірки гіпотези в дисперсійному аналізі використовується F-тест, який базується на F-статистиці.

Це відношення двох дисперсій

· Варіація обумовлена впливом фактору

· Варіація обумовлена випадковістю.

Початкові дані для дисперсійного аналізу це кількість незалежний одновимірних вибірок.

Вимоги для коректного використання дисперсійного аналізу:

· набір даних складається з к-вибірок отриманих з к-генеральних сукупностей.

· кожна генеральна сукупність підпорядковується нормальному розподілу і стандартні відхилення генеральних сукупностей однакові.

гіпотези Нноль - а1 = а2 =..... аК

а – середнє значення генеральної сукупності.

Н1 а1 не дорівнює а2. треба щоб хоч одна пара відрізнялась.



Поделиться:


Последнее изменение этой страницы: 2021-12-15; просмотров: 56; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.142.98.108 (0.008 с.)