Предмет і задачі математичної статистики 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Предмет і задачі математичної статистики



Математична статистика – це математична дисципліна, яка займається розробкою методів і моделей аналізу даних з метою виявлення закономірностей у результаті спостережень над масовими випадковими явищами та процесами. Математична статистика базується на поняттях і методах теорії ймовірностей, але розв’язує свої специфічні задачі. У теорії ймовірностей припускається, що імовірності настання окремих подій відомі. Вважаються відомими закони розподілу випадкових величин або їх числові характеристики. Оперуючи цими поняттями, у теорії ймовірностей знаходять закони розподілу і числові характеристики інших більш складних подій і випадкових величин. Як правило, на практиці ймовірності настання подій, закони розподілу випадкових величин або параметри цих розподілів невідомі. Для їх визначення (оцінювання) проводяться спеціальні спостереження або експерименти.

При обробці результатів експериментів статистичними методами основні поняття теорії ймовірностей – імовірності випадкових подій, закони розподілу випадкових величин тощо, виступають як деякі математичні моделі реальних закономірностей. Таким чином, теорія ймовірностей розробляє математичні моделі для описання реальних закономірностей масових випадкових явищ, формує систему поглядів на статистичну обробку та аналіз результатів експериментів.

Математична статистика розробляє методи математичної обробки результатів випробувань і визначення ймовірнісних характеристик випадкових явищ на основі експериментальних даних.

Сучасну математичну статистику визначають як науку про прийняття рішень в умовах невизначеності.

Основні задачі математичної статистики полягають у розробці методів:

· планування і організації статистичних спостережень;

· збору статистичних даних;

· «згортки інформації», тобто групування і скорочення статистичних даних з метою зведення великої кількості даних до невеликого числа параметрів, які у стислому вигляді характеризують усю досліджувану сукупність;

· аналізу статистичних даних;

· прогнозування випадкових подій і явищ.

Методи і засоби наукового аналізу даних, які належать до масових явищ, з метою визначення деяких узагальнюючих ці дані характеристик і виявлення статистичних закономірностей і складають предмет математичної статистики.

До основних задач статистичного аналізу відносяться такі задачі:

· визначення розподілів випадкових величин за результатами їх спостережень. До цієї загальної задачі зводиться багато частинних, наприклад, визначення ймовірностей подій, функцій розподілу, параметрів розподілу тощо;

· перевірка статистичних гіпотез про вигляд невідомого розподілу або про величини параметрів розподілу, вид якого відомий, перевірка гіпотез про однорідність та незалежність вибірок;

· аналіз залежностей між випадковими величинами (кореляційний і регресійний аналіз).

Варіаційні ряди та їх характеристики

Варіаційні ряди

Вихідним матеріалом при розв’язанні задач математичної статистики є послідовність незалежних спостережень випадкових величин. Це означає, що є ймовірнісний експеримент, у якому спостерігається випадкова величина Х і виконується n незалежних реалізацій цього експерименту. Спостережувані значення випадкової величини – називаються випадковою вибіркою або просто вибіркою. Кількість спостережень n – об’ємом вибірки. Множина можливих значень випадкової величини X, які можуть спостерігатися при багатократній реалізації експерименту, називається генеральною сукупністю або вибірковим простором. З точки зору теорії ймовірностей вибірка є реалізацією деякої випадкової величини X. Отже, поняття генеральної сукупності, у певному сенсі, аналогічно поняттю випадкової величини, оскільки повністю обумовлено певним комплексом умов.

Задачі математичної статистики виникають, коли закон розподілу ймовірностей випадкової величини X невідомий, при цьому методи статистичного аналізу дозволяють одержати інформацію про різні закономірності у генеральній сукупності. У залежності від того, який клас можливих розподілів генеральної сукупності і що потрібно знати про функцію розподілу, виникають різні статистичні задачі.

У практиці статистичних спостережень розрізняють два види спостережень: суцільне, коли вивчаються усі об’єкти (елементи) сукупності, і несуцільне, вибіркове, коли вивчається частина об’єктів. Прикладом суцільного спостереження є перепис населення, який охоплює усе населення країни. Вибірковим спостереженням є, наприклад, вибірковий контроль якості продукції, коли для контролю вибирається частина продукції з усієї продукції, що виготовляється.

Сутність вибіркового методу полягає у тому, що за деякою частиною генеральної сукупності (за вибіркою) судять про її властивості в цілому. Для того, щоб за даними вибірки мати можливість судити про генеральну сукупність, вона повинна бути відібрана випадково. Вибірка називається репрезентативною (представницькою), якщо вона досить добре відтворює генеральну сукупність. Використовують два способи утворення вибірки:

повторний вибір (за схемою поверненої кулі), коли випадково відібраний і обстежений елемент повертається у загальну сукупність і може бути повторно відібраний;

безповторний вибір (за схемою неповерненої кулі), коли випадково відібраний елемент не повертається у загальну сукупність.

Нехай – деяка вибірка ( -вимірний випадковий вектор). Побудуємо на основі цієї вибірки упорядкований за зростанням випадковий вектор тобто вектор, у якому

ØПослідовність у якій називається варіаційним рядом. Спостережені значення випадкової величини X (ознаки) називають варіантами (порядковими статистиками).

Ø Розмахом варіювання або шириною вибірки називається статистика

(2.1)

Ø Рангом елемента вибірки називається номер, який він одержує в упорядкованій за зростанням послідовності , тобто у варіаційному ряді.

Так, ранг 1 одержить найменше із спостережених значень вибірки, ранг 2 – друге за величиною значення і т. д., ранг найбільше із чисел .

Оскільки розгляд і осмислення вибіркових даних (особливо при великій кількості спостережень n) ускладнено і за ними практично неможливо уявити характер розподілу випадкової величини X, то вибірки групують. Кількість інтервалів (розрядів) групування вибирають таким чином, щоб згрупований варіаційний ряд не був громіздким, але і не дуже малим, щоб не втратити особливості розподілу ознаки. Якщо коливання щільності розподілу ймовірності не дуже великі, то бажано вибирати однакові розряди. Якщо ж є згущення варіант, то бажано розряди вибирати так, щоб згущення були якомога ближче до середини розрядів. Із границями розрядів повинно як можна менше співпадати значень варіант.

У сукупностях з розподілами, близькими до нормального, кількість груп k (нижня оцінка) орієнтовно можна визначити за формулою Стерджеса:

де n – об’єм вибірки.

ØЧисла, які дорівнюють кількості варіант із даного розряду, називаються частотами (позначимо їх як , а відношення їх до загальної кількості спостережень n – відносними частотами або частками:

.

При вивченні варіаційних рядів поряд, з поняттям частота, використовується поняття накопиченої частоти , яка показує кількість варіант із значенням, меншим за x. Відношення накопиченої частоти до загальної кількості спостережень n називається накопиченою часткою:

.

ØВаріаційний ряд називається дискретним, якщо будь-які його варіанти відрізняються на постійну величину, i – неперервним (інтервальним), якщо варіанти відрізняються на скільки завгодно малу величину.

Дискретний і інтервальний варіаційні ряди представляються у вигляді:

а) дискретний варіаційний ряд:

 
 
 

де значення випадкової величини X, які спостерігались у експерименті;

кількість спостережень (частота) ;

відносна частота ; об’єм вибірки.

б) інтервальний варіаційний ряд:

 

де інтервали, на які розбитий діапазон значень випадкової величини X; частота попадань в i-й інтервал.

Алгоритм групування варіаційного ряду:

· визначаємо розмах вибірки R;

· задаємо кількість розрядів групування k і визначаємо їх довжину:

· визначаємо границі розрядів:

· визначаємо частоти або частки попадання варіант у задані розряди.

Функції Mathcad, які застосовуються при групуванні варіаційних рядів:

Емпірична функція розподілу

Ø Емпіричною функцією розподілу (статистичною функцією розподілу, функцією розподілу вибірки) називається функція , яка визначає для кожного значення x відносну частоту події . Отже, за означенням:

, (2.2)

де – кількість варіант, менших ; – об’єм вибірки.

Іншими словами, для даного емпірична функція розподілу представляє собою накопичену частку. Зауважимо, що при будь-якому значенні величини , а отже і є випадковими.

Якщо вибірка представлена варіаційним рядом, то

. (2.3)

На відміну від емпіричної функції розподілу вибірки , функцію розподілу генеральної сукупності називають теоретичною функцією розподілу. Відмінність між ними полягає у тому, що визначає ймовірність події , а – частоту цієї події.

Емпірична функція розподілу має усі властивості, що і функція розподілу ймовірностей :

1. Значення функції належать відрізку [0,1];

2. – неспадна функція;

3. Якщо – найменша варіанта, то = 0 при ;

4. Якщо – найбільша варіанта, то = 1 при ;

Згідно з законом великих чисел, функція збігається за ймовірністю до висхідного розподілу . Це означає, що при великих числа і мало відрізняються одне від одного у тому смислі, що

при будь-якому .

Більш того має місце теорема Глівенка: емпірична функція розподілу рівномірно по з імовірністю 1 збігається при до теоретичного розподілу :

.

Розглянемо тепер задачу статистичного аналізу щільності розподілу неперервно розподіленої випадкової величини. Така задача в практичних застосуваннях зустрічається частіше, ніж розглянута задача статистичного аналізу функції розподілу.

Нехай – повторна вибірка, кожний елемент якої має щільність розподілу – відповідний варіаційний ряд з розмахом варіювання Розіб’ємо інтервал на інтервалів де Нехай кількість елементів варіаційного ряду, що попадають у і-й інтервал .

Ø Статистика

(2.4)

називається емпіричною щільністю розподілу.



Поделиться:


Последнее изменение этой страницы: 2017-02-10; просмотров: 578; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.145.23.123 (0.025 с.)