Тема 8. Основні поняття. Суть вибіркового методу 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Тема 8. Основні поняття. Суть вибіркового методу



 

Математична статистика розробляє методи опрацювання результатів спостережень масових випадкових явищ з метою виявлення наявних у них закономірностей. Збір статистичних даних провадять за спеціальними правилами статистичного спостереження.

Суть вибіркового методу полягає в тому, що висновки, зроблені на основі вивчення частини сукупності (випадкової вибірки), можна розповсюдити на всю сукупність (генеральну сукупність). Числові характеристики генеральної сукупності називаються генеральними параметрами. До них відносять математичне сподівання й дисперсію, які є параметрами розподілу досліджуваної ознаки. Їхні теоретичні значення ніколи не відомі, але їх можна оцінити за значеннями вибіркових характеристик.

Оцінкою параметра називається числова характеристика, отримана в результаті обробки випадкової вибірки.

Статистичними аналогами параметрів розподілу є генеральна середня й генеральна дисперсія . Розраховані за даними вибірки числові характеристики позначають або , sвиб або Sвиб.

При здійсненні вибірки можливі помилки спостереження, до яких відносять помилки реєстрації й помилки репрезентативності. Помилки реєстрації виникають через неточності й погрішності при одержанні відомостей про одиниці сукупності, в результаті чого правдиве значення досліджуваної ознаки не збігається з його зареєстрованим значенням. Помилки репрезентативності являють собою різницю між вибірковими й генеральними характеристиками досліджуваної сукупності. Їх підрозділяють на систематичні й випадкові. Систематичні помилки пов'язані з тим, що структура вибірки відрізняється від структури генеральної сукупності. Звичайно це буває пов'язане з порушенням випадковості відбору. Випадкові помилки репрезентативності пояснюються тим, що досліджується тільки частина сукупності. Таким чином, наявність випадкової помилки споконвічно властива вибірковому методу.

Введемо ряд визначень.

Об'єктом спостереження називається сукупність предметів або явищ, об'єднаних якою-небудь загальною ознакою або властивістю якісного або кількісного характеру. Усякий об'єкт статистичного спостереження складається з окремих елементів — одиниць спостереження. Для вивчення характерних властивостей об'єкта випадковим образом відбирають із всієї сукупності обмежене число одиниць спостереження.

Генеральною сукупністю називають об'єкт спостереження, що містить всю сукупність одиниць, з яких виробляється вибірка.

Вибірковою сукупністю, або просто вибіркою, називають сукупність одиниць спостереження, випадково відібраних з генеральної сукупності.

Розрізняють два типи випадкових вибірок: властиво випадкова повторна вибірка (схема повернутої кулі) і властиво випадкова безповторна вибірка (схема неповерненої кулі). Вибір схеми відбору залежить від характеру досліджуваного об'єкта.

Об'ємом сукупності (вибіркової або генеральної) називають число одиниць цієї сукупності. Число одиниць вибіркової сукупності позначають n, а генеральної - N.

У результаті статистичного спостереження одержують набір значень спостережуваної ознаки - дані. Значення ознаки при переході від одного елемента до іншого варіюють (змінюються).

Варіантою називають кожне окреме значення досліджуваної ознаки

x1, x2, …, xn...

Частотою називають число, що показує, скільки разів зустрічається в сукупності та чи інша варіанта. Частоти позначають відповідно

m1, m2, …, mn...

Первинною статистичною сукупністю називається неупорядкований набір значень досліджуваної ознаки, отриманих у результаті спостереження.

Першим кроком в обробці статистичних даних є впорядкування отриманих значень ознаки в порядку зростання або убування, тобто побудова варіаційного ряду.

Варіаційним рядом називається таблиця, в одному рядку якої розташовуються варіанти x1, x2, …, xn у зростаючому або зменшуваному порядку, а в іншій — відповідні ним частоти m1, m2, …, mn...

xi x1 x2 xn
mi m1 m2 mn

де .

Варіація досліджуваної ознаки може бути дискретною й безперервною.

Дискретною називається варіація, при якій окремі значення ознаки (варіанти) відрізняються один від другого на деяку скінченну величину (звичайно ціле число).

Безперервною називається варіація, при якій значення ознаки можуть відрізнятися одне від іншого на яку завгодно малу величину.

Замість абсолютних значень частот mi звичайно використовують відносні – p*i. Для одержання відносних частот необхідно відповідну частоту розділити на суму всіх частот:

, , …, (8.1)

Сума всіх відносних частот дорівнює одиниці:

(8.2)

Якщо варіація ознаки має безперервний характер, то весь діапазон отриманих значень розділяють на інтервали так, що кінець одного інтервалу є початком наступного. При цьому частоти належать не до окремого значення ознаки, а до інтервалу значень. Звичайно як значення інтервалу приймають його середину.

У вибірці, що має дискретний характер варіації, число одиниць спостереження n може виявитися дуже великим. У результаті варіаційний ряд може виявитися громіздким і незручним для обробки. У такому випадку діапазон отриманих значень також поділяють на інтервали. Довжина i-го інтервалу позначається ki і визначається за формулою:

ki = ximax – ximin (8.3)

де ximax і ximin - відповідно верхня й нижня границі i -го інтервалу.

При групуванні даних з метою побудови інтервального варіаційного ряду завжди встає питання про вибір оптимального числа інтервалів. Це пов'язане з тим, що занадто велике число інтервалів зробить варіаційний ряд громіздким, а занадто мале приведе до огрубіння результатів статистичного аналізу. Для визначення оптимальної довжини інтервалу рекомендується використовувати формулу Старджеса:

(8.4)

де xmax і xmin - відповідно найбільше й найменше значення варіантів ряду; n – число одиниць сукупності.

Для наочності варіаційний ряд можна зобразити графічно у вигляді полігона розподілу, кумулятивної кривої, або гістограми.

Полігон розподілу (дослівно — багатокутник розподілу) будується в прямокутній системі координат. Величина ознаки відкладається на осі абсцис, частоти або відносні частоти - по осі ординат (рис. 8.1).

Кумулятивна крива (кумулята) утворюється при зображенні варіаційного ряду з накопиченими відносними частотами в прямокутній системі координат (рис. 8.2). Накопичена частота певної варіанти утворюється підсумовуванням всіх частот варіант, що передують даній, із частотою цієї варіанти. При побудові кумуляти дискретної ознаки по осі абсцис відкладають значення ознаки (варіанти). Ординатами служать вертикальні відрізки, довжина яких пропорційна накопиченій відносній частоті тієї або іншої варіанти Spi*. З'єднавши вершини ординат прямими лініями, одержимо ламану (криву) кумуляту. При Dxi ®0 кумулята прагне до безперервної кривої, що представляє собою функцію розподілу випадкової величини.

 

 
 

 


Гістограма розподілу будується аналогічно полігону в прямокутній системі координат (рис. 8.3). При побудові гістограми на осі абсцис вибирають відрізки, що відповідають інтервалам, на яких будують прямокутники із площею, пропорційною відносним частотам інтервалів pi*. З умови побудови гістограми випливає, що вся її площа дорівнює 1. Очевидно також, що при Dxi ®0 гістограма прагне до безперервної залежності, що уявляє собою щільність розподілу випадкової величини.



Поделиться:


Последнее изменение этой страницы: 2017-02-07; просмотров: 130; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.137.220.120 (0.01 с.)