ТОП 10:

Тема 5 Побудова дизайну вибірки



 

Перелік запитань

Вивчення основних характеристик сукупності
Стратифікація генеральної сукупності
Дизайн вибірки

Методичні вказівки

Проведення вибіркового статистичного спостереження складається з ряду послідовних етапів, першим з яких є його планування. На цьому етапі вагомою складовою є формування основи вибірки, тобто переліку підприємств, з яких буде відбиратись надалі вибіркова сукупність. Формування вибіркової сукупності – це процес, який істотно впливає на якість результатів спостереження.

1 Вивчення основних характеристик сукупності

Важливим елементом на етапі планування є отримання певного уявлення щодо характеристик досліджуваної сукупності, її структури та основних властивостей. Під характеристиками сукупності автор розуміє узагальнюючі статистичні показники, такі як: мінімальне, максимальне, середнє та сумарне значення, середньоквадратичне відхилення та дисперсію, коефіцієнт варіації, а також характеристики форми розподілу, які зокрема дозволяють попередньо оцінити, наскільки дана сукупність потребує стратифікації і може бути стратифікована.

До основних властивостей сукупності відносять:

1) однорідність сукупності (якісну чи кількісну);

2) наявність неактивних та нульових одиниць (для обстеження підприємств);

3) здатність сукупності до стратифікації – тобто розчленування її на більш однорідні групи (страти);

4) роздрібненість страт при стратифікації;

5) динамічність сукупності – тобто здатність її характеристик змінюватись у часі.

Сукупність вважається однорідною, якщо її складові елементи (одиниці) подібні між собою за істотними для даного дослідження ознаками і належать до того самого типу явища. У протилежному випадку сукупність є неоднорідною. Сукупність, що є однорідною, будучи однорідною за одними ознаками, може бути різнорідною за іншими.

Однорідними вважаються сукупності, що мають нормальний розподіл, який використовується як стандарт. У практиці статистичних досліджень (особливо у статистиці підприємств) не існує сукупностей з нормальним розподілом, проте зустрічаються сукупності з розподілом наближеним до нормального (передусім для обстежень населення). Оцінювання ступеня однорідності здійснюється зазвичай за допомогою критеріїв математичної статистики, які саме ґрунтуються на оцінці ступеня наближеності розподілу сукупності до нормального.

Значне відхилення від нормального розподілу можна також спостерігати візуально. Для цього на гістограму розподілу сукупності накладається крива нормального розподілу. Видовжений лівий або правий “хвости” вказують на ліво- або правосторонню асиметрію.

Міра асиметрії визначається за допомогою показників асиметрії, найбільш точним і розповсюдженим з яких є показник, що базується на визначенні центрального моменту третього порядку: . У симетричному розподілі його величина дорівнює нулю.

Як критерій однорідності часто виступає квадратичний коефіцієнт варіації, що визначається як відношення середньоквадратичного відхилення до середнього значення ознаки . Завдяки своїм математичним властивостям в нормальному розподілі квадратичний коефіцієнт варіації або 33%. Тому близькість цього коефіцієнта до 0,33 вказує на однорідність сукупності.

З точки зору фахівця зі статистики однорідність є бажаною вимогою до сукупності, яка підлягає обстеженню. Однорідність сукупності впливає на точність результатів вибіркового обстеження таким чином: чим однорідніша сукупність, тим точніші його результати.

Насправді, усувна неоднорідність може забезпечити такі ж точні результати, як і однорідність сукупності. Тому здатність сукупності до ефективної стратифікації (яка дає виграш у точності) дещо пом’якшує вимогу однорідності сукупності.

2 Стратифікація генеральної сукупності

У якості важливого фактору, що визначає репрезентативність вибіркового обстеження, виступає спосіб формування вибіркової сукупності, оскільки точність обстеження залежить насамперед від того, яким чином була відібрана сукупність одиниць, що підлягають обстеженню. Шляхом підбору способу формування вибірки можна сформувати репрезентативну вибірку навіть з неоднорідної сукупності. Таким чином вирішення питання щодо способу формування вибірки має не тільки теоретичний інтерес, але набуває важливого практичного значення.

При проведенні вибіркового обстеження вид вибірки відіграє важливу роль також для визначення оптимальної чисельності вибіркової сукупності. Тому обґрунтування способу формування вибіркової сукупності є обов’язковою умовою науково організованого вибіркового обстеження.

У статистиці застосовуються різні способи формування вибіркової сукупності, що обумовлюється задачами дослідження і залежить від специфіки об’єкту дослідження.

Якщо генеральна сукупність є неоднорідною, то необхідно використовувати такий тип вибірки, який би враховував структуру сукупності. Тобто доцільним є застосування стратифікованої схеми формування вибірки. Стратифікована вибірка дуже широко застосовується у статистиці підприємств, оскільки вона є дуже ефективною при вивченні складних статистичних сукупностей.

При стратифікованій вибірці генеральна сукупність спочатку розшаровується на однорідні типові групи (страти). Потім з кожної страти проводять відбір одиниць у вибіркову сукупність. Страти можна розглядати як окремі сукупності, для кожної з яких може застосовуватись своя стратегія вибірки.

Попереднє розшарування генеральної сукупності забезпечує репрезентативність стратифікованої вибірки, представництво в ній кожної групи, що дозволяє виключати вплив міжгрупової дисперсії на похибку обстеження. Зрозуміло, що чим однорідніший склад утворених страт, тим краще стратифікована вибірка буде представляти характеристики досліджуваної ознаки у генеральній сукупності.

Важливою особливістю стратифікованої вибірки є те, що вона дає більш точні результати порівняно з іншими схемами відбору одиниць у вибіркову сукупність. Випадкова похибка стратифікованої вибірки обчислюється на основі середньої величини із групових дисперсій. Натомість для простої випадкової вибірки похибка обчислюється на основі загальної дисперсії, яка за правилом додавання дисперсій складається з внутрішньогрупової (середньої з групових) та міжгрупової дисперсій.

Якщо утворити страти таким чином, щоб міжгрупова дисперсія – відобразила варіацію, зумовлену неоднорідністю, то, виключивши її з розрахунків величини випадкової похибки, ліквідуємо вплив цієї неоднорідності. Залишиться тільки друга компонента, яка характеризує варіацію даних всередині страт, і тому її можна розглядати як показник випадкової варіації.

Таким чином, для проведення репрезентативної вибірки для неоднорідної генеральної сукупності необхідно основу вибірки попередньо структурувати. Частково таке структурування досягається за рахунок стратифікації основи вибірки за певними ознаками (критеріями), які корелюють принаймні з найбільш важливими для дослідження ознаками. Отже, формування вибірки зі структурованої основи вибірки буде забезпечувати репрезентативність першої.

3 Дизайн вибірки

Організаційно-логічна модель структури вибіркової сукупності називається планом (дизайном) вибірки. Числовим виразом статистичної ефективності того чи іншого плану вибірки є відношення квадратів середніх похибок для даного плану обстеження та для простої випадкової вибірки:

.

Дана характеристика називається ефектом дизайну.

Таким чином, для стратифікованої вибірки ефект дизайну завжди менший за одиницю, тобто стратифікована вибірка завжди має більший ефект, ніж проста випадкова вибірка.

Для порівняння точності та надійності результатів за різними планами вибірки використовують обернену величину

.

Проте подібність одиниць усередині страт при стратифікації повинна бути не лише кількісною (за значеннями ознак), але й за поведінкою під час обстеження, що залежить передусім від ступеня їх активності. Тому, наприклад, при обстеженнях підприємств, спочатку проводять поділ сукупності за активністю підприємств. Очевидно, що ступінь активності підприємств буде впливати на кількість відсутніх відповідей. Зазвичай виділяють підприємства:

1) неактивні – мають нульові цільові показники за звітний та за попередній до звітного періоди;

2) нульові – мають нульові цільові показники лише за звітний період;

3) активні – мають ненульові цільові показники.

Вивчення основних характеристик сукупності має сенс лише для групи активних підприємств, оскільки для груп неактивних та нульових підприємств цільові ознаки мають нульові значення.

Далі необхідно визначити ознаки, за якими стратифікація матиме найкращий ефект. Серед найбільш часто використовуваних ознак для стратифікації є такі як регіон, основний вид економічної діяльності та розмір підприємства. Зауважимо, що велика кількість критеріїв стратифікації може призвести до надлишкового подрібнення страт, що негативно відобразиться на дизайні вибірки.

Використання в якості ознаки стратифікації регіону не завжди дає виграш у точності показників вибіркового обстеження, проте розподіл підприємств за регіонами є необхідним для отримання даних обстеження у регіональному розрізі. Крім того, бажано отримати приблизно однакове навантаження на кожного статистика, що буде приймати участь у обстеженні. А тому, у зв’язку з важливістю для споживача інформації ознаки регіону використовувається прийом “прихованої стратифікації”.

Виконується він у два етапи:

1) безпосередньо перед формуванням вибірки підприємства в стратах, з яких буде проводитись відбір, упорядковуються за видом економічної діяльності, розміром підприємства (кількістю працівників) та регіональною ознакою;

2) використовується систематичний відбір одиниць у вибірку.

Такий підхід забезпечує наближено пропорційне представлення у вибірці кожного регіону без безпосередньої стратифікації за регіональною ознакою.

Використання основного виду економічної діяльності підприємства як критерію стратифікації зумовлене передусім необхідністю подання узагальнених результатів спостереження у розрізі видів діяльності. Стратифікація лише за видом діяльності зазвичай не забезпечує однорідності утворених страт, проте страти є у середньому більш однорідними ніж стратифікація за регіональною ознакою.

Розмір підприємства також є важливим критерієм для стратифікації. Зазвичай у світовій практиці розмір підприємства характеризується ознакою чисельності працівників. Інколи використовують дві ознаки: кількість працівників та обсяг реалізації продукції (послуг), якщо вони передбачені програмою обстеження або ця інформація є наявною у базі вибірки.

Особливої уваги потребують малі страти (страти з невеликою кількістю підприємств). Зазвичай такі страти обстежуються повністю, оскільки дуже важко отримати точні результати через невеликий їх обсяг (не працює закон великих чисел). При великій подрібненості страт (наприклад, через велику кількість критеріїв стратифікації або ж значної їх деталізації) такі страти значно вичерпують резерв вибіркової сукупності, який має обмеження. Граничний розмір вибірки є важливим параметром з тих, що встановлюються апріорі замовником обстеження, якщо такий є. Замовник, у свою чергу, виходить із міркувань фінансових, людських та часових витрат, а також звітного навантаження на респондентів. На міжнародному рівні єдині для усіх країн-учасниць параметри вибірки задаються з метою забезпечення порівнянності даних і відповідного рівня якості.

Таким чином, необхідно намагатися зменшувати кількість малих страт за рахунок їх об’єднання з близькими їм стратами. Проте ймовірно, що при цьому утворена об’єднана страта буде менш однорідною, ніж дві дрібні, з яких вона складається. Тому при об’єднанні страт необхідно обрати узагальнений критерій, який враховував би ці два фактори і вказував би на ефективність такого об’єднання, наприклад, t-критерій близькості середніх.

В загальному вигляді, об’єднання страт прийнятне, якщо виконуються такі умови:

1) страти близькі за видом діяльності та не є більш укрупненими, ніж це необхідно для статистичних публікацій;

2) середні значення ознаки в цих стратах є близькими (t-критерій);

3) страти не містять нетипових підприємств, які істотно впливають на середнє значення ознаки;

4) до об’єднання залучається якомога більша кількість малих страт.

Нетипові підприємства можуть суттєво впливати на середнє значення ознаки у страті. При об’єднанні двох страт, одна з яких (або ж обидві) містить таке нетипове (нетипові) підприємство, може суттєво погіршуватись однорідність об’єднаної страти, ось чому вимагається виконання третього пункту.

За способом проведення будемо виділяти два види об’єднань: послідовне та паралельне. Послідовне відбувається наступним чином. Формується перша об’єднана страта і обчислюється загальний обсяг вибірки. Якщо він зменшився, це означає, що об’єднання викликає зниження обсягу вибірки (при фіксованому обсязі вибірки – зниження похибки). Якщо ж загальний обсяг збільшився, то страти об’єднувати не варто і необхідно залишити показники сукупності на попередньому рівні. Далі формується наступна страта, для якої виконуються аналогічні обрахунки і т.д.

Проте таке об’єднання має той недолік, що на кожному наступному кроці отримується інша структура основи вибірки. А тому оцінка впливу об’єднання на результат на різних кроках (тобто для різних страт) є слабко порівнюваною. Тому автор віддає перевагу паралельному об’єднанню.

Паралельне об’єднання відбувається наступним чином: об’єднані страти формуються за описаними вище умовами і після кожного такого об’єднання обчислюється загальний обсяг вибірки (враховуючи усі інші страти). Якщо загальний обсяг вибірки зменшився, це означає, що об’єднання дає позитивний ефект і тому таке об’єднання приймається. Якщо ж загальний обсяг збільшився, то це означає, що об’єднання не дає позитивного ефекту і страти об’єднувати не варто.

 







Последнее изменение этой страницы: 2016-04-19; Нарушение авторского права страницы

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 34.204.183.113 (0.007 с.)