Получить неискаженную информацию по анкете, содержащей более 40—50 вопросов, на практике невозможно.



Мы поможем в написании ваших работ!


Мы поможем в написании ваших работ!



Мы поможем в написании ваших работ!


ЗНАЕТЕ ЛИ ВЫ?

Получить неискаженную информацию по анкете, содержащей более 40—50 вопросов, на практике невозможно.



Чрезмерное увеличение объема любой исходной информации, в том числе получаемой и не путем опроса, неизбежно ведет к увеличению так называемого «информационного шума», т.е. к росту числа помех. Этот «шум» складывается из механических систематических ошибок регистрации и ошибок, связанных с вариабельностью исходной информации. Достигая известного предела, такой «шум» просто подавляет искомую исследователем информацию.

Не является панацеей от упомянутого «шума» и использование самых точных и совершенных приборов и аппаратуры. Это связано, прежде всего, с большой вариабельностью (изменчивостью, случайностью) медико-биологических процессов, которая представляет собой сложное явление, складывающееся из нескольких составляющих. Одной из самых существенных среди них по негативным последствиям, с точки зрения результативности статистической обработки, является аналитическая вариабельность. Она возникает из-за расхождения между результатами измерений в одной пробе. Например, результаты подсчета клеточных элементов крови одного и того же зафиксированного мазка, проведенного несколько раз, даже одним и тем же специалистом, будут, хоть и не намного, отличаться.

Внутрииндивидуальная вариабельность характеризует расхождение значений нескольких замеров какого-либо параметра у одного и того же человека. Например: масса тела у одного и того же здорового человека в течение суток изменяется.

Межиндивидуальная, или внутригрупповая, вариабельность характеризует расхождение значений замеров какого-либо параметра у разных людей, даже если они здоровы.

К этим видам вариаций добавляется еще одна — вариабельность межгрупповая, изучение которой, собственно говоря, и является целью любого исследования.

Высокую вариабельность медико-биологических данных можно снижать,используя специальные, порой весьма громоздкие, методики регистрации измеряемых параметров (стандартизация условий регистрации, многократная регистрация замеров и т.д.), а также употребляя специальные приемы статистической обработки. Однако, результативность таких операций остается во многих случаях невысокой. В лучшем случае, удается уменьшить один из компонентов обшей вариабельности. Например, в эксперименте, в котором сравниваются два наблюдения одной и той же группы до и после воздействия изучаемого фактора, исключается часть внутригрупповой вариации, связанной с индивидуальными различиями субъектов, поскольку рассматриваются просто разности между двумя измерениями («до» и «после») для каждой единицы наблюдения. Именно это учитывается при вычислении критерия Вилкоксона для зависимых выборок.

По времени наблюдение может быть текущим или единовременным.

Текущее (непрерывное) наблюдение предусматривает регистрацию данных по мере их возникновения за какой-либо длительный промежуток времени. Данные при этом виде наблюдения накапливаются во времени. Например: данные о заболеваемости по обращаемости, инфекционной заболеваемости, смертности, регистрация актов гражданского состояния ЗАГСами за год и т.д. Отдельные результаты, полученные таким путем, можно суммировать (помесячную заболеваемость можно суммировать по кварталам, за год).

Единовременное (прерывное) наблюдение предусматривает регистрацию данных в один момент времени, или по состоянию на один момент времени, так называемый критический момент наблюдения. Таким образом, проводится сбор данных при переписях населения.

На определенный момент времени (на конец года)учитывается численность населения, численность медицинского персонала, количество учреждений медицинской помощи. Заболеваемость по данным профилактических осмотров (патологическая пораженность) также регистрируется на определенный момент времени. Особенность полученных таким путем данных — их нельзя просто суммировать. Например: численность населения района в 2006 году составила 20000 человек, в 2007 году — 18000 человек. За суммарный период 2007—2008 годов можно рассчитать только среднегодовую численность населения. Если единовременное наблюдение регулярно повторяется (ежегодный учет численности населения, предприятий и т.п.), то такое наблюдение называется периодическим.

По охвату статистической совокупности исследование может быть сплошное или не сплошное. Эта методическая особенность сбора данных определяет весь дальнейший ход и методику статистического анализа.

При сплошном статистическом исследовании группа наблюдения формируется путем полного охвата всех единиц генеральной совокупности. На практике сплошное исследование проводится крайне редко, поскольку осуществить такое наблюдение организационно очень трудно или физически невозможно из-за больших размеров генеральной совокупности или из-за отсутствия определенных границ этой совокупности. В ряде ситуаций, даже если генеральная совокупность ограничена в своих размерах, исследование объекта приводит к его уничтожению (анализ качества промышленных партий вакцин, сывороток, медикаментов). В этой ситуации проведение сплошных исследований также невозможно. К тому же, сплошные исследования во много раз дороже не сплошных. Существенный недостаток сплошных исследований — большие затраты времени на сбор данных, что приводит к затягиванию исследований на продолжительное время. Кроме того, формирование в ходе таких наблюдений больших массивов данных вызывает затруднения при обработке собранных материалов. Такие наблюдения используют, как правило, только для решения общегосударственных задач переписи населения, сбора информации об инфекционной заболеваемости и некоторых других задач.

К методам не сплошного наблюдения относятся монографический метод, метод основного массива и, собственно, выборочный метод.

Монографический метод применяется для подробного описания объекта, имеющего какие-либо яркие особенности. Например: медико-социальное обследование национальностей Крайнего Севера или социально-гигиеническое описание промышленного центра. Выводы, которые получаются путем таких обследований, относятся либо только к конкретному объекту исследования, либо могут быть распространены на весьма ограниченную группу аналогичных объектов.

Метод основного массива предусматривает обследование контингентов, которые могут быть сосредоточены на конкретном объекте. Например: изучение госпитализированной заболеваемости в стационаре. Данные о структуре заболеваний, тяжести течения и их прогнозе, полученные в этом исследовании, могут иметь значение только для решения частных вопросов. Судить о распространенности патологии за пределами такого стационара по этим данным нельзя.

Собственно выборочное исследование охватывает выборочную совокупность или просто выборку из генеральной совокупности. Такое исследование имеет ряд весьма существенных преимуществ перед сплошным наблюдением. Во-первых, оно дает значительную экономию средств и требует существенно меньше времени, чем сплошное. Во-вторых, при выборочном исследовании может быть достигнута большая глубина и детальность изучения вопроса. В-третьих, при меньшем числе наблюдений уменьшаются вероятности систематических ошибок наблюдения, возникающих, когда объектам приписывают искаженные данные.

 

Виды выборок

Процедура формирования выборки определяется методом, на основании которого отбираются единицы генеральной совокупности. При формировании выборки используются случайные (вероятностные) и неслучайные (детерминированные, невероятностные) методы.

Если все единицы генеральной совокупности имеют известный шанс (вероятность) быть включенными в выборку, то она называется вероятностной или случайной. Если этот шанс (вероятность) неизвестен, то выборка является невероятностной.

Вероятностные выборки предполагают, что в основе их формирования лежит принцип случайности, когда каждая единица генеральной совокупности имеет равные шансы попасть в выборку. Случайность при этом рассматривается не в обыденном смысле слова, а как некая система организации отбора, при которой именно случай определяет включение той или иной единицы плюральной совокупности в выборку.

Простая случайная выборка предполагает, что вероятность быть включенными в выборку известна и является одинаковой для всех единиц генеральной совокупности. При этом отбор производится независимо от признаков, которыми обладают отдельные единицы (то есть независимо от пола, возраста, образования, уровня доходов и т.д). Вероятность быть включенным в выборку определяется отношением се размера к объему генеральной совокупности.

Систематическая выборка также может использоваться только в том случае, когда исследователь располагает полным списком единиц генеральной совокупности. Техника формирования данной выборки предполагает определение выборочного шага («интервала скачка») и стартового номера. Первый определяется как отношение объема генеральной совокупности к размеру выборки, второй — случайным образом (лотерейным подбором, по таблице случайных чисел). Предположим, что проводится исследование успеваемости студентов. На первом курсе обучается 800 человек. Определено, что исследованием будет охвачено 100 студентов. Выборочный шаг равен 8 (800 : 100). Случайным образом определяется стартовый номер (к примеру, 3). Таким образом, в выборку попадут студенты-первокурсники под номерами 3, 11, 19, 27 и т.д.

Возможности использования систематической выборки во многом определяются наличием для различных видов генеральных совокупностей списков (например, спецификаций, телефонных справочников). Систематическая выборка была бы полностью адекватна случайной, если бы единицы генеральной совокупности попадали в нее случайным образом. Такому условию не удовлетворяет ни один реальный список. Поэтому на практике систематический отбор считают эквивалентным случайному, если порядок расположения единиц в списке никак не связан с исследуемыми признаками.

При достаточно простой процедуре формирования систематическая выборка даже при небольших своих размерах позволяет охватить сравнительно большие по объему генеральные совокупности. Данный метод является более экономичным и оперативным по сравнению с методом простого случайного отбора. В то же время, при использовании систематической выборки получаются менее репрезентативные результаты.

Стратифицированная выборка предполагает, что исследуемая совокупность подразделяется на страты, то есть на более мелкие совокупности по какому-либо признаку, который связан с исследуемой проблемой (например, взрослое население можно разбить на следующие страты: 18-25, 26-35, 36-45 лет и т.д.). Существенным моментом при стратификации является то, что каждая единица генеральной совокупности попадает только в одну страту. Из выделенных страт производится отбор единиц методами простой случайной или систематической выборки.

Если размер выборки для определенной страты пропорционален размеру страты по отношению ко всей совокупности, то выборка называется пропорционально стратифицированной. В случае непропорционально стратифицированной выборки необходимо использовать весовые коэффициенты, уравновешивающие размеры страт.

При применении данного метода обычно используются признаки, которые находятся в известной корреляции с проблемами, являющимися предметом исследования. Исходными принципами при выборе признаков для стратификации считаются: минимизация различий между единицами каждой страты и максимизация различий между стратами. Первый принцип обеспечивает однородность единиц каждой страты, то есть является гарантией ее гомогенности. Необходимость этого связана с предположением, что лица, попадающие в одну и ту же страту, будут проявлять достаточно сходное поведение. Соблюдение же второго принципа гарантирует достаточные различия в поведении респондентов разных страт. В противном случае, формирование стратифицированной выборки не имеет смысла.

Стратифицированная выборка является более точной по сравнению с простой случайной и предпочтительна, когда генеральная совокупность очень неоднородна по качественному составу. Однако, стратифицированная выборка может быть сформирована при наличии дополнительной информации обо всей генеральной совокупности или результатов предыдущих исследований.

Приведем пример формирования стратифицированной выборки. Предположим, что на определенном курорте в настоящее время отдыхает 2000 туристов, из которых: в возрасте 16-20 лет — 500 человек; 20-30 лет — 800; 30-40 лет — 400; свыше 40 лет — 300. Стратифицированная выборка может выглядеть следующим образом: n = 200 человек, из которых: 50 человек в возрасте 16-20 лет; 80 — в возрасте 20-30 лет; 40 — в возрасте 30-40 лет; 30 — в возрасте свыше 40 лет.

Кластерная выборка, как и стратифицированная, предусматривает разделение генеральной совокупности на более мелкие. Основное различие между ними состоит в том, что при кластерной выборке производится отбор определенных частей (кластеров), из которых, в свою очередь, случайным образом осуществляется отбор лиц, попадающих в выборку. При стратификации в выборку включаются лица из каждой страты целевой совокупности. Тогда каждая страта является гомогенной по тому или иному признаку (например, полу, возрасту). В случае же кластерной выборки каждый кластер представляет собой уменьшенную модель генеральной совокупности. При этом единицы кластера должны быть максимально разнородными, а сами кластеры — как можно более однородными.

При исследовании здоровья населения страны кластеры могут быть сформированы по принципу территориальной привязки к определенному региону. Страна разбивается на четко определяемые части (кластеры), например области. Считается, что выделенные кластеры являются идентичными и состояние здоровья населения отдельных областей характерно для страны в целом. Далее случайным образом выбирается одна из областей (один кластер), формируется выборка, проводится соответствующее исследование, а выводы относятся к совокупности населения всей страны.

Достоинство кластерной выборки состоит в том, что при ее формировании отсутствует необходимость (как в случае стратифицированной) в сведениях относительно распределения совокупности но отдельным признакам (полу, возрасту, образованию, специальному статусу и т.д.). Одним из самых существенных преимуществ кластерных выборок является и то, что при их использовании исследования отличаются относительно небольшими затратами вследствие компактности отдельных кластеров, в качестве которых могут рассматриваться не только территориально-географические образования.

На практике не всегда имеется в наличии полный список единиц генеральной совокупности, что затрудняет или делает в принципе невозможным использование вероятностной выборки. Поэтому при проведении исследований широко применяются невероятностные (неслучайные)выборки, отличающиеся простотой формирования, а также требующие меньших временных и финансовых затрат. В то же время, они не обладают такой точностью и высокой степенью представительности и достоверности, которая характерна для вероятностных (случайных) выборок. При формировании невероятностных выборок подбор единиц в определенной степени является преднамеренным, а не случайным. Поэтому, в отличие от вероятностных выборок, статистические выводы применительно ко всей генеральной совокупности в этом случае делать не вполне правомерно.

 

Репрезентативность выборки

Конечной целью изучения выборочной совокупности всегда является получение информации о генеральной совокупности. Для этого выборочное исследование должно удовлетворять определенным условиям. Одно из главных условий — репрезентативность (представительность) выборки. Как обсуждалось ранее, выделяют качественную и количественную репрезентативность.

Случайность, гарантирующая качественную (структурную) репрезентативность статистических исследований, достигается выполнением ряда условий формирования выборочных групп (совокупностей):

1. Каждый член генеральной совокупности должен иметь равную вероятность попасть в выборку.

2. Отбор единиц наблюдения из генеральной совокупности необходимо проводить независимо от изучаемого признака. Если отбор проводится целенаправленно, то и при этом необходимо соблюдать условия независимости распределения изучаемого признака.

3. Отбор должен проводиться из однородных групп.

Соблюдение условий, гарантирующих максимальную близость выборочной и генеральной совокупностей, обеспечивается специальными способами отбора. В зависимости от способа формирования различают следующие выборки:

1. Выборки, не требующие разделения генеральной совокупности на части (собственно, случайная повторная или бесповторная выборка).

2. Выборки, требующие разбиения генеральной совокупности на части (механическая, типическая или типологическая выборки, когортная, парно-сопряженная выборки).

Собственно, случайная выборка формируется случайным отбором — наудачу. В основе случайного отбора лежит перемешивание. Например: выбор шара в спортлото после перемешивания всех шаров, выбор выигрышных номеров лотереи, случайный выбор карточек больных для исследования и т.п. Иногда используют случайные числа, получаемые из таблиц случайных чисел или с помощью генераторов случайных чисел. Согласно этим числам из заранее пронумерованного массива генеральной совокупности выбираются единицы наблюдения с номерами, соответствующими выпавшим случайным числам.

При составлении случайной выборки после того, как объект выбран, и все необходимые данные о нем зарегистрированы, можно поступать двояко: объект можно вернуть, или не вернуть в генеральную совокупность. В соответствии с этим выборку называют повторной(объект возвращается в генеральную совокупность) или бесповторной (объект не возвращается в генеральную совокупность). Поскольку в большинстве статистических исследований разница между повторной и бесповторной выборками практически отсутствует, то априорно принимается условие, что выборка повторная.

 



Последнее изменение этой страницы: 2016-04-21; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.80.5.103 (0.024 с.)