Выборочное наблюдение. Его преимущества и недостатки 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Выборочное наблюдение. Его преимущества и недостатки



Выборочное наблюдение– метод получения данных, при котором информация собирается не со всех элементов объекта исследования (генеральной совокупности), а только с его относительно малой части. Что это дает? Какие здесь плюсы и минусы? Для ответов на эти и другие вопросы создана отдельная рубрика о выборочном наблюдении и проверке статистических гипотез. Данная статья является вводной, где читатель в основных чертах познакомится с выборочным наблюдением, его преимуществами и недостатками.

Вкратце суть метода такова. Из объекта анализа случайным образом отбираются некоторые элементы (делают выборку), по которым производят необходимые измерения (обмеры, опросы, тестирования и проч.). Полученные таким образом данные анализируют и результаты затем распространяют на всю генеральную совокупность. Например, соцопрос населения – типичный анализ выборки. Опросили 1000 человек и вот уже готова сенсационная новость о падении или взлете рейтинга какого-нибудь политика. Анализ выборок проводят и в сугубо приземленных практических целях. Например, случайная выборка из партии изделий позволяет судить о качестве всей партии (доля брака всего 30% - отличное качество!). Пробы воды дают характеристику всему водоему (типа «купаться не рекомендуется»). Сфера применения выборок очень широка и на то есть свои причины.

Главная причина – это доступность, что выражается в относительно небольших затратах на проведение (по сравнению со сплошным наблюдением). Нет необходимости задействовать большое количество людей. На свод и обработку данных также не требуется много времени (опять же относительно сплошного наблюдения). Такой расклад делает выборочное наблюдение весьма привлекательным методом для многих исследователей (социологов, маркетологов, экономистов, контролеров качества, ньюсмейкеров и т.д и т.п.).

Второй причиной широкого использования выборок я бы назвал тот факт, что выборка часто являться единственным способом сбора данных, т.к. сплошное наблюдение в некоторых ситуациях вообще недоступно. Например, невозможно проверить эффективность лекарства на всех пациентах, которые будут его принимать в будущем. Невозможно также подсчитать количество животных или растений в лесу путем их тотального пересчета или количество проросших семян на поле в несколько гектар. Поэтому к выборочному методу прибегают еще и вынуждено, а не только из-за экономии. Есть и другие причины, но это были основные. Я считаю.

Теперь обозначим главные недостатки выборочного метода. Недостаток, по сути один. Он заключается в том, что показатели, рассчитанные по выборке, всегда ошибочны. Вот так, немного и немало – они всегда неверны относительно истинного (неявного) показателя из генеральной совокупности данных. Чтобы мы не рассчитали по выборке, это всегда неправда, точнее сказать – не совсем правда. Если показатель, рассчитанный по генеральной совокупности, отражает истинное состояние дел (при точных замерах, разумеется), то выборка всегда дает погрешность. Такова цена за все те возможности, которые она дает.

Почему же выборка дает ошибку? Потому что структура данных выборки всегда хоть немного, но отличается от структуры генеральной совокупности. Отсюда все значения показателей, рассчитанных по выборке, будут хоть немного, но отличаться от аналогичных показателей, рассчитанных по генеральной совокупности. В этом легко убедиться, если несколько раз подбросить монетку и подсчитать количество выпавших орлов и решек. Маловероятно, что их соотношение будет 50/50. Хотя в генеральной совокупности (бесконечно большого количества подбрасываний) соотношение именно 50/50.

Почему тогда используют выборку, если она всегда дает ошибочные результаты? Да потому что лучше иметь неточные данные, чем не иметь вообще никаких. При этом правильное проведение выборочного наблюдения может дать довольно таки приемлемые по точности результаты. Допустим, мы не знаем истинное соотношение выпадения орлов и решек (настоящей вероятности). Но, сделав 100 подбрасываний и получив, к примеру, соотношение 55/45 у нас уже будет неплохой ориентир. То есть 55/45 гораздо ближе к 50/50, чем, скажем, 10/90, если сделать такое предположение наугад. Далее эти результаты можно уточнить или сделать определенные допуски на разброс. Для анализа выборочных данных разработана специальная технология, которая выдвигает ряд требований и правил для того, чтобы результаты были насколько это возможно точными и трактовались насколько возможно корректно.

Самое первое требование относится к исходным данным. Они должны быть репрезентативными, то есть содержать в себе всю информацию о качестве генеральной совокупности. Внутренняя структура выборки должна соответствовать структуре данных в генеральной совокупности. Образно выражаясь, выборка должна быть максимально точной уменьшенной копией оригинального объекта исследования. Имея в наличии такую уменьшенную модель, можно проводить различные опыты и результаты распространять на оригинал. Как, например, перед строительством корабля вначале делают уменьшенную копию и проверяют в специальном бассейне с волнами и штормами. Если модель при испытаниях не переворачивается, тогда есть надежда, что и корабль не потонет.

Теория вероятностей утверждает, что для сохранения исходной структуры данных отбор следует производить в случайном порядке из всей генеральной совокупности. Ключевое слово – в случайном порядке. Это значит, что любой элемент может быть отобран с одинаковой вероятностью.

Далее по выборочным данным рассчитывают различные показатели, которые на самом деле называются оценками. Исследователь пытается оценить значение показателя по выборочным данным и получает что-то близкое к истинному значению, но всегда с некоторым отклонением (что-то вроде соотношения 55/45 вместо реального 50/50 при подбрасывании монеты). Совпадение может произойти исключительно по чистой случайности. Это первое важное понятие, которое нужно зазубрить на всю жизнь. Оценка показателя – это всего лишь оценка и при повторном проведении эксперимента (выборки) обязательно будет другой.

И быть беде, если бы ошибка выборки была абсолютно непредсказуема и не имела пределов. Результаты выборочных измерений были бы равносильны методу «пальцем в небо». К всеобщему счастью это не так. Оценки, рассчитанные по репрезентативной выборке, обладают рядом полезных свойств, которые с той или иной вероятностью определяют границы их возможных изменений, то есть интервал, в пределах которого находится истинный показатель по генеральной совокупности. Хорошее понимание таких свойств позволяет исследователю делать достаточно правдивые заключения обо всей генеральной совокупности. Естественно, делая поправку на погрешность.

Оценка показателя не всегда рассчитывается по той же формуле, что и сам показатель. Например, средняя арифметическая, будучи оценкой математического ожидания, имеет по сути ту же формулу – сумма произведений отдельных значений на их вероятности (частоты). Это хорошо видно по формуле средней арифметической взвешенной, если все слагаемые в числителе разделить на знаменатель (сумму весов). А вот формула дисперсии по выборке немного отличается от формулы дисперсии по генеральной совокупности. Если этот момент проигнорировать, то дисперсия по малой выборке получится слегка заниженной. В общем формулы показателей и их оценок лучше не путать. Хотя при выборке размером более 50 наблюдений, разница практически исчезает.

 

Индекс объема

Основным видом несплошного наблюдения является выборочное наблюдение. Выборочные обследования массовых явлений проводятся во всех странах и областях жизни - в экономике, политике, бизнесе, науке, технике и т.д. Статистическая выборка - это несплошное наблюдение, которое предполагает формирование и исследование выборочной совокупности как уменьшенной копии генеральной совокупности. Генеральная совокупность - это полная (целостная) совокупность единиц, из которых выбирают единицы для исследования. Выборочная совокупность – это совокупность отобранных для исследования единиц генеральной совокупности. Выборочное наблюдение имеет следующие основные преимущества перед сплошным наблюдением: 1) экономия времени, а также материальных, технических и финансовых ресурсов на проведение наблюдения; 2) возможность более глубокого исследования небольшого количества единиц выборочной совокупности за счет экономии времени и ресурсов на обследование остальных единиц генеральной совокупности. По схеме отбора единиц совокупности различают следующие основные виды статистических выборок: простая повторная и бесповторная, механическая, типическая (районированная), серийная (гнездовая), многоступенчатая, многофазная, комбинированная. Простая повторная выборка - это выборка, в которой случайно отобранная и исследованная единица возвращается в генеральную совокупность для повторного обследования. Простая бесповторная выборка - это выборка, в которой каждая случайно отобранная единица не возвращается в генеральную совокупность. Механическая выборка - это выборка, которая всю генеральную совокупность механически разделяет на равные части в соответствии с выбранными признаками и в каждой такой части обследуется лишь одна единица. Например, исследуется определенное число единиц совокупности через определенный интервал в 5%, 10% и т.д. Типическая выборка - это выборка, в соответствии с которой всю генеральную совокупность делят на однородные группы (типы, районы) и из каждой такой группы обследуют определенное число единиц совокупности. Серийная выборка предполагает исследование не отдельных единиц совокупности, а их серий, гнезд. Многоступенчатая выборка – это выборка, в которой из генеральной совокупности на первой ступени выбираются увеличенные группы, на второй - более мелкие, и так, пока не будут отобраны все единицы, подлежащие наблюдению. Многофазная выборка предполагает последовательное расширение программы обследования отобранных единиц в каждой новой фазе (стадии). При этом на каждой новой фазе формируют выборочные совокупности уменьшенного объема из единиц, которые уже были обследованы на предыдущей фазе. Выборочные характеристики каждой фазы используют как дополнительную информацию на следующих фазах. Все это повышает точность многофазной выборки. Комбинированная выборка объединяет различные виды выборок. Для обеспечения достоверности статистической выборки рассчитывают следующие основные ее характеристики: 1) предельную ошибку полученных результатов; 2) границы доверительного интервала выборочной оценки; 3) минимально достаточный объем выборки. Доказано, что предельная ошибка составляет: 1) для повторной выборки:

 

 

2) для бесповторной выборки:

где N – количество единиц всей генеральной совокупности. Из приведенных формул видно, что бесповторная выборка обеспечивает более точные результаты, чем повторная, поскольку множитель (1-n/N) всегда меньше единицы, то есть он уменьшает величину ошибки бесповторной выборки. Поэтому на практике используют преимущественно бесповторную выборку. Величина предельной ошибки выборки зависит от таких факторов: вариации признака в генеральной

обратно пропорциональна. Поэтому, чтобы уменьшить ошибку выборки, например, в 2 раза, объем выборки должен возрасти в 4 раза..

 

 



Поделиться:


Последнее изменение этой страницы: 2016-04-26; просмотров: 2239; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.135.198.49 (0.012 с.)