Выборочное наблюдение. Ошибки выборки. Численность выборки. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Выборочное наблюдение. Ошибки выборки. Численность выборки.



Выборочное наблюдение применяется, когда применение сплошного наблюдения физически невозможно из-за большого массива данных или экономически нецелесообразно. Физическая невозможность имеет место, например, при изучении пассажиропотоков, рыночных цен, семейных бюджетов. Экономическая нецелесообразность имеет место при оценке качества товаров, связанной с их уничтожением, например, дегустация, испытание кирпичей на прочность и т.п.

Статистические единицы, отобранные для наблюдения, составляют выборочную совокупность или выборку, а весь их массив - генеральную совокупность (ГС). При этом число единиц в выборке обозначают n, а во всей ГС - N. Отношение n/N называется относительный размер или доля выборки.

Качество результатов выборочного наблюдения зависит от репрезентативности выборки, то есть от того, насколько она представительна в ГС. Для обеспечения репрезентативности выборки необходимо соблюдать принцип случайности отбора единиц, который предполагает, что на включение единицы ГС в выборку не может повлиять какой-либо иной фактор кроме случая.

Существует 4 способа случайного отбора в выборку:

1. Собственно случайный отбор или «метод лото», когда статистическим величинам присваиваются порядковые номера, заносимые на определенные предметы (например, бочонки), которые затем перемешиваются в некоторой емкости (например, в мешке) и выбираются наугад. На практике этот способ осуществляют с помощью генератора случайных чисел или математических таблиц случайных чисел.

2. Механический отбор, согласно которому отбирается каждая (N/n)-я величина генеральной совокупности. Например, если она содержит 100 000 величин, а требуется выбрать 1 000, то в выборку попадет каждая 100 000 / 1000 = 100-я величина. Причем, если они не ранжированы, то первая выбирается наугад из первой сотни, а номера других будут на сотню больше. Например, если первой оказалась единица № 19, то следующей должна быть № 119, затем № 219, затем № 319 и т.д. Если единицы генеральной совокупности ранжированы, то первой выбирается № 50, затем № 150, затем № 250 и так далее.

3. Отбор величин из неоднородного массива данных ведется стратифицированным (расслоенным) способом, когда генеральная совокупность предварительно разбивается на однородные группы, к которым применяется случайный или механический отбор.

4. Особый способ составления выборки представляет собой серийный отбор, при котором случайно или механически выбирают не отдельные величины, а их серии (последовательности с какого-то номера по какой-то подряд), внутри которых ведут сплошное наблюдение.

Качество выборочных наблюдений зависит и от типа выборки: повторная или бесповторная.
При повторном отборе попавшие в выборку статистические величины или их серии после использования возвращаются в генеральную совокупность, имея шанс попасть в новую выборку. При этом у всех величин генеральной совокупности одинаковая вероятность включения в выборку.
Бесповторный отбор означает, что попавшие в выборку статистические величины или их серии после использования не возвращаются в генеральную совокупность, а потому для остальных величин последней повышается вероятность попадания в следующую выборку.

Бесповторный отбор дает более точные результаты, поэтому применяется чаще. Но есть ситуации, когда его применить нельзя (изучение пассажиропотоков, потребительского спроса и т.п.) и тогда ведется повторный отбор.

Ошибки выборки

Выборочную совокупность можно сформировать по количественному признаку статистических величин, а также по альтернативному или атрибутивному. В первом случае обобщающей характеристикой выборки служит выборочная средняя величина, обозначаемая , а во втором — выборочная доля величин, обозначаемая w. В генеральной совокупности соответственно: генеральная средняя и генеральная доля р.

Разности и Wр называются ошибкой выборки, которая делится на ошибку регистрации и ошибку репрезентативности. Первая часть ошибки выборки возникает из-за неправильных или неточных сведений по причинам непонимания существа вопроса, невнимательности регистратора при заполнении анкет, формуляров и т.п. Она достаточно легко обнаруживается и устраняется. Вторая часть ошибки возникает из-за постоянного или спонтанного несоблюдения принципа случайности отбора. Ее трудно обнаружить и устранить, она гораздо больше первой и потому ей уделяется основное внимание.

Величина ошибки выборки может быть разной для разных выборок из одной генеральной совокупности, поэтому в статистике определяется средняя ошибка повторной и бесповторной выборки по формулам:

- повторная;

- бесповторная;

где Дв — выборочная дисперсия.

Например, на заводе с численностью работников 1000 чел. проведена 5%-ая случайная бесповторная выборка с целью определения среднего стажа работников. Результаты выборочного наблюдения приведены в первых двух столбцах следующей таблицы:

X, лет (стаж работы) f, чел. (число работников в выборке) X и X и f
до 1   0,5 3,5 38,987
1-2   1,5 12,0 14,797
2-3   2,5 25,0 1,296
3-4   3,5 45,5 5,325
4-5   4,5 40,5 24,206
более 5   5,5 16,5 20,909
Итого     143,0 105,520

В 3-м столбце определены середины интервалов X (как полусумма нижней и верхней границ интервала), а в 4-м столбце - произведения XИf для нахождения выборочной средней по формуле средней арифметической взвешенной:

= 143,0/50 = 2,86 (года).

Рассчитаем выборочную дисперсию взвешенную:
= 105,520/50 = 2,110.

Теперь найдем среднюю ошибку бесповторной выборки:
= 0,200 (лет).

Из формул средних ошибок выборки видно, что ошибка меньше при бесповторной выборке, и, как доказано в теории вероятностей, она возникает с вероятностью 0,683 (то есть если провести 1000 выборок из одной генеральной совокупности, то в 683 из них ошибка не превзойдет средней ошибки выборки). Такая вероятность (0,683) является невысокой, поэтому она мало пригодна для практических расчетов, где нужна более высокая вероятность. Чтобы определить ошибку выборки с более высокой, чем 0,683 вероятностью, рассчитывают предельную ошибку выборки:

где t – коэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки.

Значения коэффициента доверия t рассчитаны для разных вероятностей и имеются в специальных таблицах (интеграл Лапласа), из которых в статистике широко применяются следующие сочетания:

Вероятность 0,683 0,866 0,950 0,954 0,988 0,990 0,997 0,999
t   1,5 1,96   2,5 2,58   3,5

Задавшись конкретным уровнем вероятности, выбирают из таблицы соответствующую ей величину t и определяют предельную ошибку выборки по формуле.
При этом чаще всего применяют = 0,95 и t = 1,96, то есть считают, что с вероятностью 95% предельная ошибка выборки в 1,96 раза больше средней. Такая вероятность (0,95) считается стандартной и применяется по умолчанию в расчетах.

В нашем примере про средний стаж работников, определим предельную ошибку выборки при стандартной 95%-ой вероятности (из таблицы берем t = 1,96 для 95%-ой вероятности): = 1,96*0,200 = 0,392 (года).

После расчета предельной ошибки находят доверительный интервал обобщающей характеристики генеральной совокупности. Такой интервал для генеральной средней величины имеет вид

а для генеральной доли аналогично:

.
Следовательно, при выборочном наблюдении определяется не одно, точное значение обобщающей характеристики генеральной совокупности, а лишь ее доверительный интервал с заданным уровнем вероятности. И это серьезный недостаток выборочного метода статистики.

В нашем примере про средний стаж работников, определим доверительный интервал генеральной средней - среднего стажа работников:
2,86 - 0,392 2,86 + 0,392 или 2,468 лет 3,252 лет.
То есть средний стаж работников на всем заводе лежит в интервале от 2,468 года до 3,252 года.

5. Классификации и группировки, их место в статистике. Сводка статистических данных.

Массовые явления весьма разнообразны, сложны и, как правило, проявляются в разных формах. Совокупности, отражающие их, обладают определенной динамичностью: в их состав вступают новые единицы, другие выбывают, некоторые переходят из одной совокупности в другую.
Выделение качественно однородных совокупностей требует в статическом исследовании учета роли составляющих их единиц в данном конкретном массовом процессе. Поэтому появляется необходимость классификации самих объектов, а часто дальнейшего расчленения единиц внутри совокупности. Необходимо различать понятия «классификация» и «группировка».
Под классификацией в статистике следует понимать устойчивое общепринятое разграничение объектов на основании их сходства и различия по группам. Например, классификация промышленных предприятий по отраслям промышленности, классификация основных фондов по видам, классификация работников по категориям, профессиям и специальностям, по уровню квалификации.
В отличие от этого группировка может быть произведена только для целей данного исследования.
Группировкой в статистике называется разделение единиц изучаемого массового явления по существенным признакам для того, чтобы выделить качественно однородные части единиц совокупности (подмножества или группы единиц совокупности) и охарактеризовать совокупности или взаимосвязи в изменении варьирующих признаков.
Значение группировки при обработке статистических данных можно показать на примере статистики населения. Численность населения приводится в целом по стране, в разрезе областей, районов, городов, поселков городского типа, сельских населенных пунктов. Эти цифры очень важны. Однако, используя группировки, можно изучить закономерности изменения культурного уровня населения, изменение состава населения по роду занятий и профессиям и т.д.
Метод группировки является одним из важнейших методов, применяемых статистикой при изучении массовых явлений.
Чтобы изучить то или иное массовое явление, прежде всего необходимо найти в нем качественно однородные группы единиц, охарактеризовать их статистическими показателями, сравнить между собой. Только тогда можно обнаружить все особенности и характерные черты изучаемого явления. Без группировки нельзя правильно и всесторонне изучить, глубоко проанализировать практически ни одно конкретное массовое явление.
Решение крупнейших задач социально-экономического анализа – характеристика типов, вскрытие их взаимосвязей, установление причинно-следственных зависимостей между отдельными факторами и результатами развития процесса или явления – возможно только на основе использования метода группировки.
Таким образом, группировки представляют собой исходный и необходимый этап обработки материалов статистического наблюдения. От качества группировки во многом зависит глубина последующего анализа статистического материала, его ценность.
При помощи группировки в статистике решают различные конкретные задачи, которые можно в конечном счете свести к основным:
1) разделение всей совокупности на качественно однородные типы или группы ее единиц;
2) характеристика структуры изучаемого явления;
3) характеристика взаимосвязей между варьирующими признаками.

Статистическая сводка является следующим после статистического наблюдения этапом статистической работы. Её задача заключается в том, чтобы привести собранную информацию и материалы в определенный порядок, систематизировать и на этой основе дать сводную характеристику всей изучаемой совокупности.

Статистическая сводка - комплекс последовательных операций по первичной обработке данных с целью выявления типичных черт и закономерностей, присущих изучаемому явлению. Это научно-организованная обработка материаловнаблюдения, включающая подсчет групповых и общих итогов, систематизацию, группировку данных и составлениетаблиц.

Виды сводки

Различают простую и сложную сводку:

§ При простой сводке производится подсчет общих итогов по изучаемой совокупности.

§ При сложной сводке производится группировка единиц наблюдения, подсчет итогов по каждой группе и по всей совокупности, и представление результатов группировки в виде статистических таблиц.

Сводка называется децентрализованной если единое руководство работой осуществляется из центра, а непосредственная работа проводится на местах (обычно используется при обработке статистической отчетности).
Если же сбор и обработка данных проводится в одном месте, то сводка называется централизованной. Централизованная сводка обычно используется для обработки материалов единовременных статистических обследований.

Проведению статистической сводки и группировки предшествует разработка программы статистического наблюдения, состоящая из нескольких этапов: выбор группировочного признака, разработка системы статистических показателей.

Статистическая сводка должна проводиться по определенной программе и плану.

Сводка состоит из следующих этапов:

§ Выбор группировочного признака;

§ Определение порядка формирования групп;

§ Разработка системы статистических показателей для характеристики отдельных групп и совокупности в целом;

§ Разработка макетов статистических таблиц для представления результатов сводки.

6. Виды группировочных признаков. Типы группировок. Техника группировок.

Выбор группировочного признака зависит от цели данной группировки и предварительного экономического анализа явления.

В зависимости от степени сложности массового явления и задач анализа - группировки могут производится по одному или нескольким признакам:

§ Если производится группировка только по одному признаку, то она называется простой.

§ Если по двум и более признакам, то такая группировка называется сложной или комбинационной.

В зависимости от решаемых задач различают типологические, структурные и аналитические группировки:

§ Типологическая группировка — представляет собой разделение исследуемой совокупности на однородные группы. (группировка предприятий по формам собственности)

§ Структурная группировка — группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-то варьирующему признаку. (группировка населения по уровню дохода). Анализ статистических данных структурных группировок, взятых за ряд периодов показывает изменение структуры изучаемых явлений, то есть структурные сдвиги.

§ Аналитическая (факторная) группировка — позволяет выявить взаимосвязи между изучаемыми явлениями и их признаками. (группировка банков по сумме уставного капитала, величине активов и балансовой прибыли)

В процессе проведения экономического анализа, как правило, применяются два основных вида группировок: структурные и аналитические.

Структурные группировки используются с целью исследования состава и структуры совокупности данных, а также с целью изучения тех изменений в этой совокупности, которые имеют место в соответствии с выбранным изменяющимся признаком.

Аналитические же группировки используются для исследования взаимных связей, существующих между показателями, характеризующими рассматриваемую совокупность данных. В этих условиях один из показателей является обобщающим, результативным, а другие показатели рассматриваются как факторы, влияющие на обобщающий показатель.



Поделиться:


Последнее изменение этой страницы: 2016-08-12; просмотров: 295; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.136.97.64 (0.022 с.)