Теоретические основы выборочного наблюдения 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Теоретические основы выборочного наблюдения



Первым этапом статистического исследования является статистическое наблюдение – регистрация фактов общественной жизни и сбор этих зафиксированных массовых первичных данных. Существуют различные виды статистических наблюдений, которые можно классифицировать, исходя из различных признаков, одним из которых является охват единиц совокупности. По этому признаку все статистические наблюдения делятсятся на сплошные и несплошные, а в свою очередь в составе несплошных наблюдений выделяют выборочные наблюдения наблюдения, проводимые по методу основного массива, анкетные и монографические наблюдения.

При этом наиболее распространенными и дающими достаточно достоверные результаты среди несплошных наблюдений являются выборочные наблюдения.

Выборочным наблюдением называется такой метод сбора первичной информации, при котором характеристика всей совокупности единиц дается на основе регистрации и сбора данных о некоторой части единиц и последующей обработки и анализа этих данных, когда отбор единиц осуществляется в случайном порядке.

Выборочные наблюдения применяются при изучении качества продукции, использования производственного оборудования и рабочего времени, денежных доходов и расходов и валового выпуска домашних хозяйств, продуктивности скота, потерь урожая, индексации цен на товары и услуги и при проведении многих других статистических работ.

Широкое применение выборочных наблюдений объясняется тем, что они требуют меньших затрат трудовых, материальных и финансовых ресурсов. Например, при регистрации цен практически невозможно отследить за динамикой цен на сотни тысяч, а то и миллионы отдельных видов товаров и услуг, поэтому отбирают по каждой товарной группе несколько видов товаров, за которыми ведется контроль изменения цен, а затем полученные данные об изменении уровня цен распространяется на все виды продуктов и услуг по каждой товарной группе и на этой основе исчисляют сводный индекс цен, по значению которого осуществляется или должна осуществляться индексация денежных доходов населения – заработной платы, пенсий, пособий и т.д. и применяются для решения иных задач.

С другой стороны использование выборочных наблюдений связано с тем, что в ряде случаев невозможно применение сплошного контроля, например, при проверке качества продукции, в процессе которого обследуемые образцы уничтожаются (при измерении прочности кирпичей и других изделий).

Следовательно, в этих случаях выборочные наблюдения являются единственным способом получения информации.

Целью выборочных наблюдений являются получение обобщающих показателей, которые, как правило, отражают характеристики всей массы фактов, всех составных элементов изучаемых процессов на основе изучения только некоторой части всех единиц совокупности. Вся совокупность единиц изучаемых объектов называется генеральной совокупностью, а та часть единиц, которая подвергается выборочному изучению – выборочной совокупностью.

При проведении выборочных наблюдений в качестве обобщающих характеристик используются два вида показателей – относительные и средние величины, которыми характеризуются и генеральные совокупности единиц.

Относительны величины применяются для сводной характеристики совокупности по альтернативному признаку в виде доли (удельного веса) единиц, обладающих интересующим признаком. Например, при характеристике качества продукции обобщающим показателем являются доля изделий, не соответствующих стандарту качества, то есть доля брака во всей партии продуктов, при изучении использования оборудования методом фотографии рабочего дня – доля единиц оборудования, не работавших в момент наблюдения и т.д.

Этот показатель может исчисляться не только для выборочной, но и для генеральной совокупности. При этом для генеральной совокупности он называется долей или более точнее долей в генеральной совокупности – ДГС, а для выборочный совокупности – выборочной долей – ВД или частостью. ДГС обозначается обычно символом p, а для ВД - w.

Целью выборочного наблюдения является в данном случае получение правильного представления о доле в генеральной совокупности на основе выборочной доли.

В тех случаях, когда обследуемая совокупность единиц, изучаемый процесс характеризуется количественными признаками при проведении выборочного наблюдения ставится задача определения среднего значения интересующего признака, например, среднего срока эксплуатации, среднего размера изделий, средних потерь при уборке урожая и т.д.

Среднее значение изучаемого признака для всей совокупности единиц называется генеральной средней и обозначается , а для выборочной совокупности – выборочной средней и обозначается .

Целью выборочного наблюдения в этом случае является получение верной характеристики о генеральной средней на основе выборочной средней.

В соответствии с целью выборочных наблюдений – дать правильную оценку параметрам генеральной совокупности на основе полученных обобщающих характеристик в результате обследования выборочной совокупности, что практически на 100% абсолютно точно получить невозможно в связи с тем, что изучаются только часть единиц, задача практически сводится к тому, чтобы обобщающие показатели выборочной совокупности, были как можно ближе к параметрам генеральной совокупности, чтобы отклонения между ними были минимальными.

Возможные отклонения между выборочной долей и долей в генеральной совокупности, а также между генеральной и выборочной средней называются ошибками выборки или ошибками репрезентативности.

Как и ошибки всякого статистического наблюдения ошибки выборочного наблюдения могут быть случайными и тенденциозными (систематическими).

Тенденциозные ошибки возникают в тех случаях, когда не соблюдается принцип случайного отбора, когда преднамеренно включают в выборочную совокупность лучшие или худшие по значению изучаемого признака единицы. Например, для характеристики урожайности отбирают хозяйства с высокими результатами или при изучении продуктивности скота отбирают молочные стада с высоким удоем молока. Получаемые при этом результаты не будут правильно отражать общие характеристики всей совокупности.

Результаты выборочного обследования будут верными, если обеспечивается абсолютная возможность попадания в выборочную совокупность любой единицы генеральной совокупности, то есть соблюдается принцип случайного отбора, независимо от способа организации выборки, когда гарантирована независимость от воли, субъективного желания организатора наблюдения.

Если соблюдается принцип случайного отбора, то ошибки будут случайными, обусловленные тем, что обследуется не вся совокупность единиц, а некоторая их часть. Закономерности размера и изменения случайных ошибок изучает закон больших чисел, который говорит о том, что чем больше численность выборки, тем меньше будет ошибка выборки.

Исходя из теории больших числе следует, что ошибка выборки зависит от численности отобранных для обследования единиц, но кроме того, зависит от колеблемости признаков.

Колеблемость признаков характеризуется средним квадратом отклонений или иначе дисперсией, которая для количественного признака обозначается , а для альтернативного признаками – p (1-p) или pq.

При одинаковой численности выборки ее ошибка будет тем меньше, чем более однородна совокупность, в которой колеблемость признаков будет меньше. Так, уровень заработной платы будет обладать меньшей колеблемостью для рабочих отдельных специальностей, чем для всех рабочих.

Зависимость величины ошибки выборки от ее абсолютной численности и от степени колеблемости изучаемого признака находят выражение в формулах средней ошибки выборки.

В связи с тем, что при выборочном наблюдении дается характеристика количественным признакам единиц совокупности, у которых характеристика колеблемости дается различными показателями дисперсии, существуют два вида формул ошибки выборки.

Если определяется ошибка выборки для совокупности единиц с количественным признаком, то используется показатель колеблемости , а если с альтернативным признаком - p (1-p) или pq.

Для измерения средней ошибки для единиц с количественным признаком, когда перед выборочным наблюдением ставится задача определения их среднего значения, используется следующая формула:

где –средняя ошибка выборки;

– дисперсия варьируемого количественного признака;

n – численность единиц выборочной совокупности.

 

При измерении доли альтернативного признака выборочной совокупности среднюю ошибку выборки определяют по формуле:

где р – доля признака в выборочной совокупности (если, например, доля потерь при уборке урожая равна 0,8%, то р = 0,008);

n- численность единиц выборочной совокупности.

Математическое обоснование этих формулу дает математическая статистика и теория вероятности, при этом доказательства строятся на принципах так называемой повторной выборки, когда общая численность генеральной совокупности остается неизменной. Ту или иную единицу совокупности, попавшую в выборку после измерений значений признака возвращают в генеральную совокупность, и она сохраняет равную возможность со всеми прочими единицами вновь попасть в выборку.

Повторную выборку применяют редко. Обычно отбор единиц организуют по принципу бесповторной выборки, при которой единица, попавшая в выборку в дальнейшем выбывает из генеральной совокупности, ее численность постепенно уменьшается. Поэтому для этого вида отбора в формулы ошибок выборки надо в подкоренное выражение добавить множитель:

где N – первоначальное число единиц генеральной совокупности;

n- количество отобранных единиц.

Соответственно, для бесповторной выборки формулы ошибок выборки имеют вид:

для средней: ;

для доли:

 

Ошибка выборки в большей мере зависит от абсолютной численности отобранных единиц, а доля выборки (процент выборки) оказывает незначительное влияние.

Эти ошибки выборки показывают, что генеральная средняя будет находится в пределах ± µ от выборочной средней:

.

Но это утверждение не является абсолютно достоверным, а лишь с определенной степенью вероятности. Математически доказано, что вероятность составит в этом случае 0,683.

Если требуется повысить степень вероятности утверждения, то надо увеличить величину ошибки. Так, если ошибку удвоить (2 ), то вероятность утверждения достигнет 0,954, если утроить, то – 0,997. Увеличивать ошибку выборки можно не только на целые, но и на любые дробные числа от 0 до 4. Этот коэффициент называется коэффициентом кратности ошибки или коэффициентом доверия и обозначается буквой t. Ошибка выборки с учетом умножения на коэффициент кратности называется предельной ошибкой выборки и обозначается ∆:

.

Существуют разработанные таблицы зависимости вероятности утверждения того, что генеральная средняя не будет больше предельной ошибки, от величины коэффициента кратности ошибки.

Ниже приведена выписка из полных таблиц значений интеграла вероятностей:

Таблица 8.1.

t Вероятность t Вероятность t Вероятность
1,0 0,6827 1,7 0,9109 2,4 0,9836
1,1 0,7287 1,8 0,9281 2,5 0,9876
1,2 0,7699 1,9 0,9426 2,6 0,9907
1,3 0,8064 2,0 0,9545 2,7 0,9931
1,4 0,8385 2,1 0,9643 2,8 0,9949
1,5 0,8664 2,2 0,9722 2,9 0,9963
1,6 0,8904 2,3 0,9786 3,0 0,9973

(Полные таблицы – см. Н.Н. Ряузов. Общая теория статистики. -М:Статистика,1971г.).

 

В формулах ошибок выборки дисперсии и р(1-р) являются показателями колеблемости признаков генеральной совокупности. Исчислить эти величины невозможно, так наблюдение выборочное, поэтому эти показатели заменяются в формулах ошибок выборки на дисперсии выборочных совокупностей. Вместо применяется , а вместо р(1-р) используется

w(1-w).

Возможность таких замен, не вызывающих значительных отклонений ошибок выборки доказана математической статистикой, которая вывела следующую взаимосвязь между генеральной и выборочной дисперсией.

Если n достаточно велико, то отношение будет близко к единице. Так, при n=100 это отношение будет равно 1,01(100:99), если n=500, отношение будет равно 1,002(500:499) и т.д.

Если n небольшое число (при организации малой выборки), то эту поправку надо принимать во внимание.

Учитывая положение математической статистики о том, что ошибки выборки в большей мере зависят от абсолютной численности, а не от доли отобранных единиц по отношению к численности единиц генеральной совокупности, при проведении выборочных наблюдений первой задачей является расчет необходимой численности выборки.

Численность выборки определяется на основе формул средней и предельной ошибок выборки.

При выборочном измерении среднего значения количественного признака средняя и предельная ошибки выборки определяется следующим образом:

; .

 

Исходя из этих формул необходимая численность выборки исчисляется так:

; .

 

При выборочном измерении доли признака средняя и предельная ошибка выборки исчисляют так:

;

Отсюда необходимая численность выборки рассчитывается следующим образом:

;

При расчете необходимой численности выборочной совокупности ошибкой выборки задаются заранее, чтобы она не превышала определенные пределы.

Кроме заранее заданных размеров ошибки выборки для определения численности единиц выборочной совокупности, как видно из формул, необходимы показатели вариации или доля w. Этих данных нет и эту проблему решают так: вместо фактического значения или w в расчет принимают приближенное значение, полученное из предыдущих обследований или на основе каких-либо пробных выборочных наблюдений. При этом исходят из того, что, чем больше величина или чем ближе значение w к 0,5, которое является предельным значением w, тем больше необходимая численность выборки.

Расчет необходимой численности выборки рассмотрим на примерах.

Для этого предварительно на основе пробных выборочных обследований были определены дисперсия, принята определенная численность единиц, среднее значение признака и исчислена средняя ошибка выборки и пределы колебаний среднего значения в генеральной совокупности (см. пример 1).

Пример 1. По схеме повторной выборки произведено выборочное измерение выработки на земляных работах у 144 рабочих. В результате этого обследования средняя выработка была определена в 4,95 м3 на одного рабочего, а средний квадрат отклонения () оказался равным 2,25. Нужно определить точность выборочного наблюдения.

Исчислим среднюю ошибку выборки:

м3.

На основе этой ошибки выборки с вероятностью 0,683 можно утверждать, что средняя выработка у всех рабочих находится в пределах 4,95±0,125м3, то есть от 4,825 до 5,075 м3.

Пример 2. По условию примера 1 требуется определить какова будет численность выборки, чтобы размер ошибки не превышал 0,1м3.

Для определения численности выборки (n) используем формулу:

.

Дисперсию возьмем равной 2,25 м3, которую исчислили в примере 1 (при пробном выборочном обследовании), µ =0,1 м3 (в данном случае ошибка задана условием данного примера).

На основе этих данных определим численность выборки:

рабочих.

Пример 3. По условию примера 1 требуется определить численность выборки, если вдвое увеличить точность выборки, то есть размер ошибки не должен превышать 0,05 м3.

По той же формуле, что и в примере 2 при 2 = 2,25 и =0,05 определим численность выборки:

рабочих.

Отсюда видно, что при увеличении точности выборки в два раза, ее численность увеличилась в 4 раза:

900:225=4.

Пример 4. По данным примера 1 требуется определить численность выборки, если с вероятностью 0,954 (t=2) гарантировать, что размер выборки не будет превышать 0,1 м3.

Численность выборки определим по формуле:

, при этом t=2; 2 =2,25 м3, ∆=0,1м3

Получим:

рабочих.

Пример 5. Проведено выборочное обследование качества изготовленных кирпичей. Взято 1600 проб, из которых в 32 случаях кирпич оказался бракованным. Требуется определить, в каких пределах будет доля брака во всем объеме произведенной продукции.

Для определения этого показателя использует следующую формулу:

По условию задачи: n=1600; w=32:1600=0,02; 1-w=1-0,02=0,98.

Отсюда: или .

Следовательно, доля брака во всей продукции будет (2±0,35) % или от 1,65 до 2,35%.

 

8.2. Виды и методы образования выборочных совокупностей

 

Выборочная совокупность всегда должна быть образована на основе случайного отбора. Существуют различные типы и методы случайного отбора.

В зависимости от того, участвуют ли отобранные единицы в дальнейшей выборке или нет, как было указано ранее, различают повторный и бесповторный отбор.

В зависимости от характера единицы отбора:

-индивидуальный – отбор единиц совокупности;

-групповой – отбор групп единиц;

-комбинированный – сочетание первого и второго вида.

В зависимости от способа производства выборки существует следующие виды отбора:

-собственно случайный;

-механический;

-типический;

-серийный;

-комбинированный.

В зависимости от того, как изменяется единица отбора различают однофазную и многофазную (одноступенчатую и многоступенчатую) выборку. Если выборочное обследование проводится на основе первоначально отобранных единиц, то отбор называется однофазным, если же из первоначально отобранной совокупности произведен повторный отбор части единиц, то выборка называется многофазной.

Собственно случайный отбор – это выборка, при которой вероятность попасть в выборочную совокупность для всех единиц генеральной совокупности абсолютно одинаковая.

Собственно случайный отбор осуществляется при проведении лотерей, жеребьевке, розыгрыше выигрышных банковских вкладов населения по номерам счетов вкладчиков, бинго. Возможность выигрыша в лотерее одинаковая для всех билетов, участвующих в тираже и выпадение выигрышных номеров – дело случая.

Случайная выборка является простой, но дает объективную оценку генеральной совокупности, так как при этом не отдается предпочтение отдельным единицам или их группам.

Для проведения случайной выборки иногда пользуется таблицей случайных чисел, в которой дан набор чисел, полученных с помощью компьютера.

Собственно случайный отбор может быть повторным и бесповторным. Ошибки выборки определяются по формулам, приведенным в предыдущем параграфе.

Надо отметить, что повторный собственно случайный отбор в экономических исследованиях применяется редко.

Бесповторный отбор точнее повторного. При этом необходимая численность бесповторной случайной выборки определяется по формуле:

 

Механическая выборка заключается в том, что генеральную совокупность делят на группы, число которых должна быть равно количеству единиц выборочной совокупности, и затем из каждой группы отбирают первую, пятую, девятую единицу или единицу под любым номером в пределах каждой группы.

Обязательным условием правильного применения механической выборки является выстраивание единиц генеральной совокупности по значению какого-либо нейтрального признака, не имеющего никакого отношения к изучаемому признаку. При этом механический отбор будет всегда бесповторным и ошибка выборки должна определяться следующим образом:

 

 

где 2i – средняя из внутригрупповых дисперсий.

Но в связи с тем, что значения изучаемого признака неизвестны в пределах каждой из групп, то невозможно определить внутригрупповые дисперсии. Поэтому ошибки выборки при механическом отборе определяются по тем же формулам, что и при собственно случайном отборе.

Кроме вышеуказанного обязательного условия систематизирования единиц генеральной совокупности, можно использовать для упорядочения генеральной совокупности единиц по значению изучаемого признака. В этом случае возникает кроме случайной еще и систематическая ошибка, но ее размер будет наименьшим, если в пределах каждой группы брать среднюю единицу.

К примеру, если изучается средняя заработная плата 10000 рабочих на основе выборки в 200 человек, то всех рабочих можно выстроить по первой букве фамилий, либо по табельным номерам и разбить их на 200 групп, при этом в каждую группу попадает по 50 человек (10000:200). Затем из каждой группы выбрать каждого второго, пятого и любого рабочего в пределах 50 чел. и на этой основе исчислить среднюю заработную плату, ошибку выборки и другие показатели.

Типическая выборка применятся в тех случаях, когда генеральная совокупность недостаточно однородна и это влияет на исчисляемые характеристики. При этом способе отбора генеральную совокупность делят на ряд однородных групп по какому-либо типическому признаку, который оказывает влияние на изучаемые показатели. После этого из каждой группы производят отбор единиц по собственно случайному или механическому способу выборки. Этим достигается большая, чем при случайном или механическом отборе репрезентативность, так как в выборочную совокупность попадают представители всех типических групп.

При типическом отборе из каждой группы можно выбрать одинаковое число единиц, а можно пропорционально числу единиц каждой группы генеральной совокупности и, соответственно, будет иметь место типическая непропорциональная или типическая пропорциональная выборка.

Типическая выборка может осуществляться по повторному и бесповторному способам отбора.

При типической выборке, когда из типически однородных групп отбор единиц осуществляется механическим способом этот вид называется типическим отборам с механической выборкой или иначе механическим отбором с предварительным районированием.

Разбивка на типические группы (предварительное районирование) генеральной совокупности дает возможность избежать влияния межгрупповой дисперсии, так как в выборочную совокупность попадают представители всех групп. Поэтому средняя ошибка типической выборки зависят только от средней из внутригрупповых дисперсий , а не от общей дисперсии 2, как это имеет место в случайном выборке.

Средняя ошибка пропорциональной типической выборки определяется по следующим формулам:

при повторной выборке ;

 

при бесповторной выборке

Из правила сложения дисперсий следует, что < , следовательно, ошибка типической выборки меньше ошибки случайной выборки, она точнее случайной выборки.

Это же замечание относится и к типическому отбору с механической выборкой - при одной и той же численности выборочной совокупности при типичной выборке по сравнению с механической выборкой ошибка будет меньше, другими словами, при одной и той же заданной величине ошибки выборки, при типичном отборе численность выборки будет меньше.

Как было указано выше, наряду с индивидуальным отбором единиц существует групповая выборка, когда в выборочную совокупность отбирают целые группы единиц. Этот метод отбора называется серийной или гнездовой выборкой. Внутри отобранных серий производится сплошное наблюдение. Это облегчает организацию и проведение работы, но увеличивает ошибку выборки.

Отдельные группы (серии) по числу единиц в них могут быть одинаковы и неодинаковы.

Размер ошибки при серийной выборке зависит от межгрупповой дисперсии, которая исчисляется по формуле:

,

 

где – средняя внутригрупповая;

– общая средняя для всей совокупности;

r- число отобранных серий (групп).

Общее число серий в генеральной совокупности обзначается R.

Средняя ошибка выборки при отборе равновеликими группами определяется по следующим формулам:

при повторном отборе: ;

при бесповторном отборе

 

 

Приведем пример. Выборочное наблюдение урожайности зерновых культур по области проводилось при помощи отбора районов. По каждому району была определена средняя урожайность, которая оказалась следующей: в 1 районе -14 ц с га, во 2- 15 ц с га, в 3- 14,5 ц с га, в 4-15,5 ц с га, в 5- 16 ц с га. В области всего 25 районов. Требуется определить с вероятностью 0,997 урожайность зерновых во всей области.

Для этого сначала определим общую среднюю по следующим районам:

ц/га, затем межгрупповую дисперсию:

Средняя ошибка бесповторного серийного отбора будет равна:

ц с га,

а предельная ошибка:

ц с га.

 

Отсюда следует, что средняя урожайность в области будет находиться в пределах от 14,1 до 15,9 ц с га.

Комбинированная выборка предполагает использование нескольких способов отбора. Можно комбинировать серийную и случайную выборку. Для этого генеральную совокупность разбивают на группы, затем производят случайный отбор единиц в группах.

Такая комбинированная выборка может быть как повторной, так и бесповторной. Квадрат средней ошибки комбинированного отбора определяется по формулам:

при повторном отборе ;

 

при бесповторном отборе ,

где n –число единиц, попавших в выборку серий.

Комбинированная выборка может производиться при использовании и других видов и способов отбора.

Средняя ошибка выборки при различных комбинациях исчисляется по разному в зависимости от ступенчатости выборки.

Отбор единиц по какому-либо одному способу выборки, называется одноступенчатым, если отбор производится в несколько этапов, то многоступенчатым. При многоступенчатой выборке вначале из генеральной совокупности отбирают укрупненные группы единиц, затем из них группы меньшие по объему и т.д., пока не будет осуществлен отбор серий или отдельных единиц, которые будут подвергнуты обследованию.

При многоступенчатом отборе средняя ошибка выборки определяется следующим образом:

,

где µ1, µ2, µ3,…- средние ошибки выборки на отдельных ступенях;

n1,n2,n3, …- численности выборки на отдельных ступенях отбора.

Наряду с многоступенчатой выборкой может применяться выборка, называемая многофазной. При этом способе отбора выборочные совокупности образуются так, что одни сведения собираются от всех единицу отбора, а затем из них выбирают часть единиц, которые обследуются по более широкой программе. Расчет ошибки многофазной выборки производится для каждой фазы отдельно.

Иногда комбинирую сплошное наблюдение с выборочным. Примером могут служить всесоюзные переписи населения 1979 и 1989 гг., когда наряду с переписью всего населения по определенной программе дополнительно у 25% населения были получены сведения по более широкому перечню вопросов.

Особым видом выборочных обследований является моментное наблюдение, суть которого заключается в том, что на определенные, обычно, равноудаленные друг от друга моменты времени фиксируется наличие или отсутствие отдельных элементов изучаемого признака. Моментное наблюдение применяется для изучения использования рабочего времени или времени работы оборудования. При этом в моменты наблюдения фиксируется работает ли рабочий или станок или находился в простое (с указанием причин). При моментном наблюдении контроль осуществляется за всеми рабочими или станками и в этом смысле оно является сплошным, но в связи с тем, что охватывается не все рабочее время, не вся продолжительность смены, а лишь определенные моменты времени, данный вид получения информации относиться к выборочному наблюдению.

При моментном наблюдении контролируется альтернативный признак (работа или простой), соответственно, оценка ошибки выборки производится по формулам средней и предельной ошибки выборочной доли:

;

При этом в качестве численности выборки принимается число записей моментного обследования.

Предположим в цехе работает 20 станков, в течении смены (8 часов) через каждые полчаса проводились записи о состоянии станков.

Всего было сделано 320 записей (20х16), при этом в 288 случаях станки работали, а в 32 случаях находились в простое. Тогда доля работавших станков будет равна 0,9 (288:320) и ошибка выборки при t=2 будет равна:

или 3,3%.

Отсюда можно с уверенностью в 95,4% заявлять, что доля работавшего оборудования в составе всех установленных станков составила от 86,7 до 93,3%.

В отдельных случаях проводится так называемая малая выборка, когда численность обследуемых единиц не превышает 20.

Хотя общее правило выборочного наблюдения, состоящего в том, что с увеличением численности выборки повышается точность результатов, нарушается, иногда прибегают к этому виду выборки, что уменьшает трудоемкость работы и позволяет уменьшать потери в тех случаях, когда обследуемые образцы уничтожаются, например, при испытании на разрыв пряжи, на прочность кирпичей и т.д. В математической статистике доказано, что и при малой выборки можно характеристики данной выборочной совокупности можно распространять на генеральную совокупность. Но расчет средней и предельной ошибки выборки здесь имеет свои особенности. Выше указывалось, что между генеральной и выборочной дисперсией существует взаимосвязь через отношения n:(n-1), которое будет близким к единице при большом объеме выборки и выборочная дисперсия дает достоверную характеристику генеральной дисперсии. Но когда выборочная совокупность небольшая, этот коэффициент надо принимать во внимание. В связи с этим средняя ошибка малой выборки () исчисляется по формуле:

 

где 2мв - дисперсия в малой выборке, которая в свою очередь исчисляется так:

Предельная ошибка определяется как обычно:

.

Но в этой формуле коэффициент доверия t иначе связан с вероятной оценкой, чем при нормальной выборке. Английский ученый Стьюдент доказал, что в случаях малой выборки действует особый закон распределения величины t. Согласно распределению Стьюдента вероятная оценка того, что предельная ошибка не превысит t-кратную среднюю ошибку в малых выборках, зависит не только от значения t, но и от численности единиц.

Приведем выдержку из таблицы распределения Стьюдента (полную таблицу см. Н.Н. Ряузов. Общая теория статистики -М.: Статистика, 1971):

 

Таблица 8.2.

t n              
1,0 0,626 0,644 0,656 0,662 0,666 0,668 0,670
1,5 0,792 0,816 0,832 0,838 0,846 0,848 0,850
2,0 0,884 0,908 0,924 0,924 0,936 0,938 0,940
2,5 0,933 0,953 0,966 0,966 0,975 0,977 0,978
3,0 0,960 0,976 0,984 0,984 0,991 0,992 0,992

 

Как видно из данных таблицы 8.2, при увеличении n это распределение стремится к нормальному и при n=20 очень близко к нему, так при t=1 в нормальном распределении вероятность равна 0,683, здесь 0,670, при t =20 вероятность соответственно 0,954 и 940, при t=3 они равны 0,997 и 0,992.

 

 



Поделиться:


Последнее изменение этой страницы: 2017-02-19; просмотров: 1241; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.216.239.46 (0.136 с.)