Оценка генеральной средней повторной выборки 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Оценка генеральной средней повторной выборки



Пусть распределение признака Х в генеральной совокупности характеризуется таблицей 3. Для оценки неизвестной генеральной средней Х производится повторная выборка объема n. При этом каждый отобранный объект вновь возвращается в генеральную совокупность и, следовательно, состав ее восстанавливается. Поэтому результат отбора любого объекта в выборку не будет влиять на результаты следующих отборов, то есть справедлива схема независимых повторяющихся испытаний.

Пусть Xi - случайная величина, значение которой совпадает со значением интересующего нас признака при i -ом наблюдении (i = 1,2... n). Величины Хi можно рассматривать как n независимых и одинаково распределенных случайных величин с параметрами

,

Если все Xi различны, то для определения генеральной средней используется в качестве оценки средняя арифметическая наблюдавшихся значений :

,

называемая выборочной средней.

Если среди значений есть повторяющиеся значения с час­тотами ni, причем , то

. (7.1)

Выборочная средняя является статистическим аналогом математи-ческого ожидания случайной величины в теории вероятностей.

1. Так как величины Хi удовлетворяют условиям теоремы Чебышëва (они независимы, их дисперсии ограничены одной и той же постоянной ), то для выборки достаточно большого объема

то есть оценка является состоятельной. Поэтому для различных выборок достаточно большого объема из одной и той же генеральной совокупности выборочные средние будут практически совпадать между собой. В этом проявляется, так называемое, свойство устойчивости выборочных средних.

2. Выборочная средняя является несмещенной оценкой , так как

Дисперсия равна

.

Следовательно, с увеличением числа наблюдений n , то есть разброс значений относительно уменьшается.

3. Можно показать также, что является эффективной оценкой, и при увеличении объема выборки закон распределения величины , как суммы одинаково распределенных независимых случайных величин, приближается к нормальному закону распределения с параметрами

, . (7.2)

Поэтому

, (7.3)

где - функция Лапласа.

Оценка генеральной средней бесповторной выборки

Пусть, как и выше, – случайная величина, значение которой совпадает со значением интересующего нас признака при отборе i - го элемента.

Так как выбор каждого отдельного элемента по схеме бесповторной выборки будет влиять на исход последующих выборов, то - зависимые случайные величины. Можно показать, что распределены по одному и тому же закону с параметрами

Выборочной средней бесповторной выборки называется средняя арифметическая значений

Оценка - несмещенная оценка генеральной средней так как

Можно показать, что дисперсия выборочной средней равна

.

Так как величины зависимые, то условия применимости теоремы Чебышëва к последовательности случайных величин не соблюдаются. Применяя поэтому к выборочной средней неравенство Чебышëва, можно записать

следовательно то есть - состоятельная оценка

Оценка является также эффективной оценкой генеральной средней. С увеличением объема выборки закон распределения приближается к нормальному. Поэтому где

Так как объем генеральной совокупности N, как правило, весьма большой, то

(7.4)

Замечание. Сопоставляя формулы (7.2) и (7.4) можно заключить, что средние квадратичные отклонения выборочной средней бесповторной выборки всегда меньше аналогичной характеристики повторной выборки того же объема. Следовательно, бесповторная выборка точнее повторной выборки того же объема. Но различие между ними существенно лишь, если объем выборки велик по сравнению с объемом генеральной совокупности N. В противном случае точечные оценки параметров распределения для повторной и бесповторной выборок практически совпадают.

Определение генеральной дисперсии

Повторная выборка

Если в выражениях для дисперсии случайной величины Х

заменить математическое ожидание его аналогом в статистике - выборочной средней , то получим статистический аналог дисперсии:

(7.5)

Величина называется выборочной дисперсией.

Если значения признака повторяющиеся с частотами соответственно причем , то выборочная дисперсия вычисляется по формуле

или

где - средняя квадратов значений признака.

Оценка является состоятельной. Действительно, первый член в правой части формулы (7.5) – среднее арифметическое n значений и, следовательно, сходится по вероятности к , поэтому

.

Можно показать, что

Следовательно, - смещенная оценка параметра . Ее использование приводит к систематической ошибке в определении генеральной дисперсии, давая заниженное значение .

Умножая D *(X) на поправочный множитель , получим так называемую, исправленную дисперсию

(7.6)

или для случая, когда имеются повторяющиеся значения признака

Очевидно, исправленная дисперсия является несмещенной оценкой дисперсии в генеральной совокупности. На практике ею пользуются, если

n < 30. При бóльших n, естественно, обе оценки (7.5) и (7.6) отличаются друг от друга очень мало.

Оценка в общем случае не является эффективной. Однако для наиболее распространенного на практике нормального закона она оказывается асимптотически эффективной (то есть при больших n отношение ее дисперсии к минимально возможной дисперсии неограниченно приближается к единице).

Бесповторная выборка

Как и для повторной выборки, можно показать, что величина

является смещенной оценкой генеральной дисперсии при бесповторной выборке:

Несмещенной оценкой генеральной дисперсии при этом будет исправленная дисперсия

.

Замечание. Дисперсии оценок генеральных средних зависят от (так как выражается через или ). Но являются неизвестными параметрами, иначе бы отпала необходимость в применении выборочного метода. Чтобы преодолеть это противоречие на практике, в формулах для дисперсий величин генеральную дисперсию заменяют выборочной (или исправленной) дисперсией.

Рассмотрим примеры определения точечных оценок.

Пример. При обработке наружного диаметра 15 карданных валов были получены следующие размеры в мм (см. таблицу 6). Определить несмещенные оценки математического ожидания и среднего квадратического отклонения диаметров, полагая, что обработанные диаметры имеют нормальное распределение.

Результаты вычислений представлены в таблице 6.

Таблица 6

  42,22 0,047 0,0022
  41,87 0,397 0,1576
  42,56 0,293 0,0858
  42,03 0,237 0,0562
  42,48 0,213 0,0454
  42,31 0,043 0,0018
  40,15 2,117 4,4817
  42,82 0,553 0,3058
  43,83 1,563 2,4430
  43,40 1,133 1,2837
  41,13 1,137 1,2928
  41,72 0,547 0,2992
  41,35 0,917 0,8409
  44,13 1,863 3,4708
  42,00 0,267 0,0712
   

По данным таблицы находим

.

Пример. Объем генеральной совокупности N = 10000, объем выборки n =1000. В результате измерения интересующего нас признака X получено: Найти вероятность того, что среднее значение признака Х отличается от своей оценки на величину , если выборка повторная; бесповторная.

Выборка повторная:

По формуле (7.3) имеем

,

где .

Заменяя неизвестное , его оценкой, получим

следовательно,

и

Выборка бесповторная.

При этом

и



Поделиться:


Последнее изменение этой страницы: 2016-08-26; просмотров: 683; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 35.171.182.239 (0.034 с.)