Статистические оценки параметров распределения 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Статистические оценки параметров распределения



Пусть требуется изучить количественный признак Х генеральной совокупности. Пусть вид закона распределения признака известен (из теоретических соображений; по виду гистограммы или полигона относительных частот). Например, изучаем рост студентов г. Костромы. Что нужно сделать? По какому закону распределен? Какие параметры определяют это распределение? Например, если изучаемый признак распределен в генеральной совокупности нормально, то требуется найти два параметра математическое ожидание a и среднеквадратическое отклонение s; если по закону Пуассона, то один параметр l. В некоторых задачах вид закона распределения несущественен, а требуется знать только его числовые характеристики.

Обозначим неизвестный параметр через (обобщённый теоретический параметр). Будем полагать для простоты, что параметр только один.

Для определения значения неизвестного параметра q имеются лишь данные выборки, т.е. значения x1, x2, …, xn количественного признака X. Значение искомого параметра, вычисленное на основе ограниченного числа опытных данных, всегда будет содержать элемент случайности. Такое приближённое, случайное значение будем называть оценкой параметра q и обозначать q*.

q*оценка неизвестного параметра q.

Определить параметр по опытным данным точно невозможно. Более того, трудно говорить даже о приближённом определении параметра, т.е. невозможно оценить предельную возможную ошибку и гарантировать, что она не будет превзойдена. Всегда существует отличная от нуля, хотя и малая, вероятность того, что предел ошибки будет превзойден. Поэтому говорят не о приближенном значении параметра, а о его оценке.

Вопрос. Есть ли различия между понятиями приближённое значение (данное в курсе алгебры) и оценка?

Задача. Имеется случайная величина Х (количественный признак), закон распределения которой содержит неизвестный параметр. Требуется найти подходящую оценку q* для параметра q по результатам n независимых испытаний, в которых величина Х приняла значения x1, x2, …, xn (т.е. по данным выборки объема n).

Значения x1, x2, …, xn можно рассмотреть как независимые случайные величины X1, X2, …, Xn, каждая из которых распределена по тому же закону, что и X.

Статистическая оценка q* неизвестного параметра q есть функция от .

q* = q* (), q* также является случайной величиной.

Если возьмём одну выборку, то найдём некоторые приближённые значения для неизвестного параметра; если возьмём другую выборку, то получим, вообще говоря, другое значение.

 

1-я выборка (x1(1), x2(1),…, xn(1)) ® найдем q1*

Генеральная совокупность (x1, x2, …, xn) 2-я выборка (x1(2), x2(2),…, xn(2)) ® найдем q2*

n-я выборка (x1(n), x2(n),…, xn(n)) ® найдем qn*

 

q* – случайная величина; q1*,q2*, …,qn* – её возможные значения.

 

Значение q неизвестно. Вместо него мы берём значение, определяемое по ограниченному числу выборных данных. Заменяя q на q*, мы, естественно, допускаем ошибку. Желательно, чтобы эта ошибка была минимальной, т.е. чтобы оценка была близка к истинному значению параметра , следовательно, необходимо указать условия, требования к оценке.

Для получения хорошей, доброкачественной оценки неизвестного параметра (близкой к истинному значению параметра q) эта оценка должна удовлетворять ряду требований, а именно быть несмещённой, эффективной и состоятельной. Кроме этих требований, существуют и другие свойства оценок, но мы их не будем рассматривать.

 

: Определение. Несмещённой называют статистическую оценку, математическое ожидание которой равно оцениваемому параметру q при любом объеме выборки, т.е. Если , то оценка называется смещённой.

Смещённой называют статистическую оценку, математическое ожидание которой не равно оцениваемому параметру. Если q* – несмещенная оценка, то, используя её вместо q, мы не будем делать ошибок только в сторону завышения (все ) или только в сторону занижения (все ). Требование несмещённости гарантирует от систематических ошибок, хотя и не устраняет ошибок вообще. Возможные значения q могут быть сильно рассеяны вокруг своего среднего значения, т.е. дисперсия большая. Тогда найденная по данным одной выборки оценка (например, ) может быть значительно удалена от среднего значения , а значит и от q. Следовательно, заменив q на , мы допускаем большую ошибку. Следовательно, необходимо потребовать, чтобы была малой.

 

: Определение. Эффективной называют статистическую оценку, которая (при заданном объёме выборки) имеет наименьшую возможную дисперсию.

 

= Dmin. Для q может существовать несколько несмещённых оценок. Из них выбирают более эффективную, т.е. обладающую наименьшей дисперсией по сравнению с остальными.

Желательно, чтобы точность оценки увеличивалась с увеличением объёма выборки, а именно при увеличении n необходимо, чтобы q* приближалась к q.

 

: Определение. Состоятельной называют статистическую оценку, которая при сходится по вероятности к оцениваемому параметру:

На практике не всегда удается выполнить все эти требования. Например, эффективная оценка существует, но формулы для её вычисления сложны и приходится брать другую, которая несколько больше, но её вычисление проще.

 



Поделиться:


Последнее изменение этой страницы: 2016-04-19; просмотров: 361; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.139.82.23 (0.008 с.)