Статистические оценки параметров распределения. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Статистические оценки параметров распределения.



Пусть требуется изучить количественный признак генеральной совокупности. Допустим, удалось установить закон распределения этого признака. Возникает задача оценки параметров, которыми определяется это распределение. Например, изучаемый признак распределен в генеральной совокупности нормально. Тогда требуется оценить (приближенно найти) математическое ожидание и среднее квадратическое отклонение, так как эти два параметра полностью определяют нормальное распределение.

Обычно в распоряжении исследователя имеются лишь данные выборки, например, значения количественного признака x1, x2 … xn, полученные в результате n наблюдений. Через эти данные и выражают оцениваемый параметр. Найти статистическую оценку неизвестного параметра теоретического распределения – это значит найти функцию от наблюдаемых случайных величин, которая и даёт приближенное значение оцениваемого параметра.

Оценки генеральных параметров по выборочным характеристикам могут быть точечными и интервальными. Точечной называют оценку, которая определяется одним числом. Интервальной называют оценку, которая задается двумя числами – концами интервалов.

Для оценки неизвестных параметров теоретического распределения применяются характеристики статистического распределения выборки – выборочная средняя, выборочная дисперсия, выборочное среднее квадратическое отклонение. Это точечные оценки, вычисляемые по случайной выборке.

Выборочные характеристики как величины случайные, варьирующие вокруг своих генеральных параметров, в основном не совпадают с ними. Для того, чтобы оценки давали «хорошее» приближение оцениваемых параметров, они должны удовлетворять определённым требованиям: быть несмещёнными, эффективными и состоятельными.

Несмещенной называют статистическую оценку Θ*, математическое ожидание которой равно оцениваемому параметру Θ при любом объеме выборки, т.е. M(Θ*) = Θ.

Смещенной, если M(Θ*) ≠ Θ.

Эффективной называют статистическую оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию.

Состоятельной называют статистическую оценку, которая при n→∞ стремится по вероятности к оцениваемому параметру.

Оценка генеральной средней.

Теорема: Выборочная средняя повторной выборки есть несмещённая и состоятельная оценка генеральной средней , причем - дисперсия выборочной средней.

Выборочная средняя повторной выборки для нормально распределенной генеральной совокупности является эффективной оценкой генеральной средней

Определение: Среднее квадратическое отклонение выборочной средней называется стандартной ошибкой выборки

- стандартная ошибка выборки

Величину средней и её стандартную ошибку записывают так:

Ошибка средней арифметической может быть выражена в относительных величинах, т.е. в %. В этом случае её называют показателем точности и вычисляют по формуле:

 
 

 

 


Относительная ошибка выборки показывает, на сколько процентов выборочная оценка отклоняется от параметра генеральной совокупности.

Чем меньше величина , тем достовернее, надёжнее полученная средняя. Точность средней арифметической является приемлемой, если этот коэффициент не превышает 5%.

При выборке малого объема точечная оценка может разительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам.

По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.

Интервальные оценки позволяют установить точность и надежность оценок.

Пусть найденная по данным выборки статистическая характеристика Θ* служит оценкой неизвестного параметра Θ.

Если δ > 0 и │Θ – Θ*│< δ, то чем меньше δ, тем оценка точнее.

Т.о., положительное число δ характеризует точность оценки.

Однако статистические методы не позволяют категорически утверждать, что оценка Θ* удовлетворяет неравенству │Θ – Θ*│< δ; можно лишь говорить о вероятности , с которой это неравенство осуществляется.

Надежностью (доверительной вероятностью) оценки Θ по Θ* называют вероятность , с которой осуществляется неравенство │Θ – Θ*│< δ

= 0,95; 0,99; 0,999.

Заменив неравенство │Θ – Θ*│< δ равносильным ему двойным неравенством

Вероятность того, что интервал (Θ* - δ; Θ* + δ) заключает в себе (покрывает) неизвестный параметр Θ, равна .

Доверительным интервалом называется случайный интервал

*- δ; Θ*+ δ), в пределах которого с вероятностью находится неизвестный оцениваемый параметр.

Число называется доверительной вероятностью, уровнем доверия или надежностью оценки. Это значение задают заранее. Тогда, зная закон распределения случайной величины, можно найти доверительный интервал.

Число p(или ) называется уровнем значимости и показывает, с какой вероятностью заключение о надежности оценки ошибочно.

Его находят по формуле

.

Величина может иметь три значения: 0,95; 0,99; 0,999.

Соответственно p: 0,05; 0,01; 0,001.

Очевидно, что чем меньше p, тем точнее оценка.

На рис.16 показан геометрический смысл доверительной вероятности, уровня значимости и доверительного интервала. Длина доверительного интервала определяется % (значение доверительной вероятности, выраженной в процентах) площади под нормальной кривой выборочного распределения некоторой случайной величины. Уровень значимости соответствует той оставшейся части (в %) площади под нормально кривой, которая выходит за границы доверительного интервала.

 

 

Рис.16 Доверительный интервал, уровень значимости , доверительная вероятность для кривой нормального распределения.

Например, доверительная вероятность означает, что длина искомого доверительного интервала ограничивается 95% площади под кривой нормального распределения, т.е. полученная интервальная оценка справедлива для 95% членов генеральной совокупности. Оставшиеся 5% могут иметь отклонения от значений полученной оценки. С увеличением доверительной вероятности (уменьшением уровня значимости) увеличивается длина доверительного интервала.

Определение: наибольшее отклонение оценки от оцениваемого параметра в частности, выборочной средней (или доли) от генеральной средней (или доли), которое возможно с заданной доверительной вероятностью , называется предельной ошибкой выборки

Ошибка является ошибкой репрезентативности (представительности) выборки. Она возникает только вследствие того, что исследуется не вся совокупность, а лишь часть её (выборка), отобранная случайно.

Прежде, чем перейти к интервальным оценкам параметров распределения, рассмотрим некоторые важные распределения случайной величины.

 



Поделиться:


Последнее изменение этой страницы: 2016-04-26; просмотров: 735; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.217.6.114 (0.011 с.)