Выборки. Эмпирическая функция распределения 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Выборки. Эмпирическая функция распределения



Изучение всего набора элементов генеральной совокупности часто оказывается невозможным из-за больших материальных затрат или бесконечности генеральной совокупности. В этом случае применяется выборочный метод. Сущность выборочного метода заключается в том, что из генеральной совокупности извлекается выборка. На выборке производят нужные исследования, а полученные результаты распространяют на всю совокупность.

Пусть для изучения количественного признака Х из генеральной совокупности извлечена выборка объема n. Наблюдаемые значения хi признака Х называют вариантами, а последовательность вариантов, записанную в возрастающем порядке, – вариационным рядом. Статистическим распределением выборки называется перечень хi и соответствующих им частот тi или относительных частот v i.

Статистическое распределение выборочной совокупности можно представить графически в виде полигона или гистограммы. Полигоном частот выборочной совокупности называется ломаная линия, соединяющая точки с координатами .

Гистограммой выборочной совокупности называется фигура, составленная в декартовой системе координат из прямоугольников, основаниями которых являются частичные интервалы , а высоты соответственно равны , где .

Эмпирической функцией распределения называется функция , где nх – число вариант в выборке, меньших х; п – объем выборки. Эмпирическая функция распределения при больших п служит оценкой неизвестной функции распределения генеральной совокупности. Эмпирическая функция распределения обладает следующими свойствами:

1) ;

2) эмпирическая функция распределения является неубывающей функцией, т. е. если , то ;

3) если – наименьшая варианта, а – наибольшая варианта, то при и при .

 

Точечные оценки неизвестных параметров распределения

Статистической оценкой неизвестного параметра генеральной совокупности называется функция от наблюдаемых значений случайной величины Х. Сами наблюдаемые значения (варианты) рассматриваются как значения п независимых СВ , имеющих тот же закон распределения, что и изучаемая СВ Х. Поэтому статистические оценки также являются случайными величинами.

Статистическая оценка называется точечной, если она определяется одной величиной. Точечная оценка, математическое ожидание которой равно оцениваемому параметру, называется несмещенной, в противном случае – смещенной.

Несмещенной оценкой для математического ожидания генеральной совокупности является – выборочная средняя:

 

.

 

Смещенной оценкой для дисперсии генеральной совокупности является выборочная дисперсия , а несмещенной оценкой для дисперсии генеральной совокупности является исправленная выборочная дисперсия .

,

,

 

 

Оценка параметра q называется состоятельной, если она сходится по вероятности к оцениваемому параметру при неограниченном числе испытаний, т. е. для любого сколь угодно малого e > 0 выполнено предельное равенство .

Один и тот же параметр может иметь несколько оценок, которые обладают различными дисперсиями при ограниченном числе опытов. Чем меньше эта дисперсия, тем меньше вероятность совершить ошибку при оценке параметра. Поэтому в качестве оценки берется та, которая обладает минимальной дисперсией (эффективная).

 

Интервальные оценки неизвестных параметров

Распределения

Статистическая оценка называется интервальной, если она характеризуется двумя случайными величинами: началом и концом интервала. В качестве интервальной оценки используются доверительные интервалы.

Пусть является статистической оценкой неизвестного параметра q. Тогда при некоторых e > 0 вероятность близка к единице, т. е. неизвестный параметр q с вероятностью g накрывается интервалом . Вероятность g называется доверительной вероятностью или надежностью оценки. Интервал, который с заданной надежностью накрывает неизвестный параметр, называется доверительным интервалом.

Доверительный интервал для неизвестного математического ожидания нормально распределенной СВ при известном среднем квадратическом отклонении s генеральной совокупности определяется неравенством

,

 

где t – значение функции Лапласа , при котором

Если среднее квадратическое отклонение σ нормально распределенной СВ неизвестно, но по результатам выборки вычислены и s, то доверительный интервал для математического ожидания определяется неравенством

 

 

где находится из таблицы (приложение 5) по заданным значениям g и n.

Доверительный интервал для среднего квадратического отклонения s нормально распределенной СВ определяется неравенством

 

,

 

где определяются из таблицы (приложение 6) по заданным g и ν = n – 1.

 



Поделиться:


Последнее изменение этой страницы: 2016-04-21; просмотров: 187; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.133.141.6 (0.007 с.)