Оценки параметров генеральной совокупности 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Оценки параметров генеральной совокупности



ПО ЕЕ ВЫБОРКЕ

Пусть в эксперименте изучается случайная величина X и, из теоретических соображений, известен ее закон распределения. Естест­венно, возникает задача оценки (приближенного нахождения) параметров , которыми определяется это распределение. Например, если известно, что случайная величина распределена в генеральной совокупности нормально, то необходимо оценить, т. е. приближен­но найти математическое ожидание и среднее квадратическое от­клонение , так как эти два параметра полностью определяют нор­мальное распределение.

Обычно в распоряжении исследователя имеются лишь данные выборки генеральной совокупности, например (), полученные в результате п на­блюдений (здесь и далее наблюдения предполагаются независи­мыми). Через эти данные и выражают оцениваемый параметр.

1. Числовые характеристики выборки. Выборочной средней называется сред­нее арифметическое всех значений выборки. Если все значения выборки объема п различны, то

Если же значения выборки имеют соответственно частоты , причем :

Для того чтобы охарактеризовать рассеяние наблюдаемых зна­чений количественного признака выборки вокруг своего среднего значения , вводят выборочную дисперсию.

Выборочной дисперсией называется среднее арифметическое квадратов отклонений наблюдаемых зна­чений признака X от выборочной средней .

Если все значения признака выборки объема п различны, то

Если же значения признака имеют соответственно частоты , причем :

Можно показать, что может быть вычислена по формуле:

Выборочным средним квадратическим отклонением называется квадратный корень из выборочной дисперсии:

Особенность состоит в том, что оно измеряется в тех же единицах, что и измеряемый признак.

 

Пример. Выборочным путем были получены следующие данные о массе 20 хомячков при рождении (в г): 30, 30, 25, 32, 30, 25, 33, 32, 29, 28, 27, 36, 31, 34, 30, 23, 28, 34, 36, 30. Найти выборочную среднюю и выборочную дисперсию .

Согласно формулам имеем:

 

2. Оценки параметров распределения. Для оцен­ки параметров распределения из данных выборки составляют выражения, которые должны служить оценками неизвестных пара­метров. Для того чтобы оценка давала хорошее приближе­ние, она должна удовлетворять определенным требованиям: быть несмещенной и состоятельной.

Несмещенной называют оценку , математическое ожидание которой равно оцени­ваемому параметру :

в противном случае оценка называется смещенной.

Пример 1. Оценка является несмещенной оценкой гене­ральной средней (математического ожидания), так как

Пример 2. Оценка является смещенной оценкой генераль­ной дисперсии ,так как

.

Естественно в качестве приближенного неизвестного параметра брать несмещенные оценки, для того чтобы не делать систематиче­ской ошибки в сторону завышения или занижения.

Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия:

Для оценки генерального среднего квадратического отклонения используют исправленное среднее квадратическое отклонение, кото­рое равно квадратному корню из исправленной дисперсии:

 

3. Метод моментов. Пусть изучается случайная величина X с математическим ожиданием и дисперсией и оба эти параметра неизвестны.

Точечной называют оценку, которая определяется одним числом. То есть точечная оценка характеристики генеральной со­вокупности — это число, определяемое по выборке.

Метод моментов для нахождения точечных оценок неизвестных параметров заданного распределения состоит в приравнивании теоре­тических моментов распределения соответствующим эмпирическим моментам, найденных по выборке.

Так, если распределение зависит от одного параметра , то для нахождения его оценки надо решить относительно одно уравнение:

Если распределение зависит от двух параметров, то надо решить относительно и систему уравнений

 

Пример. Пусть СВ Х имеет распределение Пуассона: . Наблюдаемые: Нужно оценить неизвестный параметр с помощью метода моментов.

Решение. Известно, что математическое ожидание распределения Пуассона . Для того, чтобы найти оценку неизвестного параметра решаем уравнение Для этого приравняем и . Тогда оценка

 

4. Доверительные интервалы. Задачу интервального оценивания можно сформулировать так: по данным выборки построить числовой интервал , относительно которого с заранее выбранной вероятностью можно сказать, что внутри этого интервала находится точное значение оцениваемого параметра

.

При этом интервал называется доверительным интервалом, - доверительной вероятностью или надежностью, а - уровнем значимости.

Величина выбирается заранее, ее принято выбирать равной 0,9; 0,95; 0,99 или 0,999. Интервал часто выбирают симметричным относительно точечной оценки .

Для оценки математического ожидания нормально распределенной случайной величины по выборочной средней при известном среднем квадратическом отклонении генеральной совокупности служит доверительный интервал

где - точность оценки; - объем выборки; - такое значение аргумента функции Лапласа (см. Приложение), при котором . То есть

Для оценки математического ожидания нормально распределенной случайной величины по выборочной средней при неизвестном среднем квадратическом отклонении генеральной совокупности служит доверительный интервал

где - коэффициент Стьюдента, который находят по таблице по заданным и (см. Приложение); - исправленное среднее квадратическое отклонение.

 

 

Метод наименьших квадратов для линейной зависимости

 

Предположим, что произведен эксперимент, в результате которого зафиксировано значений исследуемых переменных и : . Нанесем экспериментальные данные в виде точек в декартовой системе координат.

Y
X
Mi (xi ,yi )
y=a+bx

 

 

Пусть вид зависимости линейный: . Следующая задача экспериментатора – нахождение коэффициентов (параметров) и линейной эмпирической функции регрессии на . Найдем эти коэффициенты методом наименьших квадратов.

tD b250ZW50X1R5cGVzXS54bWxQSwECLQAUAAYACAAAACEAOP0h/9YAAACUAQAACwAAAAAAAAAAAAAA AAAvAQAAX3JlbHMvLnJlbHNQSwECLQAUAAYACAAAACEAjW80YYwHAACCOwAADgAAAAAAAAAAAAAA AAAuAgAAZHJzL2Uyb0RvYy54bWxQSwECLQAUAAYACAAAACEAX2Eisd8AAAAKAQAADwAAAAAAAAAA AAAAAADmCQAAZHJzL2Rvd25yZXYueG1sUEsFBgAAAAAEAAQA8wAAAPIKAAAAAA== ">
Y
X
Δ i
y(xi)=a+bxi
xi
yi

 

 

Построим функцию , равную сумме квадратов отклонений экспериментальных точек от искомой прямой .

 

Пусть параметры и будут такими, что функция примет минимальное значение. Для этого приравняем частные производные функции по переменным и к нулю:

Решая эту систему, находим параметры и .

 

Последовательность действий

для определения вида зависимости :

1) Результаты прямых измерений и записываем в таблицу.

2) Вычисляем средние значения:

3) Вычисляем дисперсии:

4) Находим оценки параметров:

5) Степень зависимости между и описывается с помощью коэффициента корреляции При этом:

а) если между переменными и существует линейная положительная функциональная связь, то ;

б) если между переменными и существует линейная отрицательная функциональная связь, то ;

в) при отсутствии линейной зависимости между переменными и .

Итак, чем ближе по модулю коэффициент корреляции к нулю, тем слабее зависимость и .

Встроенная линейная регрессия имеется, например, в программируемых калькуляторах и офисных программах (EXCEL).

Пример. Найти уравнение прямой регрессии по четырем парам наблюдаемых значений (, ):

       
       

Решение. Вычислим:

Следовательно, уравнение регрессии имеет вид: .

Вычислим коэффициент корреляции: Результат близок к единице, следовательно между переменными и действительно существует линейная положительная функциональная связь.

 



Поделиться:


Последнее изменение этой страницы: 2016-04-23; просмотров: 817; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.222.250.157 (0.034 с.)