Статистическая модель и задачи математической статистики 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Статистическая модель и задачи математической статистики



МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

 

Конспект лекций

по курсу

«Теория вероятностей и математическая статистика»

 

 

Лектор:

к.ф.-м.н., доцент

Коломиец Э.И.

 

САМАРА 2014

Способы представления статистических данных.

Пусть  - выборка объема n из генеральной совокупности, имеющей функцию распределения . Она является исходной информацией для статистического анализа и принятия решений.

В зависимости от дальнейших целей существует несколько способов представления статистических данных. Простейший из них - в виде статистического ряда:

Номер наблюдения 1      2       …    
Результат наблюдения                      

Если среди выборочных значений имеются совпадающие, то статистический ряд удобнее записывать в виде таблицы, называемой   таблицей частот:

Выборочные значения
Частоты
Относительные частоты

где  - различные значения среди ;  - частота значения ;    - относительная частота значения . Очевидно, что . Поэтому совокупность пар   называют эмпирическим законом распределения.

Выборочные значения , упорядоченные по возрастанию, носят название вариационного ряда:

,

 где , . Такая форма представления выборочных значений оказывается особенно полезной при графических иллюстрациях. Часто упорядоченность выборочных значений предполагается по умолчанию.

    Величина  называется размахом выборки.

     Способом представления статистических данных, позволяющим делать выводы о неизвестном распределении наблюдаемой случайной величины , является эмпирическая функция распределения.

 

Методы нахождения точечных оценок

    Наиболее распространенными методами получения точечных оценок неизвестных параметров распределений, удовлетворяющих требованиям
1) – 3) (хотя бы частично), являются метод моментов и метод максимального правдоподобия.

Метод моментов

Метод моментов, предложенный К. Пирсоном, является исторически первым общим методом точечного оценивания неизвестных параметров распределений. Суть его состоит в следующем.

Пусть  - выборка из генеральной совокупности, имеющей функцию распределения , зависящую от векторного параметра  (задана параметрическая модель наблюдений).

Предположим, что у наблюдаемой случайной величины  существуют первые  моментов . Они являются функциями от неизвестного параметра : .

Рассмотрим выборочные начальные моменты , рассчитанные по данной выборке  (это числа!).

Метод моментов состоит в приравнивании теоретических моментов соответствующим выборочным моментам. При этом получается система  уравнений

с  неизвестными .

    Если данная система уравнений имеет единственное решение, то оно называется оценкой параметра , полученной по методу моментов и обозначается .

    Для нахождения оценки  может быть использована также система уравнений, основанных на приравнивании центральных теоретических соответствующим центральным выборочным моментам:

или смешанная система уравнений, часть из которых основана на приравнивании начальных теоретических и выборочных моментов, а часть – на приравнивании теоретических и выборочных центральных моментов. Использование именно первых r моментов также не является обязательным. Получаемые во всех этих случаях оценки, вообще говоря, отличаются друг от друга. Но при больших объемах выборки  отличия этих оценок незначительны, и все они, по-прежнему, называются оценками, полученными по методу моментов.

       В случае двумерного неизвестного параметра  его оценка по методу моментов  обычно определяется как решение системы уравнений: .

Оценки, полученные по методу моментов являются:

- состоятельными (при весьма общих предположениях);

- несмещенными не всегда;

- вообще говоря, неэффективными.

На практике оценки, полученные по методу моментов, часто используются как первое приближение, на основе которого находятся более «хорошие» оценки.

Достоинство метода моментов заключается в том, что системы уравнений для нахождения оценок решаются довольно просто. Однако имеет место произвол в выборе уравнений для нахождения оценок и метод вообще неприменим, когда моментов необходимого порядка не существует (например, в случае закона распределения Коши).

Пример 1. Наблюдаемая случайная величина  имеет показательное (экспоненциальное) распределение с неизвестным параметром , то есть имеет плотность вероятностей вида: . Требуется по выборке  найти оценку параметра  по методу моментов.

 

Решение.

Для показательного закона распределения   известно, что

, , .

На основании этого можно получить три различные оценки параметра  по методу моментов.

а) Используя уравнение , имеем . Следовательно,

.

б) Используя уравнение , имеем . Следовательно,

.

в) Используя уравнение , имеем . Следовательно,

.

      При больших  эти три оценки параметра  отличаются друг от друга незначительно.

Пример 2. Наблюдаемая случайная величина  имеет закон распределения Пуассона  с неизвестным параметром :

.

Требуется по выборке  найти оценку параметра  по методу моментов.

Решение.

Известно, что .

На основании этого можно получить две оценки параметра  по методу моментов:

, .

При больших  эти оценки отличаются незначительно. Приближенное равенство  является характерной особенностью закона распределения Пуассона.

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

 

Конспект лекций

по курсу

«Теория вероятностей и математическая статистика»

 

 

Лектор:

к.ф.-м.н., доцент

Коломиец Э.И.

 

САМАРА 2014

Статистическая модель и задачи математической статистики

Математическая статистика – раздел прикладной математики, непосредственно примыкающий и основанный на теории вероятностей. Как и любая математическая теория, математическая статистика развивается в рамках некоторой модели, описывающей определенный круг реальных явлений. Чтобы определить статистическую модель и объяснить специфику задач математической статистики, напомним некоторые положения из теории вероятностей.

Математическая модель случайных явлений, изучаемых в теории вероятностей, основывается на понятии вероятностного пространства . При этом в каждой конкретной ситуации вероятность  считается полностью известной числовой функцией на -алгебре , то есть для любого  полностью определено число . Основной задачей теории вероятностей является разработка методов нахождения вероятностей различных сложных событий по известным вероятностям более простых (например, по известным законам распределения случайных величин определяются их числовые характеристики и законы распределения функций от случайных величин).

Однако на практике при изучении конкретного случайного эксперимента вероятность , как правило, неизвестна или известна частично. Можно только предположить, что истинная вероятность  является элементом некоторого класса вероятностей  (в худшем случае  - класс всевозможных вероятностей, которые можно задать на ). Класс  называют совокупностью допустимых для описания данного эксперимента вероятностей , а набор  - статистической моделью эксперимента. В общем случае задачей математической статистики является уточнение вероятностной модели изучаемого случайного явления (то есть отыскание истинной или близкой к ней вероятности ), используя информацию, доставляемую наблюдаемыми исходами эксперимента, которые называют статистическими данными.

В классической математической статистике, изучением которой мы будем заниматься далее, имеют дело со случайными экспериментами, состоящими в проведении n повторных независимых наблюдений над некоторой случайной величиной , имеющей неизвестное распределение вероятностей, т.е. неизвестную функцию распределения . В этом случае множество всех возможных значений наблюдаемой случайной величины  называют генеральной совокупностью, имеющей функцию распределения  или распределенной согласно . Числа , являющиеся результатом  независимых наблюдений над случайной величиной , называют выборкой из генеральной совокупности или выборочными (статистическими) данными. Число наблюдений  называется объемом выборки.

    Основная задача математической статистики состоит в том, как по выборке   из генеральной совокупности, извлекая из нее максимум информации, сделать обоснованные выводы относительно неизвестных вероятностных характеристик наблюдаемой случайной величины .

    Под статистической моделью, отвечающей повторным независимым наблюдениям над случайной величиной , естественно, вместо  понимать набор , где  - генеральная совокупность,  - -алгебра борелевских подмножеств из ,  - класс допустимых функций распределения для данной случайной величины , которому принадлежит и истинная неизвестная функция распределения .

    Часто тройку  называют статистическим экспериментом.

    Если функции распределения из  заданы с точностью до значений некоторого параметра , то есть  (  - параметрическое множество), то такая модель называется параметрической. Говорят, что в этом случае известен тип распределения наблюдаемой случайной величины, а неизвестен только параметр, от которого распределение зависит. Параметр  может быть как скалярным, так и векторным.

    Статистическая модель  называется непрерывной или дискретной, если таковыми являются все составляющие класс  функции распределения соответственно.

    Пример 1. Предположим, что распределение наблюдаемой случайной величины  является гауссовским с известной дисперсией   и неизвестным математическим ожиданием .

В этом случае статистическая модель является непрерывной и имеет вид:

, где ,

а функция распределения  имеет плотность вероятностей

.

Далее для этой модели будем использовать обозначение .

Если и дисперсия неизвестна, то статистическая модель имеет вид:

, где ,

а функция распределения  имеет плотность вероятностей

.

Это, так называемая, общая нормальная модель, обозначаемая .

Пример 2. Предположим, что распределение наблюдаемой случайной величины  является пуассоновским с неизвестным параметром . В этом случае статистическая модель является дискретной и имеет вид:

, где ,

а функция распределения  определяется вероятностями

.

Эта модель называется пуассоновской и обозначается .

Замечание: Выборка   является исходной информацией для статистического анализа и принятия решений о неизвестных вероятностных характеристиках наблюдаемой случайной величины . Однако на основе конкретной выборки обосновать качество статистических выводов принципиально невозможно. Для этого на выборку следует смотреть априорно как на случайный вектор , координаты которого являются независимыми, распределенными так же как и , случайными величинами (при этом говорят, что случайные величины  - копии ), и который еще не принял конкретного значения в результате эксперимента. Переход от выборки конкретной  к выборке случайной  будет неоднократно использоваться далее при решении теоретических вопросов и задач для получения выводов, справедливых для любой выборки из генеральной совокупности.

Основные задачи, рассматриваемые в математической статистике, можно разбить на две большие группы:

1. Задачи, связанные с определением неизвестного закона распределения наблюдаемой случайной величины  и параметров в него входящих (они рассматриваются в рамках статистической теории оценивания).

2. Задачи, связанные с проверкой гипотез относительно закона распределения наблюдаемой случайной величины  (решаются в рамках теории проверки статистических гипотез).

 



Поделиться:


Последнее изменение этой страницы: 2021-12-15; просмотров: 59; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.223.125.219 (0.048 с.)