Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь КАТЕГОРИИ: АрхеологияБиология Генетика География Информатика История Логика Маркетинг Математика Менеджмент Механика Педагогика Религия Социология Технологии Физика Философия Финансы Химия Экология ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Статистическая модель и задачи математической статистикиСтр 1 из 7Следующая ⇒
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Конспект лекций по курсу «Теория вероятностей и математическая статистика»
Лектор: к.ф.-м.н., доцент Коломиец Э.И.
САМАРА 2014 Способы представления статистических данных. Пусть - выборка объема n из генеральной совокупности, имеющей функцию распределения . Она является исходной информацией для статистического анализа и принятия решений. В зависимости от дальнейших целей существует несколько способов представления статистических данных. Простейший из них - в виде статистического ряда:
Если среди выборочных значений имеются совпадающие, то статистический ряд удобнее записывать в виде таблицы, называемой таблицей частот:
где - различные значения среди ; - частота значения ; - относительная частота значения . Очевидно, что . Поэтому совокупность пар называют эмпирическим законом распределения. Выборочные значения , упорядоченные по возрастанию, носят название вариационного ряда: , где , . Такая форма представления выборочных значений оказывается особенно полезной при графических иллюстрациях. Часто упорядоченность выборочных значений предполагается по умолчанию. Величина называется размахом выборки. Способом представления статистических данных, позволяющим делать выводы о неизвестном распределении наблюдаемой случайной величины , является эмпирическая функция распределения.
Методы нахождения точечных оценок Наиболее распространенными методами получения точечных оценок неизвестных параметров распределений, удовлетворяющих требованиям Метод моментов Метод моментов, предложенный К. Пирсоном, является исторически первым общим методом точечного оценивания неизвестных параметров распределений. Суть его состоит в следующем. Пусть - выборка из генеральной совокупности, имеющей функцию распределения , зависящую от векторного параметра (задана параметрическая модель наблюдений).
Предположим, что у наблюдаемой случайной величины существуют первые моментов . Они являются функциями от неизвестного параметра : . Рассмотрим выборочные начальные моменты , рассчитанные по данной выборке (это числа!). Метод моментов состоит в приравнивании теоретических моментов соответствующим выборочным моментам. При этом получается система уравнений с неизвестными . Если данная система уравнений имеет единственное решение, то оно называется оценкой параметра , полученной по методу моментов и обозначается . Для нахождения оценки может быть использована также система уравнений, основанных на приравнивании центральных теоретических соответствующим центральным выборочным моментам: или смешанная система уравнений, часть из которых основана на приравнивании начальных теоретических и выборочных моментов, а часть – на приравнивании теоретических и выборочных центральных моментов. Использование именно первых r моментов также не является обязательным. Получаемые во всех этих случаях оценки, вообще говоря, отличаются друг от друга. Но при больших объемах выборки отличия этих оценок незначительны, и все они, по-прежнему, называются оценками, полученными по методу моментов. В случае двумерного неизвестного параметра его оценка по методу моментов обычно определяется как решение системы уравнений: . Оценки, полученные по методу моментов являются: - состоятельными (при весьма общих предположениях); - несмещенными не всегда; - вообще говоря, неэффективными. На практике оценки, полученные по методу моментов, часто используются как первое приближение, на основе которого находятся более «хорошие» оценки. Достоинство метода моментов заключается в том, что системы уравнений для нахождения оценок решаются довольно просто. Однако имеет место произвол в выборе уравнений для нахождения оценок и метод вообще неприменим, когда моментов необходимого порядка не существует (например, в случае закона распределения Коши). Пример 1. Наблюдаемая случайная величина имеет показательное (экспоненциальное) распределение с неизвестным параметром , то есть имеет плотность вероятностей вида: . Требуется по выборке найти оценку параметра по методу моментов.
Решение. Для показательного закона распределения известно, что , , . На основании этого можно получить три различные оценки параметра по методу моментов. а) Используя уравнение , имеем . Следовательно, . б) Используя уравнение , имеем . Следовательно, . в) Используя уравнение , имеем . Следовательно, . При больших эти три оценки параметра отличаются друг от друга незначительно. Пример 2. Наблюдаемая случайная величина имеет закон распределения Пуассона с неизвестным параметром : . Требуется по выборке найти оценку параметра по методу моментов. Решение. Известно, что . На основании этого можно получить две оценки параметра по методу моментов: , . При больших эти оценки отличаются незначительно. Приближенное равенство является характерной особенностью закона распределения Пуассона. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Конспект лекций по курсу «Теория вероятностей и математическая статистика»
Лектор: к.ф.-м.н., доцент Коломиец Э.И.
САМАРА 2014 Статистическая модель и задачи математической статистики Математическая статистика – раздел прикладной математики, непосредственно примыкающий и основанный на теории вероятностей. Как и любая математическая теория, математическая статистика развивается в рамках некоторой модели, описывающей определенный круг реальных явлений. Чтобы определить статистическую модель и объяснить специфику задач математической статистики, напомним некоторые положения из теории вероятностей. Математическая модель случайных явлений, изучаемых в теории вероятностей, основывается на понятии вероятностного пространства . При этом в каждой конкретной ситуации вероятность считается полностью известной числовой функцией на -алгебре , то есть для любого полностью определено число . Основной задачей теории вероятностей является разработка методов нахождения вероятностей различных сложных событий по известным вероятностям более простых (например, по известным законам распределения случайных величин определяются их числовые характеристики и законы распределения функций от случайных величин). Однако на практике при изучении конкретного случайного эксперимента вероятность , как правило, неизвестна или известна частично. Можно только предположить, что истинная вероятность является элементом некоторого класса вероятностей (в худшем случае - класс всевозможных вероятностей, которые можно задать на ). Класс называют совокупностью допустимых для описания данного эксперимента вероятностей , а набор - статистической моделью эксперимента. В общем случае задачей математической статистики является уточнение вероятностной модели изучаемого случайного явления (то есть отыскание истинной или близкой к ней вероятности ), используя информацию, доставляемую наблюдаемыми исходами эксперимента, которые называют статистическими данными. В классической математической статистике, изучением которой мы будем заниматься далее, имеют дело со случайными экспериментами, состоящими в проведении n повторных независимых наблюдений над некоторой случайной величиной , имеющей неизвестное распределение вероятностей, т.е. неизвестную функцию распределения . В этом случае множество всех возможных значений наблюдаемой случайной величины называют генеральной совокупностью, имеющей функцию распределения или распределенной согласно . Числа , являющиеся результатом независимых наблюдений над случайной величиной , называют выборкой из генеральной совокупности или выборочными (статистическими) данными. Число наблюдений называется объемом выборки.
Основная задача математической статистики состоит в том, как по выборке из генеральной совокупности, извлекая из нее максимум информации, сделать обоснованные выводы относительно неизвестных вероятностных характеристик наблюдаемой случайной величины . Под статистической моделью, отвечающей повторным независимым наблюдениям над случайной величиной , естественно, вместо понимать набор , где - генеральная совокупность, - -алгебра борелевских подмножеств из , - класс допустимых функций распределения для данной случайной величины , которому принадлежит и истинная неизвестная функция распределения . Часто тройку называют статистическим экспериментом. Если функции распределения из заданы с точностью до значений некоторого параметра , то есть ( - параметрическое множество), то такая модель называется параметрической. Говорят, что в этом случае известен тип распределения наблюдаемой случайной величины, а неизвестен только параметр, от которого распределение зависит. Параметр может быть как скалярным, так и векторным. Статистическая модель называется непрерывной или дискретной, если таковыми являются все составляющие класс функции распределения соответственно. Пример 1. Предположим, что распределение наблюдаемой случайной величины является гауссовским с известной дисперсией и неизвестным математическим ожиданием . В этом случае статистическая модель является непрерывной и имеет вид: , где , а функция распределения имеет плотность вероятностей . Далее для этой модели будем использовать обозначение . Если и дисперсия неизвестна, то статистическая модель имеет вид: , где , а функция распределения имеет плотность вероятностей . Это, так называемая, общая нормальная модель, обозначаемая .
Пример 2. Предположим, что распределение наблюдаемой случайной величины является пуассоновским с неизвестным параметром . В этом случае статистическая модель является дискретной и имеет вид: , где , а функция распределения определяется вероятностями . Эта модель называется пуассоновской и обозначается . Замечание: Выборка является исходной информацией для статистического анализа и принятия решений о неизвестных вероятностных характеристиках наблюдаемой случайной величины . Однако на основе конкретной выборки обосновать качество статистических выводов принципиально невозможно. Для этого на выборку следует смотреть априорно как на случайный вектор , координаты которого являются независимыми, распределенными так же как и , случайными величинами (при этом говорят, что случайные величины - копии ), и который еще не принял конкретного значения в результате эксперимента. Переход от выборки конкретной к выборке случайной будет неоднократно использоваться далее при решении теоретических вопросов и задач для получения выводов, справедливых для любой выборки из генеральной совокупности. Основные задачи, рассматриваемые в математической статистике, можно разбить на две большие группы: 1. Задачи, связанные с определением неизвестного закона распределения наблюдаемой случайной величины и параметров в него входящих (они рассматриваются в рамках статистической теории оценивания). 2. Задачи, связанные с проверкой гипотез относительно закона распределения наблюдаемой случайной величины (решаются в рамках теории проверки статистических гипотез).
|
|||||||||||||||||||||||||||
Последнее изменение этой страницы: 2021-12-15; просмотров: 60; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.191.26.53 (0.037 с.) |