Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь
FAQ
Написать работу

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву

Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

Главная Избранные Случайная статья Познавательные Новые добавления Обратная связь FAQ Написать работу

Теоремы о числовых хар-ках, их применение.

↑

⇐ ПредыдущаяСтр 4 из 6Следующая ⇒

Пусть даны 2 СВ Х и У и известны M[x] и M[y],σ_x и σ_y

1. Матожидание СВ С равно самой этой величине. M[C] = C

Пусть Х – дискретная, (х=С, p=1), тогда M[C] = xp = 1*C = C

2. Дисперсия неслучайной величины С=0

D[C] = M[(C – M[C])²] = 0

3. Вынесение неслучайной величины за знак мат. ожидания

M[CX] = C*M[X]

4. Вынесение неслучайной величины за знак дисперсии и СДО

D[CX] = C²*D[X] σ[CX] = |C|*σ[X]

5. Матожидание суммы случайных величин (независимо от того, зависимы они или нет) M[X+Y] = M[X] + M[Y]

6. Матожидание линейной функции

M[aХ + bY + c] = aM[X] + bM[Y] + c

7. Дисперсия суммы случайных величин

D[X+Y] = D[X] + D[Y] – 2k_xy

Если х,у некоррелированы, то k_xy=0, тогда

D[X+Y] = D[X] + D[Y]

8. Дисперсия линейной функции

D[aX + bY + c] = a²D[X] + b²D[Y] – 2ab* k_xy

k_xy = M[XY] – m[x]*m[y] – корреляционный момент

9. Матожидание произведения СВ

M[XY] = M[X] * M[Y] + k_xy

10. Дисперсия произведения независимых СВ

D[XY] = D[X] * D[Y] + M[X]² * D[Y] + M[Y]² * D[X]

Для центрированных (M[X]=M[Y]=0) – D[ ] = D[ ] * D[ ]

Применение теорем:

1) Доказать, что СВ связаны линейной функциональной зависимостью Y=aX+b

2) Определить М(Х) числа появлений события при нескольких опытах

3) Найти дисперсию числа появлений события при нескольких независимых и зависимых опытах

4) Средний расход средств до достижения числа опытов до k-го появления события

(M(X)=ΣM(X_i)=k/p, D(X)=ΣD(X_i)=kq/p², σ=(√kq)/p

19. Предельные теоремы теории вероятностей. Неравенство Чебышева, неравенство Маркова. Закон Больших чисел (теорема Чебышева).

Практика изучения случайных явлений показывает, что хотя результаты отдельных наблюдений, даже проведенных в одинаковых условиях, могут сильно отличаться, в то же время средние результаты для достаточно большого числа наблюдений устойчивы и слабо зависят от результатов отдельных наблюдений.

Теоретическим обоснованием этого свойства случайных явлений является закон больших чисел.

Закон больших чисел:

В широком – при большом числе СВ их средний результат перестает быть случайным и м.б. предсказан с большой степенью определенности

В узком – ряд матем. теорем, в каждой из которых для тех или иных условий устанавливается факт приближения средних характеристик большого числа испытаний к некоторым определенным постоянным.

В основе качественных и количественных утверждений закона больших чисел лежит неравенство Чебышева. Оно определяет верхнюю границу вероятности того, что отклонение значения случайной величины от ее математического ожидания больше некоторого заданного числа. Замечательно, что неравенство Чебышева дает оценку вероятности события для случайной величины, распределение которой неизвестно, известны лишь ее математическое ожидание и дисперсия.

Неравенство Чебышева – каково бы ни было «+»-е число α, Р_А, что величина Х отклонится от своего М(Х) не меньше, чем на α, ограничена сверху величиной D(X)/α².

Для любой СВ, имеющей М(Х) и D(X), справедливо неравенство:

Неравенство Чебышева для некоторых СВ:

1) Для СВ X=m при Х~Bi(n,p) c M(X)=np и D(X)=npq:

2) Для частости m/n события в n независимых испытаниях, в каждом из кот. оно может произойти с одной и той же p=M(m/n), и имеющей D(m/n)=pq/n:

В частности, есть обобщенное неравенство Чебышева: неравенство Маркова – если СВ Х принимает только неотрицательные значения и М(Х), то для любого «+»-го числа А верно неравенство:

Т.к. события x>A и х≤А противоположные, то заменяя выражение Р(x>A) выражением 1-Р(X≤A), придем к другой форме неравенства Маркова: Р(x≤A)≤1-[М(Х)^t/А^t].

Теорема Чебышева. Если Х₁,…, Х_n – попарно независимые СВ, причем дисперсии их равномерно ограничены (не превышают постоянного числа С), то, как бы мало ни было «+»-е число ε, вероятность неравенства равенства

будет как угодно близка к 1, если число СВ будет достаточно велико. Другими словами:

Таким образом, теорема Чебышева утверждает, что если рассматривается достаточно большое число независимых СВ, имеющих ограниченные дисперсии, то почти достоверным можно считать событие, состоящее в том, что отклонение среднего арифметического СВ от среднего арифметическогого их матожиданий будет по абс. величине сколь угодно малым.

Сущность теоремы заключается в том, что отдельные СВ могут иметь значительный разброс, а их среднее арифметическое рассеяно мало. Среднее арифметическое достаточно большого числа независимых СВ (дисперсии которых равномерно ограничены) утрачивает характер СВ.

Также эта теорема устанавливает связь между средним арифметически наблюдаемых значений СВ и ее M(X).

Рассмотрим СВ Х с M(X) и D(X). Над этой величиной производится n независимых опытов и вычисляется сред. арифм. всех наблюдаемых значений СВ. Требуется найти числовые характеристики сред. арифм.

Само сред. арифметическое:

20. Следствия закона больших чисел (см. вопр. 19 ): теоремы Бернулли и Пуассона.

Закон больших чисел:

В шир. – при большом числе СВ их средний рез-т перестает быть случайным и м.б. предсказан с большой ст. определенности

В узком – ряд матем. теорем, в каждой из которых для тех или иных условий устанавливается факт приближения средних хар-к большого числа испытаний к некот. определенным постоянным.

Пусть мы производим n независимых опытов, в каждом может появиться некоторое событие А, вероятность которого в каждом опыте равна p.

Теорема Бернулли: при неограниченном увеличении числа опытов n частость события А сходится по вероятности к его вероятности в отд. испытании, т.е.

Смысл т.Бернулли состоит в том, что при большом числе n повторных независимых испытаний практически достоверно, что частость события m/n – величина случайная, как угодной мало отличается от неслучайной величины p – вероятности события, т.к. практически перестает быть случайной.

Замечание. Т.Бернулли является следствием теоремы Чебышева, ибо частость события можно представить как сред. арифм. n независимых альтернативных СВ, имеющих один и тот же закон распределения.

(!) Т.Бернулли дает теоретическое обоснование замены неизвестной вероятности события его частостью, полученной в n повторных испытаниях, проводимых при одном и том же комплексе условий. Например, если P_A рождения мальчика неизвестна, то в качестве ее значения мы можем принять частость этого события.

Непосредственным обобщением т.Бернулли является т.Пуассона, когда вероятности события в каждом испытании различны.

Теорема Пуассона. Частость события в n повторных независимых испытаниях, в каждом из которых оно может произойти соответственно с вероятностями p₁,…,p_n, при неограниченном увеличении числа n сходится по вероятности к средней арифметической вероятностей события в отдельных испытаниях, т.е.:

Важная роль закона больших чисел в теоретическом обосновании методов матстатистики и ее приложений обусловила проведение ряда исследований, направленных на изучение общих условий применимости этого закона к последовательности СВ.

Например, тем-ра t воздуха в Москве X_i (i=1,…,365) каждый день года – величины случайные, подверженные существенным колебаниям в течение года, причем зависимые, т.к. на погоду каждого дня, очевидно, заметно влияет погода предыдущих дней. Однако среднегодовая тем-ра почти не меняется для Москвы в течение многих лет, являясь практически неслучайной, предопределенной.

Нахождение общих условий, выполнение которых обязательно влечет за собой статистич. устойчивость средних, представляет собой научную ценность исследований в области закона больших чисел.

21. Центральная предельная теорема и особая роль нормального распределения. Формулы для практического применения теории вероятностей (интегральная теорема Муавра-Лапласа).

Предельные законы распределения составляют предмет группы теорем под названием «Центральная предельная теорема», которую иногда называют «количественной формой закона больших чисел». Все формы ЦПТ посвящены установлению условий, при которых возникает НЗР. Так как эти условия на практике весьма часто выполняются, НЗР является самым распространенным из законов распределения, наиболее часто встречающимся в случайных явлениях природы. Он возникает во всех случаях, когда исследуемая СВ м.б. представлена в виде сумма достаточно большого числа независимых (или слабо зависимых) элементарных слагаемых, каждое из которых в отдельности сравнительно мало влияет на сумму.

Наиболее простой формой ЦПТ является следующая:

Если Х1, Х2, …, Хn – независимые СВ, имеющие один и тот же закон распределения с матожиданием m и дисперсией σ², то при неограниченном увеличении n закон распределения суммы Y_n=Σⁿ_k₌₁X_k неограниченное приближается к нормальному.

Центральная предельная теорема – если СВ Х представляет собой сумму очень большого числа взаимно независимых случайных величин, влияние каждой из которых на всю сумму ничтожно мало, то Х имеет распределение, близкое к нормальному.

Теорема Ляпунова. Если X₁,…, X_n - независимые СВ, у каждой из которых существует M(X_i)=а, D(X_i)=σ², абсолютный центральный момент третьего порядка M(|X_i-a_i|³)=m_i и , то закон распределения суммы Y_n= X₁+…+ X_n при n→∞ неограниченно приближается к нормальному с матожиданием и дисперсией .

В практических задачах часто применяют ЦПТ для вычисления вероятности того, что сумма нескольких СВ окажется в заданных пределах.

Пусть X1, X2, …, Xn – независимые СВ с матожиданиями m₁, … m_n, и дисперсиями D₁,… D_n,. Предположим, что условия ЦПТ выполнены (величины X1, X2, …, Xn сравнимы по порядку своего влияния на рассеивание суммы) и число слагаемых n достаточно для того, чтобы закон распределения величины Y_n=Σⁿ_k₌₁X_k можно было бы считать нормальным.

Тогда вер-ть того, что СВ У попадет в пределы участка (α;β):

Таким образом, для того, чтобы приближенно найти вероятность попадания суммы большого числа СВ на заданный участок, не требуется знать законы распределения этих величин; достаточно знать лишь их характеристики. Разумеется, это относится только к случаю, когда выполнено основное условие ЦПТ – равномерно малое влияние слагаемых на рассеивание суммы.

Частный случаем ЦПТ для дискретных СВ – теорема Лапласа:

Если производится n независимых опытов, в каждом из которых событие А появляется с вероятностью p, то справедливо соотношение:

Где Y – число появлений события А в n опытах, q=1-p.

Интегральная теорема Муавра-Лапласа. Если p наступления события А в каждом испытании постоянная и отлична от 0 и 1, то Р_А, что число m, наступления события А в n независимых испытаниях заключено в пределах от a до b (включительно), при достаточно большом числе n прибл. равна:

, где – функция (или интеграл вероятностей) Лапласа;

Вышеуказанная формула – ф-ла Муавра-Лапласа. Чем больше n, тем она точнее. При выполнении условия npq≥20 она дает, как правило, удовл-ю для практики погрешность вычисления вер-тей.

Свойства функции:

1. Ф(х) – четная, т.е. Ф(-х)=Ф(х)

2. Ф(х) – монотонно возрастающая, причем при х→+∞ Ф(х)→1 (практически можно считать, что уже при x>4 Ф(х)~4)

Следствие интегральной теоремы Муавра-Лапласа:

Если p наступления события А в каждом испытании постоянна и отлична от 0 и 1, то при достаточно большом числе n независимых испытаний Р_а, что:

а) число m наступлений события А отличается от произведения np не более, чем на величину ε>0 (по абсолютной величине), т.е.

б) частость m/n события А заключается в пределах от α до β (вкл)

, где

в) частость m/n события А отличается от его p не более, чем на величину ∆>0 (по абс. величине):

Основные понятия математич. статистики. Простая статистическая совокупность. Статистическая функция распределения. Статистический ряд. Полигон. Гистограмма.

Разработка методов регистрации, описания и анализа математических экспериментальных данных получается в результат наблюдения массовых случайных явлений, составляющих предмет математической статистики (МС).

Основные задачи МС:

1) Определение закона распределения СВ по стат.данным

2) Проверка правдоподобности гипотезы

3) Нахождения неизв-х параметров равномерного распределения

Современную МС определяют как науку о принятии решений в условиях неопределенности. Главная задача МС состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

Предположим, что СВ Х производит ряд опытов с целью определения либо закона ее распределения (заранее неизвестного), либо с целью проверки гипотезы о законе распределения. В каждом из опытов СВ Х принимает определенное значение – варианту. Причем последовательность x₁,…x_n значений СВ Х (где x₁<…<x_n) получена в результате ранжирования (операции расположения СВ по возрастанию).

№ опыта х

3,1

3,2

Совокупность вариант представляет первичный стат. материал и называется простой стат. совокупностью или статистическим рядом.

Обычно эти данные представлены в виде таблицы. На их основе строится функция распределения.

Стат. функция распределения представляет собой ступенчатую функцию. Величина скачка данной функции – частота события при неограниченном числе опытов. Частота событий будет стремиться к подлинной.

Стат. ф-я распределения – функция F*(x), определяющая для каждого значения х относительную частоту события Х<x. F*(x)=n_x/n, где n_x - число вариант, меньших х, n – объем выборки.

Свойства стат. ф-и распределения:

1) значения функции принадлежат отрезку [0;1]

2) F*(x) – неубывающая функция

3) если х₁ – наименьшая варианта, то F*(x)=0 при x≤x₁; если х_k – наибольшая варианта, то F*(x)1 при x>x_k.

Пример. Построить функцию F*_n(x), если

x_i

p_i* 0,1 0,2 0,1 0,1 0,2 0,3

Выборочная совокупность (выборка) – совокупность случайно отобранных объектов.

Генеральная совокупность – совокупность объектов, из которых производится выборка.

Объем совокупности – число объектов это совокупности.

Числа n_i, показывающие сколько раз встречаются варианты x_i в ряде наблюдений, называются частотами, а отношение их к объему выборке – частостями, т.е. p*_i=n_i/n.

Для наглядности стат.распределение изображается графически в виде полигона и гистограммы. Полигон, как правило, служит для изображения дискретного (т.е. варианты отличаются на постоянную величину) стат. ряда.

Полигон частот – ломаная, отрезки которой соединяют точки с координатами (x₁,n₁),…,(x_k,n_k); полигон частостей (на рис.) – с координатами (x₁,p₁*),…,(x_k,p_k*). Варианты откладываются на оси абсцисс, а частоты и частости – на оси ординат.

Полигон является стат. аналогом многоугольника распределения (см. вопрос 7).

Для непрерывного распределения признака (т.е. варианты могут отличаться на сколь угодно малую величину) можно построить полигон частот, взяв середины интервалов в качестве значений

x₁,…,x_k. Гистограммая частот (частостей) – ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длины h, а высоты равны отношению n_i/n. Плотность частоты – n_i/h, частости – p_i*/h.

Площадь гистограммы частот = объему выборки, частностей = 1.

Гистограмма частостей:

Гистограмма частот является стат.аналогом дифференциала функции распределения (плотности) f(x) СВ Х. Сумма площадей прямоугольников равна 1: h*p₁^*/h + … + p_i*/h = p_i* + … + p_i* = 1, что соответствует условию для плотностей вероятностей f(x) (см. вопрос 11)

Если соединить середины верхних оснований прямоугольников с отрезками прямой, то получим полигон того же распределения.

Точечные оценки параметров распределения. Требования, предъявляемые к точечным оценкам. Оценки для М(Х), D(X) и СДО.

Большинство практических задач, которые решает статистика, состоит в оценивании некоторого количественного признака генеральной совокупности (совокупности объектов, явлений или процессов, из которых производится выборка). Предположим, что исследователю удалось установить, какому именно закону распределения подчиняется изучаемый количественный признак. В этом случае необходимо оценить параметры, которыми определяется предполагаемое распределение. Например, если удалось установить, что количественный признак подчиняется показательному закону распределения вероятностей, тогда необходимо оценить параметр λ, которым определяется данное распределение.

Предположим, что имеются данные выборки, например, значения количественного признака x₁, x₂, …, x_n, полученные в результате n наблюдений. Будем рассматривать x₁, x₂, …, x_n как независимые СВ Х ₁, Х ₂, …, Х _n.

Статистическая оценка неизвестного параметра теоретического распределения – это функция от наблюдаемых случайных величин.

Таким образом, определить статистическую оценку неизвестного параметра теоретического распределения, значит, определить функцию от наблюдаемых СВ Х ₁, Х ₂, …, Х _n, которая дает приближ. значение оцениваемого параметра.

Для того чтобы статистические оценки θ_i можно было бы принять за оценки параметров θ_i, необходимо и достаточно, чтобы оценки θ_i удовлетворяли трем статистическим свойствам: несмещенности, состоятельности и эффективности.

θ_i называется несмещенной оценкой для параметра θ_i, если ее выборочное матожидание равно оцениваемому параметру генеральной совокупности. М(θ_i) = θ_i, М(θ_i) – θ_i = φ_i, где φ_i, - это смещение оценки.

Смещенная оценка – это оценка параметра, чье матожидание не равно оцениваемому параметру, т.е. М(θ_i)≠θ_i, φ_i≠0.

θ_i является состоятельной оценкой для параметра θ_i, если она удовлетворяет закону больших чисел. Закон больших чисел гласит о том, что с увеличением выборки значение оценки θ_i стремится к значению параметра θ_i генеральной совокупности: Р(| θ_i – θ_i |<ε) → 1 при n → ∞.

Для определения состоятельности оценки достаточно выполнения двух условий:

1) φ_i=0 или φ_i→0 при n→∞ - смещение оценки равно нулю или стремится к нему при объеме выборки, стремящейся к бесконечности.

2) D(θ_i) →0 при n→∞ - дисперсия оценки параметра θ_i стремится к нулю при объеме выборки, стремящемся к бесконечности.

θ_i является эффективной оценкой для параметра θ_i, если статистическая оценка θ_i имеет наименьшую возможную дисперсию при заданном объеме выборки n.

Точечные оценки параметров распределения:

Рассмотрим выборку x=(x₁, x₂, …, x_n) значений генеральной совокупности Х. Пусть М(Х)=а, D(X)=σ² генеральная средняя и дисперсия совокупности.

В качестве оценки для М(Х) используется выборочная средняя (средняя арифметическая выборки): . Выборочная средняя является несмещенной и состоятельной оценкой генеральной средней.

Для того, чтобы наблюдать рассеяние количественного признака значений выборки вокруг своего среднего значения, вводят сводную характеристику – выборочную дисперсию.

В качестве оценки для D(Х) используется выборочная дисперсия: . Вычисление дисперсии можно упростить, используя формулу: S²= x² - (x)².

Для характеристики рассеивания значений признака выборки вокруг своего среднего значения пользуются сводной характеристикой – средним квадратическим отклонением.

Выборочным средним квадратическим отклонением называют кв.корень из выборочной дисперсии: σ _x =√σ _x ².

x является несмещенной, состоятельной и эффективной оценкой для М(Х), причем σ _Х ²=σ²/n.

M(S²)=(n-1)/n*D(X), т.е. оценка S² является смещенной. Чтобы избавиться от этого недостатка, для оценки неизвестной дисперсии генеральной совокупности пользуются исправленной несмещенной оценкой:

При больших n (n>30) неизвестные параметры в формулах для дисперсии можно заменить на их выборочные без особой погрешности.

24. Метод моментов для получения точечных оценок. Выравнивание статистических рядов.

Метод моментов для нахождения точечных оценок неизв. параметров заданного распределения состоит в приравнивании теоретических моментов распределения соответствующим эмпирическим моментам, найденным по выборке.

Так, если распределение зависит от одного параметра (например, задан вид плотности распределения f(х,0)), то для нахождения его оценки надо решить относительно θ одно ур-е: М(Х)= θ _В ( есть функция от θ).

Если распределение зависит от двух параметров (например, вид плотности распределения f(x,θ₁,θ₂)) – надо решить относительно θ₁и θ₂ систему уравнений:

И, наконец, если надо оценить n параметров θ₁, θ₂, …, θ_n, - надо решить одну из систем вида:

Метод моментов является наиболее простым методов оценки параметров. Оценки метода моментов обычно состоятельны, однако их эффективность часто значительно меньше единицы.

Пример. Найти оценки параметров СВ X~N(a,σ²).

Требуется по выборке x₁,…,x_n найти точечные оценки неизвестных параметров a=M(X)=θ₁ и σ²=D(X)=θ₂.

По методу моментов приравниваем их соответственно к выборочному среднему и выборочной дисперсии (α₁=М(Х) – нач. момент 1 порядка, µ₂=D(X) – центр. момент 2 порядка). Получаем

Таким образом, искомые оценки параметров: θ₁ =х_В и θ₂ =√D_В.

⇐ Предыдущая 1 2 345 6 Следующая ⇒

Поделиться:

Познавательные статьи:

Алгоритмические операторы Matlab

Конструирование и порядок расчёта дорожной одежды

Исследования учёных: почему помогают молитвы?

Почему терпят неудачу многие предприниматели?

Последнее изменение этой страницы: 2016-08-16; просмотров: 436; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.118.166.80 (0.017 с.)