Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь FAQ Написать работу КАТЕГОРИИ: АрхеологияБиология Генетика География Информатика История Логика Маркетинг Математика Менеджмент Механика Педагогика Религия Социология Технологии Физика Философия Финансы Химия Экология ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Эмпирическая функция распределенияСодержание книги Похожие статьи вашей тематики
Поиск на нашем сайте
Пусть известно статистическое распределение частот количественного признака Х. Введем обозначения: ─ число наблюдений, при которых наблюдалось значение признака, меньше х; n – общее число наблюдений (объем выборки). Ясно, что относительная частота события Х<х равна . Если х изменяется, то, вообще говоря, изменится и относительная частота, то есть относительная частота есть функция от х. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической. Определение. Эмпирическая функция распределения (функция распределения выборки) – функция F*(x), определяющая для каждого значения х относительную частоту события X<x. , где ─ число вариант, меньших х; n – объем выборки. Например, для того чтобы найти F*(x2), надо число вариант, меньших x2, разделить на объем выборки: . В отличие от эмпирической функции распределения выборки функцию распределения F(x) генеральной совокупности называют теоретической функцией распределения. Различие между эмпирической и теоретической функциями состоит в том, что теоретическая функция F(x) определяет вероятность события X<x, а эмпирическая функция F*(x) определяет относительную частоту этого же события. Из теоремы Бернулли следует, что относительная частота события X<x, то есть F*(x), стремится по вероятности к вероятности этого события, то есть к значению F(x). Другими словами, при больших значениях n числа F*(x) и F(x) мало отличаются одно от другого в том смысле, что . Уже отсюда следует целесообразность использования эмпирической функции распределения выборки для приближенного представления теоретической (интегральной) функции распределения генеральной совокупности. Такое заключение подтверждается и тем, что F*(x) обладает всеми свойствами F(x). Из определения функции F*(x) вытекают следующие ее свойства: 1) Значения эмпирической функции принадлежит отрезку [0; 1]; 2) F*(x) – неубывающая функция; 3) Если x1 ─ наименьшая варианта, то F*(x) = 0 при х < х1; если хk ─ наибольшая варианта, то F*(x) = 1 при х > xk. Итак, эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности. Пример. Построить эмпирическую функцию по данному распределению выборки:
Решение. Найдем объем выборки (сумма всех частот ni): n = n1 + n1 + n1 = 12 + 18 + 30 = 60. Наименьшая варианта равна 2 (x1 = 2), следовательно, F*(x) = 0 при х ≤ 2 (по свойству 3 функции F*(x)); значения, меньшие 6 (х<6), а именно x1 = 2, наблюдались n1 = 12 раз, следовательно, при 2<x≤6; значения х<10, а именно x1 = 2, x1 = 2 наблюдались n1 + n2 = 12 + 18 = 30 раз, следовательно при 6<х≤10. Так как х =10 – наибольшая варианта, то F*(x) = 1 при х>10 (по свойству 4 функции F*(x)). Искомая эмпирическая функция имеет вид: Ниже приведен график полученной эмпирической функции. На графике на соответствующих осях откладывают значения функции F*(x) и интервалы вариант
Рис. 5. График эмпирической функции. Полигон и гистограмма
Для наглядности строят различные графики статистического распределения, в частности, полигон и гистограмму. Определение. Полигоном частот называют ломаную, отрезки которой соединяют точки (x1, n1), (x2, n2), …, (xk, nk). Для построения полигона частот на оси абсцисс откладывают варианты xi, а на оси ординат – соответствующие им частоты ni. Точки (xi, ni) соединяют отрезками прямых и получают полигон частот. Определение. Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (x1, w1), (x2, w2), …, (xk, wk). Для построения полигона частот на оси абсцисс откладывают варианты xi, а на оси ординат wi. Точки (xi, wi) соединяют отрезками прямых и получают полигон относительных частот. На рисунке изображен полигон относительных частот следующего распределения:
Рис. 6. Полигон относительных частот. В случае непрерывного признака целесообразно строить гистограмму, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длинной h и находят для каждого частичного интервала ni – сумму частот вариант, попавших в i-ый интервал. Определение. Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению (плотность частоты). Рис. 7. Гистограмма частот. Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс, на расстоянии . Площадь i-го частичного прямоугольника равна = ─ сумме частот вариант i-го интервала; следовательно, площадь гистограммы частот равна сумме всех частот, то есть объему выборки n. На рисунке 2 изображена гистограмма частот распределения объема n=100, приведенного в таблице 1.
Определение. Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длинною h, а высоты равны отношению (плотность относительной частоты). Для построения гистограммы относительных частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии . Площадь i-го частичного прямоугольника равна = ─ относительной частоте вариант, попавших в i-й интервал. Следовательно, площадь гистограммы относительных частот равна сумме всех относительных частот, то есть единице. Примеры. 1. В результате выборки получена следующая таблица распределения частот. Построить полигоны частот и относительных частот распределения. Для начала построим полигон частот. Рис. 8. Полигон частот. Чтобы построить полигон относительных частот найдем относительные частоты, для чего разделим частоты на объем выборки n. n = 3 + 10 + 7 = 20. . Получаем
Построим полигон относительных частот. Рис. 9. Полигон относительных частот. 2. Построить гистограммы частот и относительных частот распределения. Найдем плотность частоты :
Построим гистограмму частот.
Рис. 10. Гистограмма частот.
Чтобы построить гистограмму относительных частот, нужно найти относительные частоты. Для этого найдем объем выборки n. . Теперь найдем относительные частоты : Получим:
Плотности частот нужно вычислить. При этом h = 3. Построим гистограмму относительных частот. Рис.11. Гистограмма относительных частот.
Точечные оценки
Определение. Статистической оценкой Q* неизвестного параметра Q теоретического распределения называют функцию f(x1, x2, …, xn) от наблюдаемых случайных значений x1, x2, …, xn. Определение. Точечной оценкой называют статистическую оценку, которая определяется одним числом Q* = f(x1, x2, …, xn), где x1, x2, …, xn ─ результаты n наблюдений над количественным признаком Х (выборка). Определение. Несмещенной называют точечную оценку Q*, математическое ожидание которой равно оцениваемому параметру Q при любом объеме выборки, то есть M(Q*) = Q. Смещенной называют точечную оценку, математическое ожидание которой не равно оцениваемому параметру. Выборочная средняя. Пусть для изучения генеральной совокупности относительно количественного признака Х извлечена выборка объема n. Определение. Выборочной средней называют среднее арифметическое значение признака выборочной совокупности. Если все значения x1, x2, …, xn признака выборки объема n различны, то Если же все значения признака x1, x2, …, xk имеют соответственно частоты n1, n2, …, nk, причем n1 + n2 + … + nk = n, то , где – объем выборки. Выборочная средняя является несмещенной оценкой генеральной средней (неизвестного математического ожидания). Замечание. Если первоначальные варианты ─ большие числа, то для упрощения решения целесообразно вычесть из каждой варианты одно и то же число С, то есть перейти к условным вариантам ui = xi – c. Тогда . Выборочная дисперсия. Смещенной оценкой генеральной дисперсии служит выборочная дисперсия. Эту величину вводят для того, чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг среднего значения . Определение. Выборочной дисперсией называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения . Если значения признака x1, x2, …, xk имеют соответственно частоты n1, n2, …, nk, причем n1 + n2 + … + nk = n, то Эта оценка является смещенной, так как , где DГ – генеральная дисперсия – среднее арифметическое квадратов отклонения значения признака генеральной совокупности от их среднего значения . Теорема. Выборочная дисперсия равна среднему квадратов значений признака минус квадрат выборочной средней. Для вычисления выборочной дисперсии эта формула наиболее удобна. Замечание. Если перейти к условным вариантам ui = xi – c, то дисперсия при этом не изменится. Тогда .
Оценка генеральной дисперсии по исправленной выборочной. Пусть из генеральной совокупности в результате n независимых наблюдений над количественным признаком Х извлечена повторная выборка объема n:
При этом n1 + n2 + … + nk = n. Требуется по данным выборки найти неизвестную генеральную дисперсию DГ. Если в качестве оценки DГ принять выборочную дисперсию, то эта оценка будет приводить к систематическим ошибкам, давая заниженное значение DГ. Объясняется это тем, что математическое ожидание выборочной дисперсии не равно оцениваемой DГ, а равно . Легко «исправить» выборочную дисперсию так, чтобы ее математическое ожидание было равно генеральной дисперсии. Достаточно для этого умножить на дробь n/(n–1). Сделав это, мы получим исправленную дисперсию, которую обычно обозначают . Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия: . Более удобна форма: . В условных вариантах она имеет вид: , причем если ui = xi – c, то ; если , то . Задача 1. Из генеральной совокупности извлечена выборка объемом n = 60 Найти несмещенную оценку генеральной средней. Решение. Несмещенной оценкой генеральной средней является выборочная средняя: , где ─ варианта выборки, ─ частота варианты ; объем выборки. . Ответ: . Задача 2.
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Последнее изменение этой страницы: 2016-04-26; просмотров: 4100; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.15.14.245 (0.012 с.) |