Эмпирическая функция распределения 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Эмпирическая функция распределения



Пусть пх — число наблюдений, при которых значение признака X меньше х.    При объеме выборки, равном п, относитель­ная частота события X < x равна nх/n.

Определение 8. Функция F *(x) = nx / n, (15.49)

определяющая для каждого значения х относительную частоту события X < х, называется эмпирической функцией распреде­ления или функцией распределения выборки.

В отличие от эмпирической функции распределения F *(x) выборки функция распределения F (x) генеральной совокупно­сти называется теоретической функцией распределения. Раз­личие между ними состоит в том, что функция F (x) опреде­ляет вероятность события X < х, a F *(x) — относительную частоту этого события. Из теоретических результатов общей теории вероятностей (закон больших чисел) следует, что при больших п вероятность отличия этих функций друг от друга близка к единице:

Нетрудно видеть, что F *(x) обладает всеми свойствами F (x), что вытекает из ее определения (15.49):

• значения F *(х) принадлежат отрезку [0,1];

F *(x) является неубывающей функцией;

• если х1 — наименьшая варианта, то F *(x) = 0 при х ≤ x 1;

• если хк — максимальная варианта, то F *(x) = 1 при х > хк.

Сама же функция F *(x) служит для оценки теоретической функции распределения F (x) генеральной совокупности.

Пример 3. Построить эмпирическую функцию по заданному распределению выборки:

Решение. Находим объем выборки: п = 10 + 15 + 25 = 50. Наименьшая варианта равна 2, поэтому F *(x) = 0 при х ≤ 2. Значение X < 4 (или х1 = 2) наблюдалось 10 раз, значит, F (x) = 10/50 = 0,2 при 2 < х < 4. Значения X < 6 (а именно х1 = 2 и x2 = 4) наблюдались 10 + 15 = 25 раз, значит, при 4 < x < 6 функция F *(x) = 25/50 = 0,5. Поскольку X = 6 – максимальная варианта, то F *(x)= 1   при х> 6. Напишем формулу искомой эмпирической функции:

График этой функции показан на рисунке 15.8

Полигон и гистограмма

Каждую пару значений i, ni) из распределения выбор­ки можно трактовать как точку на координатной плоскости. Точно так же можно рассматривать и пары значений (xi, Wi) относительного распределения выборки.                       Ломаная, отрезки ко­торой соединяют точки (х i, ni), называется полигоном частот.

Ломаная, соединяющая на координатной плоскости точки (xi, Wi), называется полигоном относительных частот. На рис. 15.9 показан полигон относительных частот для распре­деления, приведенного в примере 2.

Для случая непрерывного признака X удобно разбить ин­тервал (xmin, xmax) его наблюдаемых значений на несколько ча­стичных интервалов длиной h каждый и найти для каждого из этих интервалов сумму частот nj, попавших в него.

Сту­пенчатая фигура, состоящая из прямоугольников с основания­ми длиной h и высотами nj / h (плотность частоты), называет­ся гистограммой частот. Геометрический смысл гистограммы: нетрудно видеть, что площадь ее равна сумме всех частот или объему выборки. На рис. 15.10 изображена гистограмма объе­ма п = 100.

 Аналогичным образом определяется и гистограмма отно­сительных частот; в этом случае высоты прямоугольников, составляющих ступенчатую фигуру, определяются отноше­ниями сумм относительных частот, попадающих в интервал  к длине интервала h, т.е. вели­чинами Wj / h. Нетрудно видеть, что площадь гистограммы относительных частот равна единице (сумме относительных частот выборки).



Поделиться:


Последнее изменение этой страницы: 2020-10-24; просмотров: 95; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.139.83.7 (0.007 с.)