ТОП 10:

Построение эмпирической функции распределения и гистограммы



Полагая вероятность каждого значения равной 1/n, получим распределение выборки. Эмпирическая функция распределения или функция распределения выборки тогда будет определяться следующим образом:

, (1)

 

где - объем выборки, - число выборочных значений, меньших х.

При большом объеме выборку целесообразно предварительно подвергнуть группировке следующим образом.

Построить интервал, содержащий все выборочные значения, левый и правый концы этого интервала – приближенные (с малым числом значащих цифр) значения наименьшего и наибольшего элементов выборки, причем в первом случае приближение берется с недостатком, а во втором – с избытком.

Полученный интервал разделить на m равных частей (интервалов), заботясь при этом (для упрощения вычислений) о том, чтобы границы интервалов были числами с малым количеством значащих цифр.

Все расчеты удобно оформить в виде таблицы 2. Выбрав число интервалов

m = 20 (оно в процессе обработки может быть изменено), обозначим границы . Поместим значения границ в графу 2. Подсчитаем число элементов выборки, попавших в – й интервал. Может случиться, что отдельные значения совпадут со значениями границ некоторых интервалов.

 

Таблица 1

 

2,551 016 1,182 147 0,784 914 0,543 969 0,370 497
0,123 475 0,028 970 1,514 199 0,938 832 0,644 410
0,294 172 0,172 712 0,071 059 2,269 003 1,143 489
0,529 767 0,359 708 0,226 162 0,116 188 0,022 701
0,912 381 0,627 765 0,432 929 0,284 614 0,644 831
0,108 985 0,016 493 1,391 414 0,887 003 0,611 552
2,075 379 1,107 083 0,744 048 0,515 881 0,349 101
0,275 199 0,157 049 0,057 722 1,927 765 1,072 682
0,502 296 0,338 672 0,209 119 0,101 864 0,010 347
0,862 617 0,595 748 0,409 327 0,265 924 0,149 362
1,808 440 1,040 075 0,705 673 0,489 001 0,328 414
0,094 823 0,004 260 1,288 835 0,839 146 0,580 335
0,256 785 0,141 768 0,044 663 1,708 286 1,099 087
0,475 982 0,318 322 0,193 528 0,087 860 3,666 642
0,816 525 0,565 292 0,386 585 0,247 778 0,144 266
1,621 985 0,979 563 0,669 527 0,463 229 0,308 390
0,080 974 2,740 878 1,200 742 0,794 363 0,550 603
0,238 898 0,126 852 0,031 872 1,546 169 0,951 370
0,450 731 0,298 613 0,176 366 0,074 163 2,383 084
0,773 600 0,536 252 0,364 641 0,230 143 0,119 526
1,478 563 0,924 394 0,635 357 0,438 479 0,288 987
0,067 429 2,156 978 1,123 547 0,753 194 0,522 222
0,221 509 0,112 284 0,019 357 1,417 563 0,898 534
0,426 461 0,279 507 0,160 612 0,060 761 1,991 291
0,733 434 0,508 501 0,343 442 0,212 993 0,105 125
1,361 986 0,837 702 0,802 959 0,414 671 0,270 168
0,054 165 1,860 452 1,054 846 0,714 200 0,495 074
0,204 591 0,098 048 0,007 049 1,310 953 0,849 819
0,403 098 0,620 967 0,145 245 0,047 639 1,752 317
0,695 695 0,481 930 0,322 938 0,196 300 0,091 049
1,263 774 0,826 816 0,572 158 0,391 737 0,251 900
0,041 180 1,660 161 0,992 954 0,677 647 0,469 056
0,188 118 0,084 128 3,014 916 1,219 908 0,804 629
0,380 578 0,242 962 0,234 861 0,644 572 0,764 142
1,449 796 0,065 355 0,217 582 0,421 017 0,724 561
1,338 022 0,051 159 0,200 768 0,389 853 0,687 338
1,243 237 0,038 235 0,184 395 0,375 517 0,662 208
1,160 953 0,025 573 0,168 440 0,353 952 0,618 948
1,088 252 0,013 163 0,152 881 0,333 106 0,587 369
1,023 134 0,000 994 0,137 701 0,312 933 0,557 309

 


 

Таблица 2

 

№ п/п J (до объеди-нения (до объе-ди-не-ния)   J (после объеди-нения) (пос-ле объе-дине-ния)              
(0,000-0,185) (0,000-0,185) 0,252525 0,092500 0,023358 0,002161 0,000200 0,000018
(0,185-0,370) (0,185-0,370) 0,191919 0,277500 0,252525 0,653258 0,014779 0,004101 0,001138
(0,370-0,555) (0,370-0,555) 0,141414 0,462500 0,444444 0,665404 0,030249 0,013990 0,006470
(0,555-0,740) (0,555-0,740) 0,111111 0,647500 0,585858 0,071944 0,046584 0,030163 0,019530
(0,740-0,925) (0,740-0,925) 0,085859 0,832500 0,696969 0,071478 0,059505 0,049538 0,041240
  7 (0,925-1,110)   (1,110-1,295)     (0,925-1,295)     0,101010   1,110000   0,782228   0,112121   0,124454   0,138144   0,153340
(1,295-1,480) (1,480-1,665) (1,665-1,850)   (1,295-1,850)     0,070707   1,572500   0,883838   0,111187   0,174841   0,274937   0,432339
(1,850-2,035) (2,035-2,220) (2,220-2,405) (2,405-2,590) (2,590-2,775)     (1,850-2,775)         0,045454     2,312500     0,954545     0,105119     0,243072     0,562104     1,299866
(2,775-2,960) (2,960-3,145) (3,145-3,330) (3,330-3,515) (3,515-3,700)                  


В таких случаях поступают различными способами: а) уславливаются все такие элементы совокупности относить либо к правому, либо к левому интервалу; б) эти элементы учитываются и в левом и в правом интервале, полагая, что в каждый интервал попало по 1/2 элемента. Значения поместим в графу 3.

Интервалы, в которые попадает малое число элементов (концевые), рекомендуется объединить. Для построения гистограммы желательно, чтобы число элементов в каждом интервале было не меньше 10, а число интервалов не меньше 8. Уточненные границы интервалов поместим в графу 4, а число элементов, попавших в каждый интервал после уточнения границ, в графу 5.

Обозначим середины полученных интервалов через и поместим эти значения в графу 7.

Замечание. При малом объеме выборки в качестве будет выступать сами выборочные значения, которые поместим в графу 7. При этом графы 2-5

не заполняются.

Определим частоту попадания выборочных значений в -й интервал:

, (2)

где – число элементов, попавших в -й интервал, – объем выборки. Полученные значения поместим в графу 6. Их можно проверить, вычислив сумму частот , где – число уточненных интервалов. Эта сумма должна быть равна единице.

Замечание. При малом объеме выборки частота каждого выборочного значения постоянна и равна 1/n .

Эмпирическая функция распределения строится как функция распределения выборки , причем значение повторяется раз, раза

и т. д. (все элементы исходной выборки, попавшие в – й интервал, заменены на ).

Очевидно, что для всех

.

Таким образом, . (3)

Кроме того, при и при .

 

Значения можно поместить в графу 8. Пример графика эмпирической функции распределения представлен на рисунке 1. Доказано, что эмпирическая функция распределения, построенная по всей выборке, сходится по вероятности к функции распределения генеральной совокупности при . Но и эмпирическая функция распределения, построенная по группированной выборке, дает достаточно хорошее представление о функции распределения генеральной совокупности.

 

 

 


1,0

0,9

0,8

0,7

0,6

0,5

0,4

0,3

0,2

0,1

 

0,18 0,37 0,55 0,74 0,92 1,29 1,85 2,77

Рисунок 1

 

Если рассматривается выборка из генеральной совокупности значений непрерывной случайной величины, то можно для более наглядного представления о функции распределения генеральной совокупности построить ломаную, соединив точки (рис. 1, пунктирная линия).

Замечание. График эмпирической функции распределения можно построить непосредственно, взяв примерно двадцать идущих подряд элементов исходной (до упорядочения) выборки.

Гистограммастроится по группированной выборке следующим образом: над каждым интервалом (графа 4) строим прямоугольник, площадь которого равна частоте попадания в данный интервал, т. е. высота прямоугольника равна частоте, деленной на длину соответствующего интервала (рис. 2).

 

Н

 

0,18 0,37 0,55 0,74 0,92 1,29 1,85 2,77 х

Рисунок 2

 

Плавная кривая, проведенная по средним точкам верхних оснований прямоугольников гистограммы для выборки из генеральной совокупности значений

непрерывной случайной величины, дает представление о графике плотности распределения генеральной совокупности.

Замечание. При построении плавной кривой не следует стремиться проводить ее строго через средние точки оснований, так как число элементов, попадающих в каждый интервал, является случайным, и даже в том случае, когда исследуемая случайная величина строго следует закону распределения, характеризуемому плотностью вероятности , эти точки не совпадут точно с точками теоретической кривой.

 







Последнее изменение этой страницы: 2016-04-19; Нарушение авторского права страницы

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.206.194.161 (0.008 с.)