Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Статистическое распределение выборки

Поиск

Итак, мы хотим знать распределение признака Х в генеральной совокупности, нореально исследуем лишь некоторую выборку из нее.

В серии экспериментов, проводимых с выборкой, величина Х принимает определенные значения. Эти значения записанные для всех элементов выборки в том порядке, в котором они были получены в опытах, представляет собой простой статистический ряд. Каждое значение Х в полученном числовом ряду называют вариантой. Полученные данные и подлежат статистической обработке, статистическому анализу.

Первый шаг при обработке этого материала – наведение в нем определенного порядка, ведущего к получению статистического распределения выборки. Здесь возможны два основных способа: создание вариационного ряда или интервального ряда.

Рассмотрим вариационный ряд. Пусть некоторая выборка исследуется по количественному признаку Х, который представляет собой дискретную случайную величину. В имеющемся у нас простом статистическом ряду варианта х 1 встречается (повторяется) m 1 раз, х 2m 2 раза, … х кm краз, при этом , т.е. равна объему выборки. Далее по данным простого статистического ряда строится статистическоераспределение(в медицинской литературе – вариационный ряд), которое удобно представить в виде таблицы, включающей в себя:

1) различные по значению варианты xi, расположенные в определенной, ранжированной *, заранее выбранной последовательности (обычно в порядке возрастания);

2) mi – частоты вариант, т.е. числа наблюдений (повторений) варианты х i в простом статистическом ряду;

3) pi*= mi /n – относительные частоты вариант, т.е. отношения частот mi к объему выборки n; они являются выборочными (эмпирическими) оценками вероятностей появления значений хi.

Каждая относительная частота указывает долю общего объема выборки, приходящуюся на данное значение варианты хi.

Итак, для дискретной величины Х вариационный ряд статистическое распределение выборки – имеет следующий вид (табл. 1).

Таблица 1.

Варианта хi 1< х2< х3 … < хk) х1 х2 х3 xk Контроль  
Частота mi m1 m2 m3 mk
Относительная частота         …    

Напомним, что под распределением дискретной случайной величины в теории вероятностейпонимается соответствие между возможными значениями случайной величины и их вероятностями; в математической статистике – соответствие между наблюдаемыми вариантами х i и их частотами или относительными частотами.

Пример 1. Анализируемый показатель Х – срок лечения больного при некотором заболевании. Вариационный ряд – распределение больных по срокам лечения (объем выборки n = 26 больных) – имеет вид:

Таблица 2.

хi число дней лечения             контроль
mi число больных с данным сроком лечения (частота)            
рi* = – относительная частота 0,08 0,19 0,15 0,30 0,19 0,08

Полезность подобного представления данных очевидна по следующей причине: мы получаем практически важный результат – возможность оценить более и менее вероятные значения признака.

Интервальный ряд удобен тогда, когда количественный признак Х, характеризующий выборку, непрерывен, т.е. может принимать любые значения в некотором интервале. В этом случае статистическое распределение выборки (интервальный ряд) строится следующим образом. Область изменения признака (х максх мин) разбивают на несколько интервалов обычно равной ширины. Число интервалов k, как правило, не менее 5 и не более 25 и приближенно определяется следующими эмпирическими формулами:

k = , или k» 1 + 3,32 lg n,

где n – объем выборки.

Ширина интервалов одинакова и равна:

Δ x= h = .

Затем вычисляют границы интервалов: х мин = х0, х10 + h, х21 + h, х32 + h,…., х макс = хk. Поскольку некоторые варианты могут являться границей двух соседних интервалов, то, во избежание недоразумений, придерживаются следующего правила: к интервалу (a,b) относят варианты, удовлетворяющие неравенству a £ х < b.

Затем для каждого интервала подсчитывают частоты m i и (или) относительные частоты рi*=mi/n попадания вариант в данный интервал. Нередко используют также плотность относительной частоты:

= .

Данную величину можно считать выборочной (эмпирической) оценкой плотности вероятности.

Рассмотренное выборочное распределение непрерывной случайной величины Х – интервальный ряд – обычно представляется в виде таблицы, имеющей, в частности, следующий вид (табл. 3).

Таблица 3.

Интервал х0–х1 х1–х2 х2– х3 ... хk-1 – хk
Частота m i m1 M2 m3 ... mk
Относительная частота pi*=mi/n m1/n m2/n m3/n ... mk/n

Пример 2. Анализируемый показатель Х – массы тела новорожденного. Определение массы тела 100 новорожденных показало, что минимальная масса составляет 2,7 кг, максимальная – 4,4 кг. Интервал (2,7 – 4,4) кг разбиваем на 10 равных интервалов (k = =10) шириной h = = 0,17 кг и строим интервальный ряд (табл. 4):

 

Таблица 4.

Номер интервала                    
Интервал, масса тела, кг 2,7–2,87 2,87–3,04 3,04–3,21 3,21–3,38 3,38–3,55 3,55–3,72 3,72–3,89 3,89–4,06 4,06–4,23 4,23–4,4
Частота m i                    
mi/n = pi * 0,04 0,08 0,12 0,16 0,21 0,15 0,11 0,07 0,04 0,02
mi/nh 0,235 0,47 0,7 0,94 1,235 0,88 0,65 0,41 0,235 0,118

Контроль: k =10, mi =4+8+12+16+21+15+11+7+4+2=100= n (объем выборки), = 0,04+0,08+0,12+0,16+0,21+0,15+0,11+0,07+0,04+0,02 = 1.

Обобщим изложенный выше материал.

1. Если выборка исследуется по количественному признаку Х, который представляет собой дискретную случайную величину, то статистическим распределением выборки является вариационным статистический ряд – полученные значения признака, записанные в упорядоченном виде с указанием их частот и относительных частот.

2. Если выборка исследуется по количественному признаку Х, который представляет собой непрерывную случайную величину, то статистическим распределением выборки является интервальный статистический ряд. Он включает в себя интервалы вариант, частоты попадания вариант в эти интервалы, относительные частоты, при необходимости – плотности относительных частот для этих интервалов.



Поделиться:


Последнее изменение этой страницы: 2016-08-26; просмотров: 544; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.138.134.163 (0.006 с.)