Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Построение нормальной кривой по опытным данным

Поиск

 

Пусть дано статистическое распределение в виде последовательности интервалов и соответствующих им частот (относительных частот), которая имеет гистограмму, изображенную на рис. 31.

 

I (x0, x1) (x1, x2) ¼ (xn-2, xn-1) (xn-1, xn)
W W1 W2 ¼ Wn-1 Wn

 

Полагая , i = 1, 2, …, n, составим таблицу

 

Х x1 x2 ¼ xn-1 xn
W w1 w2 ¼ wn-1 wn

 

Нанесенные на гистограмму точки , , …, , где h - шаг таблицы, соединяем плавной кривой.

Если полученная плавная кривая близка к кривой Гаусса, то можно обработать статистические данные с помощью нормального закона распределения.

 

 

Один из способов построения нормальной кривой по данным наблюдений состоит в следующем:

1) находят и , например, по методу произведений;

2) находят ординаты yi (выравнивающие частоты) теоретической кривой по формуле

,

где , ;

3) строят точки (xi, yi) в прямоугольной системе координат и соединяют их плавной кривой.

Пример. Дано статистическое распределение

 

I (0, 3) (3, 6) (6, 9) (9,12) (12, 15) (15, 18) (18, 21) (21, 24) (24, 27) (27, 30)
nx                    

 

Показать, что оно близко к нормальному распределению, и построить график.

Решение. Здесь n = 50. Найдем середины интервалов и составим таблицу

 

х 1,5 4,5 7,5 10,5 13,5 16,5 19,5 22,5 25,5 28,5
nx                    

 

Так как математическое ожидание М(Х) = а и среднее квадратическое отклонение s(Х) = s неизвестны, то в качестве оценок этих параметров примем соответственно выборочную среднюю и выборочное среднее квадратическое отклонение. Найдем их по методу произведений.

 

           
xi ni ui ni ui ni ui2 ni(ui + 1)2
1,5   -4 -4    
4,5   -3 -9    
7,5   -2 -8    
10,5   -1 -6    
13,5     0 [-27]    
16,5          
19,5          
22,5          
25,5          
28,5     5 [52]    
  n = 50   = 205 = 305

 

Контроль: ,

.

Найдем условные эмпирические моменты первого и второго порядков

, .

Найдем шаг h = 10,5 - 7,5 = 3.

Отсюда

,

,

,

.

 

Составим расчетную таблицу

 

xi ni j(ui) h f(x)
1,5   -13,5 -2,288 0,0290 0,005 0,015
4,5   -10,5 -1,779 0,0818 0,014 0,042
7,5   -7,5 -1,271 0,1781 0,030 0,090
10,5   -4,5 -0,762 0,2989 0,051 0,153
13,5   -1,5 -0,254 0,3867 0,066 0,198
16,5   1,5 0,254 0,3867 0,066 0,198
19,5   4,5 0,762 0,2989 0,051 0,153
22,5   7,5 1,271 0,1781 0,030 0,090
25,5   10,5 1,779 0,0818 0,014 0,042
28,5   13,5 2,288 0,0290 0,005 0,015

 

Прежде чем построить кривую дадим пояснения по поводу последнего столбца таблицы. Выясним вероятностный смысл плотности распределения f(x)

Если F(x) функция распределения непрерывной случайной величины Х, то по определению f(x) = , или в иной форме

.

Разность F(x + Dx) - F(x), как уже известно, определяет вероятность того, что Х примет значение, принадлежащее интервалу (х, x + Dx). Таким образом, предел отношения вероятности того, что непрерывная случайная величина примет значение, принадлежащее интервалу (х, x + Dx), к длине этого интервала Dx (Dx ® 0) равен значению плотности распределения в точке х.

Итак, функция f(x) определяет плотность распределения вероятности для каждой точки х.

Из дифференциального исчисления известно, что приращение функции приближенно равно дифференциалу функции, то есть

или

.

Так как и dx = Dx, то

. (*)

Из (*) следует: вероятность того, что случайная величина примет значение, принадлежащее интервалу , приближенно равна (с точностью до бесконечно малых высшего порядка относительно Dx) произведению плотности вероятности в точке х на длину интервала Dx.

Итак, произведение в последнем столбце f(x) Dx = f(x) h определяет приближенно вероятность попадания Х в интервал Dx = h.

Теперь, используя данные таблицы, построим кривую по точкам

(xi, yi) в прямоугольной системе координат (рис. 32).

 
 

 

 


Сопоставим полученные результаты с вероятностями попадания случайной величины на данный участок, вычисляемый по формуле

,

где Ф(х) - функция Лапласа, значения которой табулированы в Приложении 2.

,

,

,

, ,

, ,

.

 

Из результатов расчетов следует, что h f(x)» P.

Составим таблицу относительных частот.

 

X 1,5 4,5 7,5 10,5 13,5 16,5 19,5 22,5 25,5 28,5
W 0,02 0,06 0,08 0,12 0,22 0,2 0,14 0,1 0,04 0,02

 

Сравнивая значения W и hf(x) (или W и P), убеждаемся в том, что заданное статистическое распределение можно считать подчиненным нормальному закону.


Элементы теории корреляции

 

 

Во многих задачах требуется установить и оценить зависимость изучаемой случайной величины Y от одной или нескольких других величин.

Две случайные величины могут быть связаны либо функциональной зависимостью, либо зависимостью другого рода, называемой статистической, либо быть независимыми.

Строгая функциональная зависимость реализуется редко, так как обе величины или одна из них подвержены еще действию случайных факторов, причём среди них могут быть и общие для обеих величин (под «общими» здесь подразумеваются такие факторы, которые воздействуют и на Y и на Х). В этом случае возникает статистическая зависимость.

Например, если Y зависит от случайных факторов z1, z2, v1, v2, а Х зависит от случайных факторов z1, z2, u1, то между Y и Х имеется статистическая зависимость, так как среди случайных факторов есть общие, а именно: z1 и z2.

Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения другой. В частности, статистическая зависимость проявляется в том, что при изменении одной из величин изменяется среднее значение другой; в этом случае статистическую зависимость называют корреляционной.

Приведем пример случайной величины Y, которая не связана с величиной Х функционально, а связана корреляционно. Пусть Y - урожай зерна, Х - количество удобрений. С одинаковых по площади участков земли при равных количествах внесенных удобрений снимают различный урожай, то есть Y не является функцией от Х. Это объясняется влиянием случайных факторов (осадки, температура воздуха и др.). Вместе с тем опыт показывает, что средний урожай является функцией от количества удобрений, то есть Y связан с Х корреляционной зависимостью.

Корреляционная зависимость между двумя случайными величинами может быть как линейной, так и нелинейной.

Линейная регрессия

 

Пусть Х и Y - зависимые случайные величины. Представим одну величину как функцию другой. Так как среди различных видов корреляционных зависимостей наиболее важными являются линейные, то мы ограничимся приближенным представлением величины Y в виде линейной функции величины Х, то есть

, (1)

где a и b - параметры, подлежащие определению.

Параметры a и b можно определить различными способами. Наиболее распространенный - метод наименьших квадратов.

Функцию называют наилучшим приближением Y в смысле метода наименьших квадратов, если математическое ожидание принимает наименьшее возможное значение. В этом случае функцию g(X) называют среднеквадратической регрессией Y на Х.

Имеет место следующая теорема.

Теорема. Линейная средняя квадратическая регрессия Y на Х имеет вид

, (2)

где mx = M(X), my = M(Y), , .

Величина rxy называется коэффициентом корреляции величин Х и Y. Коэффициент корреляции равен

,

где mху - корреляционный момент случайных величин Х и Y, равный математическому ожиданию произведения отклонений этих величин, то есть

.



Поделиться:


Последнее изменение этой страницы: 2016-04-23; просмотров: 713; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.227.114.218 (0.007 с.)