Расчет графика плотности вероятности нормального закона




ЗНАЕТЕ ЛИ ВЫ?

Расчет графика плотности вероятности нормального закона



Класс содержаний х, % n у Произведения t f(t) nт Значения
2 3 4
30-32 -5 -10 -250 -2,20 0,0355 2,1  
32-34 -4 -24 -376 -1,80 0,0790 4,6 0,252
34-36 -3 -27 -243 -1,41 0,1476 8,6 0,019
36-38 -2 -28 -112 -1,01 0,2396 13,9 0,001
38-40 -1 -20 -20 -0,62 0,3292 19,1 0,042
40-42 -0,22 0,3894 22,6 0,255
42-44 0,17 0,3932 22,8 0,142
44-46 0,57 0,3391 19,7 0,370
46-48 0,96 0,2516 14,6 0,175
48-50 1,38 0,1582 9,2 0,070
50-52 1,75 0,0863 5,0 0,000
52-54 2,15 0,0396 2,3 1,012
54-56 2,55 0,0154 0,9  
                     
                     
Сумма 2,5037 145,4 c2 = 2,338
Среднее 0,56 6,80 14,33 1323,3
   
Примечание. n – частота фактическая; у – условный номер класса; t – нормированные значения; f(t) – плотность вероятности; nт – частота теоретическая.
                       

 

Сумма плотностей вероятности, равная 2,5037, близка к среднеквадратичному отклонению sу = 2,53. Если продолжить кривую плотности вероятности за пределы графика (рис.2.13), то сумма будет точно равна sу.

Чтобы перейти от плотности вероятности к теоретической частоте nт, применяется формула


(2.36)

Здесь N = 147 (суммарное число измерений); h – размер (шаг) класса.

Поскольку в качестве аргумента взят номер класса у, шаг h = 1, sу = 2,53. Следовательно,

Такое же соотношение получится, если в качестве аргумента взять случайную величину х. Из табл.2.5 имеем h = 2, s = 5,06, и отношение h/s не изменится. Сумма теоретических частот 145,4 близка к общему числу значений N = 147. Продолжив кривую за пределы графика, можно убедиться, что суммы теоретических и фактических частот совпадут.

Сравнение фактических и теоретических частот в табл.2.13 показывает их сходство. Можно совместить частоты на одном графике, построив гистограмму по фактическим частотам n, а кривую плотности вероятности – по теоретическим частотам nт (рис.2.13).

Последняя графа табл.2.13 позволяет рассчитать критерий c2:

(2.40)

где Nk – число классов сравнения частот.

Чтобы избежать грубых случайных расхождений, рекомендуется объединять соседние классы с малым числом фактических частот. В табл.2.13 объединены два первых и два последних класса. В результате число классов Nk = 11. Вычисленное значение c2 = 2,338. Приняв вероятность a = 0,05 и зная число степеней свободы k = 11 – 3 = 8, из табл.2.11 найдем предельное значение = 15,51. Так как c2 < , то следует признать, что с вероятностью p > (1 – a) = 0,95 распределение фактических частот не противоречит нормальному закону. Такая же проверка соответствия фактических частот теоретическим может быть выполнена для других законов распределения.

Возможен и другой способ проверки соответствия, но только нормальному закону. Он основан на том, что асимметрия и эксцесс нормального закона равны нулю. Оценивая степень отклонения фактических значений асимметрии и эксцесса от нуля с помощью какого-либо критерия, можно сделать заключение о соответствии или несоответствии распределения случайной величины нормальному закону. Обычно используется критерий распределения Стьюдента (см. табл.2.10), а при большом числе исходных данных – критерий нормального закона (см. табл.2.7). Проверяют две гипотезы: при числе степеней свободы k = n – 1 асимметрия А = 0 и эксцесс Е = 0. Согласно формуле (2.24) имеем

(2.41)

или проще , , где sА = , sЕ = . Если tA и tЕ будут меньше предельного значения tпр, то распределение случайной величины не противоречит нормальному закону. Если tA или tЕ больше предельного значения tпр, то распределение противоречит нормальному закону. В качестве предельного значения можно брать tпр = 3, что соответствует вероятности q = 0,997 (см. табл.2.6). Иногда вероятность принятия решения задается (например, q = 0,95), тогда tпр определяют по табл.2.7 (tпр = 1,96).

В рассматриваемом примере асимметрия и эксцесс рассчитаны по табл.2.5: А = 0,166; Е = –0,269 (см. пример 2.2). Вычислим sА = = 0,202; sЕ = = 0,404, тогда tA = 0,166/0,202 = 0,82; tЕ = 0,269/0,404 = 0,67. При вероятности q = 0,95 имеем tпр = 1,96. Так как tA и tЕ меньше tпр, то еще раз получаем подтверждение того, что распределение содержаний не противоречит нормальному закону.

Аналогичным способом можно проверить соответствие распределения случайной величины логнормальному распределению, оперируя с логарифмами значений случайной величины.

Критерии tA и tЕ не требуют построения гистограммы, их удобно использовать при любом числе значений случайной величины, но область их применения ограничена нормальным и логнормальным законами. Критерий c2 более универсален, его можно использовать для сравнения гистограмм с любыми законами распределения.

Возникает вопрос, с какой целью производится проверка гипотез о законах распределения. Ответ заключается в том, что при статистической обработке значений случайной величины нужно знать вероятность (т.е. надежность) принятия решений, а вероятность можно определить лишь тогда, когда известен закон распределения случайной величины.

 

2.2.8. Преобразование случайной величины

 

Большинство решений, принимаемых на базе статистических закономерностей, основано на нормальном законе распределения, играющем универсальную роль. Как было отмечено, при определенных условиях к нему приближаются логнормальный закон, распределение Стьюдента, распределение χ2 и многие другие. Однако реальное распределение свойств геологических объектов часто отличается от нормального, что вызывает затруднения в принятии решений и в оценке достоверности получаемых выводов. Поэтому принятию решений обычно предшествует проверка соответствия распределения случайной величины нормальному закону, и, если соответствия нет, то можно попытаться преобразовать случайную величину, приведя ее распределение к нормальному. Подобное преобразование применялось выше, когда вместо случайной величины х вводилась новая случайная величина z = lnx. В результате асимметричное логнормальное распределение преобразовывалось в симметричное нормальное.

Представляют интерес такие преобразования, которые превращают произвольно распределенную случайную величину х в случайную величину z, распределение которой близко к нормальному. Задача заключается в подборе наилучшей функции преобразования.

Преобразование обычно меняет область существования случайной величины. Например, если случайная величина х меняется в пределах от нуля до +¥, то преобразованная случайная величина z = lnx имеет область существования от –¥ до +¥. Поэтому учет области существования случайной величины может помочь в выборе наилучшего преобразования.

Если случайная величина x имеет область существования от a до b, то преобразование

(2.42)

меняет пределы ее существования от –¥ до +¥, что во многих случаях эффективно. Частным случаем является ситуация, когда а = 0, b = 1 = 100 % (например, содержание химических элементов не может быть меньше нуля и больше 100 %), и формула преобразования имеет вид

. (2.43)

Если значения случайной величины х очень малы, то ею в знаменателе можно пренебречь, и получается формула z = lnx, лежащая в основе логнормального распределения. Наоборот, если значения х близки к единице, то получается формула преобразования в правоасимметричное логнормальное распределение z = –ln(1 – x).

Если случайная величина колеблется в пределах от –1 до +1 (например, коэффициент корреляции или многие тригонометрические функции), то эффективным является преобразование

(2.44)

или преобразование, предложенное Фишером

(2.45)

Для преобразования могут быть использованы также степенные функции вида z = xa или z = xa, где а может принимать значения от 1/2 до 3 [2].

 

8Пример 2.5. Рассмотрим подбор функции преобразования для случайной величины х с асимметричным распределением (табл.2.14).

 

Таблица 2.14

Подбор функции преобразования случайной величины х

(содержание TiO2 в магнетите)

 

Номер пробы n Исходная случайная величина х Преобразованные случайные величины Вероятность p Квантиль t
lnx
0,04 0,2000 -3,219 0,025 -1,960
0,06 0,2449 -2,813 0,075 -1,440
0,07 0,2646 -2,659 0,125 -1,150
0,08 0,2828 -2,526 0,175 -0,935
0,09 0,3000 -2,408 0,225 -0,755
0,09 0,3000 -2,408 0,275 -0,598
0,10 0,3162 -2,303 0,325 -0,454
0,12 0,3464 -2,120 0,375 -0,319
0,13 0,3606 -2,040 0,425 -0,189
0,14 0,3742 -1,966 0,475 -0,063
0,16 0,4000 -1,833 0,525 0,063
0,17 0,4123 -1,772 0,575 0,189
0,18 0,4243 -1,715 0,625 0,319
0,21 0,4583 -1,561 0,675 0,454
0,23 0,4796 -1,470 0,725 0,598
0,23 0,4796 -1,470 0,775 0,755
0,28 0,5292 -1,273 0,825 0,935
0,30 0,5447 -1,205 0,875 1,150
0,34 0,5831 -1,079 0,925 1,440
0,45 0,6708 -0,799 0,975 1,960
           
           
Среднее 0,1735 0,3987 -1,932
Дисперсия 0,0107 0,0145 0,379
Асимметрия 0,979 0,430 -0,145
Окончание табл.2.14  
Номер пробы n Исходная случайная величина х Преобразованные случайные величины Вероятность p Квантиль t
lnx
Эксцесс 0,394 -0,537 -0,688
Критерий tА 1,79 0,79 0,26
Критерий tЕ 0,36 0,49 0,63
             

 

Применим формулы преобразования: и z = lnx. Они дали положительные результаты – распределение преобразованной величины по критериям асимметрии и эксцесса не противоречит нормальному закону. Лучший результат дало преобразование z = lnx, особенно по критерию асимметрии.7

 


Подбор функции преобразования удобно контролировать с помощью графика пробит-функции [12]. По оси абсцисс откладывают значения случайной величины x или z, а по оси ординат – квантили нормального распределения t (рис.2.14), которые соответствуют вероятностям p = (2n – 1)/2N, где n – порядковый номер случайной величины в упорядоченном ряду наблюдений (табл.2.14), N = 20 – число наблюдений. На пересечении абсциссы и ординаты ставят точки. Если точки на графике расположены вдоль прямой линии, то распределение случайной величины близко к нормальному. В противном случае распределение отличается от нормального. В рассматриваемом примере график пробит-функции для исходной случайной величины явно нелинейный, а для преобразованной случайной величины z = lnx – близкий к линейному, что подтверждает эффективность выбранного преобразования.

Для построения графика пробит-функции рассчитаны значения вероятностей p, а соответствующие им квантили t получены интерполяцией данных табл.2.7.

 

 

Геологические приложения





Последнее изменение этой страницы: 2016-04-26; Нарушение авторского права страницы

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.227.247.17 (0.012 с.)