Тема 4 Методы, используемые для установления 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Тема 4 Методы, используемые для установления



Подобия и отличия объектов и систем

Критерий Стъюдента (t)

Критерий наименьшей существенной разности (НСР)

Критерий Фишера (F)

4 Критерий соответствия (χ2)

 

 

Достоверность различий между генеральными сово­купностями (Ni, N 2...) может быть определена с помощью следующих критериев достоверности: критерия Стьюдента (t), наименьшей существенной разности (НСР), кри­терия соответствия (χ2), критерия Фишера (F).

 

1Критерий Стьюдента. Сравнение выборочных сово­купностей по критерию Стьюдента t позволяет утверж­дать с некоторой долей уверенности сходство или раз­личие между средними выборок по разнице между ними с использованием фор­мулы

                                      (4.1)

где d – разность между средними 1 М2); т d – ошиб­ка разности средних.

Выделяют три типа сравниваемых статистических со­вокупностей: независимые с одинаковым объемом вы­борок (N 1 = N 2), независимые с разным объемом выбо­рок (N 1 N 2), сопряженные только с одинаковым объ­емом выборок (N 1 = N 2).

Независимые статистические совокупности могут быть получены на одной или нескольких точках, но при оди­наковых условиях проведения эксперимента: например, измерение температуры воздуха в июле в г. Минске в течение нескольких лет и установление достоверных раз­личий между этими показателями по годам исследова­ний; определение содержания бора в автономных ланд­шафтах. Поэтому при установ­лении степени свободы в каждом независимом экспери­менте выборочные совокупности суммируются.

Сопряженные статистические совокупности, как и не­зависимые, однозначны по смыслу, их получают при про­ведении исследований на одном или нескольких ключах, но в разных условиях. Например: измерение температур воздуха и почвы на глубине 5 см в г. Минске в июле и сравнение полученных показателей (условия разные, точка наблюдения одна и та же); Степень свободы в каждом рассматриваемом эксперименте опреде­ляется по числу пар сравниваемых выборок (Nu). Рассмотрим расчеты достоверности различий для одинакового и разного объемов выборок.

 

Пример 1. При исследовании глубины расчленения рельефа в Воложинском районе N 1 и Браславском районе N 2 необходимо уста­новить, объединять рассматриваемые участки в один геоморфологи­ческий район по степени расчленения рельефа или различать их как самостоятельные. Воложинский район – 20, 17, 16, 15, 15; Браславский район – 17,16, 15, 14, 14. (N1 = N2)

1) Находим среднее арифметическое для каждой выборки

 

 

Таблица 2 – Форма обработки вариант в независимых совокупностях

х1 (x1 – M1) (x1 – M1)2 х2 (x2 – M2) (x2 – M2)2
20 3,4 11,56 17 1,8 3,24
17 0,4 0,16 16 0,8 0,64
16 - 0,6 0,36 15 - 0,2 0,04
15 - 1,6 2,56 14 - 1,2 1,44
15 - 1,6 2,56 14 - 1,2 1,44
    Σ = 17,2     Σ = 6,8

 

2) Находим разность между средними

                                   d =М1M 2                                              (4.2)

d = 16,6 – 15,2 = 1,4 м

При расчете разницы между средними из большей величины вычитают меньшую независимо от нумерации выборочных совокупностей.

3) Затем находят ошибки средних для каждой выборки в отдельности по формуле

                        (4.3)


4) Находим ошибку разности между средними по формуле:

                                      (4.4)

 

5) Число степеней свободы устанавливают следующим об­разом:

                                     v = N 1 + N 2 – 2                                    (4.5)

                                     v= 5 + 5 – 2 = 8

6) Определяем Критерий Стьюдента

                                              (4.6)

 

Сопоставляем табличные значения критерия Стьюдента tт=2,32 и 3,36 (см. приложение 4) при Р=0,95 и 0,99 для v=8 с расчетным. Поскольку tТ > t Ф,, то разность между средними признается несу­щественной (недостоверной). Следовательно, при выделении геомор­фологических районов по глубине расчленения рельефа рассматри­ваемые участки необходимо объединить в один геоморфологический район.

 

Пример 2. При исследовании глубины расчленения рельефа в Воложинском районе N 1 и Браславском районе N 2 необходимо уста­новить, объединять рассматриваемые участки в один геоморфологи­ческий район по степени расчленения рельефа или различать их как самостоятельные. Воложинский район – 20, 17, 16, 15, 15; Браславский район – 17,16, 15, 14, 14, 16. (N1 ≠ N2)

1) Находим среднее арифметическое для каждой выборки

 

 

Таблица 2 – Форма обработки вариант в независимых совокупностях

х1 (x1 – M1) (x1 – M1)2 х2 (x2 – M2) (x2 – M2)2
20 3,4 11,56 17 1,7 2,89
17 0,4 0,16 16 0,7 0,49
16 - 0,6 0,36 15 - 0,3 0,09
15 - 1,6 2,56 14 - 1,3 1,69
15 - 1,6 2,56 14 - 1,3 1,69
      16 0,7 0,49
    Σ = 17,2     Σ = 7,34

2) Находим разность между средними d =М1M 2 = 16,6 – 15,3 = 1,3 м

3) Ошибка разности средних, определяется по формуле

 

              (4.7)

где Σ(x1 – M1)2  – сумма квадратов отклонений от среднего для первой выборки; Σ 2 –М2)2 – второй выборки; N1, N2– количество вариант в первой и второй выборках соответственно;

4) Число степеней свободы для разного объема выборок устанавливают следующим об­разом:

                      (4.8)

 

                                         (4.9)

m1, m2— ошибка среднего первой и второй выборок соответственно

                   (4.10)

 

 

5) Определяем Критерий Стьюдента

                                               (4.11)

Сопоставляем табличные значения критерия Стьюдента tт=2,45 и 3,71 (приложение 4) при Р=0,95 и 0,99 для v=6 с расчетным. Поскольку tТ > t Ф,, то разность между средними признается несу­щественной (недостоверной) рассматри­ваемые участки необходимо объединить в один геоморфологический район.

 

Пример 3. Получены сопряженные выборки только с одинаковым объ­емом конечно-моренного ландшафта N 1 и донно-моренного ландшафта N 2. Число пар N П = 5. Воложинский район – 20, 17, 16, 15, 15; Браславский район – 17,16, 15, 14, 14  ( N 1 = N 2).

1) Находим среднее арифметическое для каждой выборки

 

 

 

Таблица 3 – Форма обработки данных сопряженных наблюдений

Глубина расчленения,

м

di

N1 N2
20 17 3 9 + 1,6 2,56
17 16 1 1 —0,4 0,16
16 15 1 1 —0,4 0,16
15 14 1 1 —0,4 0,16
15 14 1 1 —0,4 0,16
Σ=83 Σ=76 Σ=7 Σ=13 Σ=0 Σ=3,20
M1=16,6 М2=15,2  = l,4  

=1,4

2) Находим разность между средними

                                                                                               (4.12)

= 16,6 –15,2=1,4

 

3) Находим ошибку разности между средними по формуле:

                      (4.13)

                                             (4.14)

где di – разность между индивидуальными сопряжен­ными вариантами в выборках;   – разность между сред­ними сопряженных выборок; N П число сопряженных пар в сопряженных выборках.

4) Число степеней свободы устанавливают следующим об­разом:

                                  v = NП – 2                                                  (4.15)

v= 5 – 2=3

5) Определяем Критерий Стьюдента

Сопоставляем табличные значения критерия Стьюдента tт=3,18 и 5,84 (приложение 4) при Р=0,95 и 0,99 для v=3 с расчетным. Поскольку t Ф > tТ при Р=0,95,то разность между средними признается су­щественной (достоверной). Следовательно, при выделении геомор­фологических районов по глубине расчленения рельефа рассматри­ваемые участки необходимо рассматривать как самостоятельные.

 

2 Критерий наименьшей существенной разности (НСР) показывает то ми­нимальное различие между средними, начиная с которо­го при выбранном уровне вероятности средние сравни­ваемые показатели существенно отличаются друг от дру­га. Величина критерия НСР выражается в тех же единицах, что и сравниваемые средние выборочных со­вокупностей, и определяется по формуле:

                                                                       (4.16)

где т d – ошибка разности средних; tT – табличное зна­чение критерия Стьюдента при выбранном значении уровня вероятности.

Если разность между сравниваемыми средними в условиях эксперимента больше или равна величине НСР при Р = 0,95 или 0,99, то различие существенно. Если разность между средними меньше НСР, то различие обусловлено случайными факторами и признается недо­стоверным.

Проверим достоверность разности между средними арифметическими с использованием критерия НСР для случаев независимого и сопряженного наблюдений по формуле:

НСР0,95 = 2,32 • 1,1 = 2,55 м, НСР0,99 = 3,36• 1,1 = 3,696 м для независимых наблюдений;

НСР0,95 = 3,18 • 0,40= 1,27 м, НСР0,99 = 5,84 •,40 = 2,34 м для сопряженных наблюдений.

По величине НСР достоверное различие между средними уста­новлено лишь при сопряженном наблюдении для уров­ня вероятности 0,95 (HCP0,95=1,27< = 1,4 м).

 

3 Критерий Фишера (F) используется для установления достоверностиразличия между совокупно­стями по дисперсиям. В таких случаях лучше использовать критерий Фишера F (положи­тельное асимметричное распределение). Расчет критерия Фишера производится по формуле:

                                                                      (4.17)

где  по абсолютной величине должна быть больше, чем .

Если величина расчетного критерия Фишера FФ не превышает величины приведенного в таблице FT (при­ложение 5), то различие между сравниваемыми диспер­сиями считается недостоверным. При Fф > Fт эти диспер­сии достоверно различны, а различие сравниваемых ге­неральных совокупностей признается неодинаковым. Степень свободы рассчитывается для сравниваемых со­вокупностей отдельно по формуле v = N – 1.

 

Пример. Необходимо установить достоверность различия в содержании гумуса в дерново-подзолистой заболоченной суглинистой почве для северной n 1 и центральной n 2 провинций РБ. Количе­ство вариант в обеих совокупностях одинаковое.

В результате обра­ботки данных получены следующие средние и дисперсии: M1 = 3,53 %, =0,0024 %; M2 = 3,32 %, =0,00032 %. Сравниваемые совокуп­ности весьма сходны и можно констатировать отсутствие различия между ними. Однако пределы колебаний в совокупностях сущест­венно отличаются по вариантам (более чем в 2 раза), что требует для доказательства сходства или различия использовать критерий Фишера. В результате вычислительных операций получены следую­щие результаты:

Fф = / = 0,0024: 0,00032 = 7,5.

 

Степень свободы равна: v1 = 5—1=4,

                                v2 = 5—1=4.

Для P=0,95 и 0,99 FT = 6,39 и 15,98 (приложение 5) соответственно. Поскольку Fф>Fт, то различие в содержании гумуса по провинциям признается существенным при уровне вероят­ности Р=0,95.

4 Критерий соответствия (χ2) - количественное изучение явле­ний требует создания гипотез, с помощью которых мож­но объяснить эти явления. Для этой цели используется критерий кси-квадрат (χ2), или кри­терий соответствия, который рассчитывается по формуле

                               (4.18)

где φ, φ' – число наблюдений в опыте фактическое и теоретически ожидаемое.

Если рас­четные значения кси-квадрат превышают табличные (приложение 6), то гипотеза о независимости признаков отвергается. Если < , то признаки можно считать не­зависимыми.

Степень свободы при проверке гипотезы о нормальном распределении вычисляется по формуле

                                             v = k –3                                          (4.19)

где k – число классов.

Достоверность расчетных данных можно также оце­нить по формуле:

                                                                       (4.20)

Различие считается достоверным, если D 3. При обра­ботке данных по условиям применения критерия кси-квадрат требуется, чтобы частота в каждом классе была не менее пяти.

 

Пример. Следует определить число сельских жителей с бронхолегочными заболеваниями, обострение болезни у которых связано с природными условиями местожительства.

Для обработки выбороч­ных вариант составляем таблицу. Всего выявлен 71 больной жи­тель из 639 обследованных одного возраста и пола по 9 человек в каждом населенном пункте.

Таблица 4 - Сравнение эмпирических и теоретических частот с использованием критерия кси-квадрат

Число обследованных жителей (классы) Число фактических больных, φ Число теоретически больных, φ' φ – φ' (φ- φ')2 (φ- φ')2 φ'
1 2 3 4 5 6
1-71 72-142 143-213 214-284 285-355 356-426 427-497 498-568 569-639 10 15 12 10 13 14 10 11   -4 (11-15)   -3 1 2 -1 5   16   9 1 4 1 25   1,06   0,69 0,07 0,40 0,09 3,12
i=9 N=71 N=71  

=5,43

Для обработки данных количество об­следованных сгруппировано в 9 классов. Поскольку частота в каж­дом классе φ, φ' должна быть не менее 5, объединяем первые три и последние два класса в столбцах 2 и 3. Получаем новые классы с частотами 11,15 и 13,8 (всего по 6 классов распределения). Затем производим расчеты, которые позволяют получить критерий  (см. таблицу).

Сравниваем и при величине степени свободы v= k –3=6–3=3 и для Р= 0,95. Поскольку =5,43< =7,815 (приложение 6), теоретическое распределение частот несущественно отличается от эмпи­рического, а гипотеза признается состоятельной.

Определим также достоверность :

 

Полученная величина D=0,99<3, следовательно, рассчитанное значение  показывает достоверное влияние природных условий на распространение бронхолегочных заболеваний.

 

 

Задания для самостоятельной работы

1 Необходимо установить достоверность различия в содержании гумуса в дерново-подзолистой заболоченной суглинистой почве для северной N1 и центральной N2 провинций РБ. Количество вариант в обеих совокупностях одинаковое. В результате обработки данных получены следующие средние и дисперсии:  М1= 4,223 %, σ12= 2,055 %;  М2= 3,15 %, σ22= 22,1 %; N = 15.

2 Сравнить глубину расчленения рельефа в пределах конечно-моренного ландшафта N1 и донно-моренного ландшафта N2 (получены сопряженные выборки). Исходные данные представлены в таблице 2.

3 При исследования глубины расчленения рельефа в двух районах Беларуси N1 и N2 необходимо установить, объединять рассматриваемые участки в один геоморфологический район по степени расчленения рельефа или различать их как самостоятельные. Данные приведены в таблице 2.

 

 

Таблица 2

Х1 Х2
5 6 5 3 4 4 4 5 6 5 6 6

4 Собрав данные о городах юго-запада Англии с числом жителей 8-12 тыс. в каждом, обнаружено, что число антикварных магазинов выше среднего (5) в тех городах, где высока доля пенсионеров. Таблица 1 показывает полученное распределение частот.

Таблица 1 – Наблюдаемое и теоретическое распределение антикварных магазинов по группам городов, сгруппированных с учетом доли пенсионеров в их населении

 

Доля пенсионеров в населении города, %

0-1 2-3 4-5 6-7 8
Города с населением 8-12 тыс. чел., имеющие более 5 антикварных магазинов каждый   Теоретическое распределение 2   1 4   2 4   4 8   10     10   10    

Проверить, правильно ли утверждение.

 

 

5 Существует гипотеза, что распределение пастбищ не зависит от высоты местности над уровнем моря. Доказать или опровергнуть гипотезу. Оценить достоверность расчетов. Данные представлены в таблице 3

Таблица 3

 

Территория, занятая возвышенностями, %

0-20 21-40 41-60 61-80 81-100
Наблюдаемая частота Теоретическая частота   5   27   10   27   10   27   30   27   80   27

Вопросы для самоконтроля

 

 

1 Назовите основные статистические критерии различия?

2 Какие виды выборок используются для обработки с помощью критериев различия?

3 Что показывает критерий НСР?

4 С какой целью используется критерий Стьюдента при обработке выборок различного объема?

5 По какому критерию устанавливаются различия между выборочными совокупностями?

6 Какой критерий доказывает или опровергает выдвинутую гипотезу?

 

 

Приложение 1

Таблица 1 - Таблица достаточно больших чисел

 

P

Ошибка опыта p, %

10 9 8 7 6 5 4 3 2 1
0,75 33 40 51 67 91 132 206 367 827 3308
0,80 41 50 64 83 114 164 256 456 1026 4105
0,85 51 63 80 105 143 207 323 575 1295 5180
0,90 67 83 105 138 187 270 422 751 1690 6763
0,91 71 88 112 146 199 287 449 798 1796 7185
0,92 76 94 119 156 212 306 478 851 1915 7662
0,93 82 101 128 167 227 328 512 911 2051 8207
0,94 88 109 138 180 245 353 552 981 2210 8843
0,95 96 118 150 195 266 384 600 1067 2400 9603
0,96 105 130 164 215 292 421 659 1171 2636 10544
0,965 111 137 173 226 308 444 694 1234 2778 11112
0,970 117 145 183 240 327 470 735 1308 2943 11773
0,975 125 155 196 256 348 502 784 1395 3139 12559
0,980 135 167 211 276 375 541 845 1503 3382 13529
0,985 147 182 231 301 410 591 924 1643 3697 14791
0,990 165 204 259 338 460 663 1036 1843 4146 16587
0,995 196 243 307 402 547 787 1288 2188 4924 19698
0,999 270 334 422 552 751 1082 1691 3009 6767 27069

 

 

Приложение 2

Таблица 2 -  Случайные числа

 

3393 6270 4228 6909 9407 1865 8549 3217 2351 8410
9108 2330 2157 7416 0398 6173 1703 8132 9065 6717
7891 3590 2502 5945 3402 0491 4328 2365 6175 7695
9085 6307 6910 9174 1753 1797 9229 3422 9861 8357
2638 2908 6368 0398 5495 3283 0031 5955 6544 38383
1313 8338 0623 8600 4950 5414 7131 0134 7241 0651
3897 4202 3814 3505 1599 1649 2784 1994 5775 1406
4380 9543 1646 2815 8415 9120 8062 2421 6161 4634
1618 6309 7909 0874 0401 4301 4517 9197 3350 0434
4858 4676 7363 9141 6133 0549 1972 3461 7116 1496
5354 9142 0847 5393 5416 6505 7156 5634 9703 6221
0905 6986 9396 3975 9255 0537 2479 4589 0562 5345
1420 0470 8679 2328 3939 1292 0406 5528 3789 2882
3218 9080 6604 1813 8209 7039 2086 3369 4437 3798
9697 8431 4387 0622 6893 8788 2320 9358 5904 9539
0912 4964 0502 9683 4636 2861 2876 1273 7870 2030
4636 7072 4868 0601 3894 7182 8417 2367 7032 1003
2515 4734 9897 6761 5636 2949 3979 8650 3430 0635
5964 0412 5012 2369 6461 0678 3693 2928 3740 8047
7848 1523 7904 1521 1455 7089 8094 9872 0898 7174
5182 2571 3643 0707 3434 6818 5729 8615 4298 4129
8438 8325 9886 1805 0226 2310 3675 5058 2515 2388
8166 6349 0319 5436 6838 2460 6433 0644 7428 8556
9158 8263 6504 2562 1160 1526 1816 9690 1215 9590
6061 3525 4048 0382 4224 7148 8256 6526 5340 4064

 


 

Приложение 3

 

 

Таблица 3 - Значение критерия τ в зависимости от объема выборки N и уровня значимости α

 

N α 0,05               0,01 N α 0,05              0,01
4 0,955           0,991 17 0,359           0,460
5 0,807           0,916 18 0,349           0,449
6 0,669           0,805 19 0,341           0,439
7 0,610           0,740 20 0,334           0,430
8 0,544           0,683 21 0,327           0,421
9 0,512           0,635 22 0,320           0,414
10 0,477           0,597 23 0,314           0,407
11 0,450           0,566 24 0,309           0,400
12 0,428           0,541 25 0,304           0,394
13 0,410           0,520 26 0,299           0,389
14 0,395           0,502 27 0,295           0,383
15 0,381           0,486 28 0,291           0,378
16 0,369           0,472 29 0,287           0,374
    30 0,283           0,369

 

 

Приложение 4

Таблица 4 - Значения критерия Стьюдента t при различных уровнях значимости

 

ν Уровни вероятности 0,95       0,99    0,999 ν Уровни вероятности  0,95       0,99      0,999
2 4,30     9,93     31,60 21 2,08     2,83      3,82
3 3,18     5,84     12,94 22 2,07     2,82      3,79
4 2,78     4,60       8,61 23 2,07     2,81      3,77
5 2,57     4,03       6,86 24 2,06     2,80      3,75
6 2,45     3,71       5,96 25 2,06     2,79      3,73
7 2,37     3,50       5,41 26 2,06     2,78      3,71
8 2,31     3,36       5,04 27 2,05     2,77      3,69
9 2,26     3,25        4,78 28 2,05     2,76      3,67
10 2,23     3,17       4,49 29 2,04     2,76      3,66
11 2,20     3,11       4,44 30 2,04     2,75      3,65
12 2,18     3,06       4,32 40 2,02     2,70      3,55
13 2,16     3,01       4,22 50 2,01     2,68      3,50
14 2,15     2,98       4,14 60 2,00     2,66      3,46
15 2,13     2,95       4,07 80 1,99     2,64      3,42
16 2,12     2,92       4,02 100 1,98     2,63      3,39
17 2,11     2,90       3,97 120 1,98     2,63      3,37
18 2,10     2,88       3,92 200 1,97     2,60      3,34
19 2,09     2,86       3,88 500 1,96     2,59      3,31
20 2,09     2,85       3,85 1,96     2,58      3,29

 


Приложение 5

Таблица 5 - Критические значения F (критерия Фишера)

 

 

ν2*

ν1 – степени свободы для большей дисперсии



Поделиться:


Последнее изменение этой страницы: 2021-04-20; просмотров: 560; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.224.33.107 (0.15 с.)