Однофакторный дисперсионный анализ 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Однофакторный дисперсионный анализ



 

Среди различных видов дисперсионного анализа наиболее часто используется однофакторный. Для вы­полнения однофакторного анализа в опыте должно быть предусмотрено две повторности и более. Исследуемый фактор разбивается на группы с целью выявления опти­мальной величины фактора, влияющей на результатив­ный признак. Для облегчения расчета можно уменьшить все показатели в пределах дисперсионного комплекса на определенную величину, а затем увеличить конечные результаты на ту же величину.

Географы исследуют не только природные, но и сель­скохозяйственные ландшафты (агроландшафты), пре­терпевающие существенные изменения под воздействием агротехногенеза. Использование системного анализа позволяет не только констатировать изменения в агро-ландшафте, но и активно включаться в его преобразова­ние.

Известно, что оптимальным условиям питания ра­стений соответствует дерновая легкосуглинистая гумусированная нейтральная почва. Ее можно создать путем внесения в пахотный горизонт добавок минерального грунта определенного механического состава и торфа. Формирование искусственной антропогенной почвы тре­бует полевых экспериментов. В связи с этим поставлена следующая задача: определить влияние на урожай зер­на ячменя разных доз торфа (200, 300, 400 т абсолютно сухого вещества на гектар) при внесении его на фоне минеральных, органических удобрений и доломитовой муки. Исходная почва — дерново-подзолистая глееватая связносупесчаная мелиорированная. После получения сведений об урожайности ячменя в названных усло­виях составляется таблица дисперсионного комплекса (табл. 3.1), куда заносится исходная информация по группам влияющего фактора (вариантам опыта) и неко­торые результаты расчетов (для удобства сделано округ­ление по урожайности до целых чисел). Вначале про­изводим расчет данных по вариантам опыта (строкам).

Таблица 3.1 - Однофакторный дисперсионный комплекс

 

Варианты опыта

Урожай ячменя по повторностям, ц/га*

Mi
1 2 3 4 5 6 7 8
Контроль (фон) 20/100 21/441 22/484 20/400 83/1725   6889   20,75
Фон + 200 т/га торфа 30/900 32/1024 32/1024 31/961 125/3909 158625 31,25
Фон + 300 т/га торфа 35/1225 36/1296 35/1225 36/1296 142/5032 20164 35,50  
Фон + 400 т/га торфа 36/1296 35/1225 37/1369 37/1369 145/5254 21025 36,25
    ()2 М k   121   3816   14641 30,25   124   3981   15376 31,00   126   4102   15876 31,50   124   4021   15376 31,00 495 15920 ()2 61269   63703   M общ 30,93

* В числителе — опытные данные, в знаменателе — квадраты этих показателей

 

Результаты разносим по столбцам. Суммарный урожай ячменя по повторностям  и по каждому варианту опыта вносим в столбец 6 в числителе. Аналогично по­ступаем с квадратами этих показателей . Затем в столбце 7 приводим квадраты суммарного урожая яч­меня по повторностям . И, наконец, вычисляем среднее арифметическое Mi по каждому варианту опыта, заносим в столбец 8; вычисляем общее среднее М общ.

После получения данных по вариантам опыта произ­водим расчет необходимых показателей по повторностям (Xk). Сначала суммируем данные урожайности ячменя и приводим в строке под чертой . Суммы сумм уро­жайности ячменя по вариантам опыта и повторностям должны совпасть и дать сумму всех вариант (). Аналогично суммируем квадраты этих показателей по повторностям (). Суммы сумм квадратов по вариантам и повторностям опыта должны совпасть и дать сумму квадратов всех вариант ( = =15920). Ниже вписываем результаты возведения в квадрат сумм вариант по каждой повторности ()2 и суммируем их: )2= 61 269. Вычисляем средние арифметические по каждой повторности опыта Mk. Общее среднее арифмети­ческое всех вариант опыта составляет М общ = / N = = 495: 16=30,93.

Следующий этап работы — нахождение сумм квад­ратов отклонений, т. е. расчленение общего варьирова­ния признака на составные части исходя из равенства

 = 1 + 2 + 3

где  — сумма квадратов отклонений по общему варьи­рованию данных, i — по группам фактора (варианты опыта), 2 — по повторностям опыта, з — по остаточ­ному варьированию.

Общая сумма квадратов отклонений вычисляется сле­дующим образом:

=

 

Подставив данные из табл. 3.1, получим =45 920— —4952: 16 = 620,94. Затем находим сумму квадратов от­клонений по группам фактора опыта по формуле

1=                                            (3.1)

где k — число групп фактора, т. е. 4; i — число слагае­мых в сумме по вариантам опыта (равно количеству повторностей), т. е. 4. В данном случае должно выдер­жаться равенство N = ki =4-4=16. По формуле (2.1) вычислим

 

1 = [63703 — 4952: 4]: 4 = 611,69.

Сумму квадратов отклонений по повторностям опыта находим по формуле

2=                                              (3.2)

где i — число повторностей, т. е. 4; k — число слагаемых в каждой сумме , т. е. 4.

Вычисляем 2 по формуле (3.2):

 

2 = [61269 — 4952: 4]:4 = 3,19.

 

 

Таблица 3.2 Результаты однофакторного дисперсионного анализа

 

Варьирование данных

Сумма квадратов отклонений

Степень свободы

Дисперсия

Критерий Фишера

Fф Fт
Общее по опыту По вариантам опыта По повторностям Случайное (остаточное) 620,94 611,68 3,18 6,08 15 3 3 9 41,39 203,89 1,05 0,67 - 304,31 1,56 - - 8,81 8,81 -

 

Сумма квадратов отклонений по остаточному варьи­рованию определяется из равенства

3 =    - 1 2.                                                       (3.3)

Подставив значение вычисленных сумм соответствую­щих квадратов отклонений в формулу (3.3), получим

3 = 620,94 — 611,68 — 3,18 = 6,08.

Проводим дисперсионный анализ данных урожая яч­меня (табл. 3.2). Вносим в таблицу рассчитанные суммы квадратов отклонений (, 1, 2, 3). Число степеней свободы получаем следующим образом: по общей сумме квадратов отклонений v = N — 1 = 16 — 1 = 15; по вариан­там опыта ; по повторностям ; по остаточной сумме v3 = v — v1 — v3 = = 15—3—3 = 9.

Дисперсия определяется путем деления сумм квадра­тов отклонений (, 1, 2, з) на соответствующие им числа степеней свободы (v, v1, v2, v3), что можно выра­зить в общем виде формулой 2 = /v, т. е. путем деления большей величины на меньшую получим 2 = 620,94: 15 = 41,39.

Оценку сходства или различия между вариантами опыта можно проводить по критерию Фишера, критерию Стьюдента или НСР.

Если Fф>Fт (см. табл. 3.2 и приложение 5), то это позволяет сделать вывод, что внесение больших доз тор­фа положительно влияет на величину урожая ячменя в агроландшафте.

Наиболее распространен в дисперсионном анализе для оценки результатов опыта критерий НСР, алгоритм которого приводим ниже. Вначале определяем среднее квадратическое отклонение из дисперсии, полученной в результа­те случайного варьирования (см. табл. 3.2):  затем вычисляем обобщенную ошибку среднего: тм = . Поскольку ошибка среднего для всех сравниваемых вари­ант одна и та же, формула для расчета ошибки разности может быть преобразована: md = . Наименьшую су­щественную разность рассчитываем по формуле (1.18).

 

Используя исходные данные, вычислим НСР по указанно­му выше алгоритму:

0,82; mM = 0,81

;

 

НСР0,95 = 0,56-2,26 = 1,26; НСР0;99 = 0,56- 3,25 = 1,82.

 

Из полученных результатов дисперсионного анализа вытекает следующий вывод (табл. 3.3). Величина НСР0,95 и НСР0,99 меньше величины прибавки урожая зерна ячменя, поэтому внесение высоких доз торфа по­ложительно влияет на урожай. Лучший результат полу­чен в варианте с дозой внесения торфа 400 т/га, где прибавка зерна ячменя составила 15,5 ц/га.

Таблица 3.3 Влияние высоких доз торфа на урожай зерна ячменя, ц/га

 

Вариант опыта

Урожай ячменя по повторностям

Среднее Прибавка
Контроль (фон) 20 21 22 20 20,75 -
Фон + 200 т/га 30 32 32 31 31,75 11,0
Фон + 300 т/га 35 36 35 36 35,50 14,75
Фон + 400 т/га 36 35 37 37 36,25 15,50
НСР0,95, ц/га НСР0;99, ц/га 1,26 1,82          

 

 

4. Цели и условия применения информационного метода в географических исследованиях

 

Научно-техническая революция привела к ускоренно­му росту объема информации в различных областях нау­ки, включая географию. Математическая теория инфор­мации возникла, когда появилась потребность в оценке количества передаваемых сведений. Первоначально она опиралась на отдельные положения теории вероятности; постепенно вырабатывалась собственная методика, опре­делялся свой круг задач. На современном этапе развития теория информации ставит своей целью оценку объема информации, выявление разнообразия в природе, уста­новление различия и сходства в этом разнообразии.

По теории вероятности информацию содержат лишь такие данные, которые устраняют существующую до их получения неопределенность. Однако не всегда прихо­дится использовать информацию вероятностного харак­тера, например в картографии, где обычно имеют дело с определенными данными. Это привело к разработке иных подходов в теории информации: комбинаторного и алго­ритмического. Комбинаторный подход рассматривает ко­личество информации как функцию числа элементов в конечной совокупности. Он широко используется, напри­мер, при измерении объема картографической информа­ции. Алгоритмический подход определяет количество ин­формации как минимальную длину программы, которая позволяет однозначно преобразовать один объект в дру­гой.

Существует также представление об информации как о мере разнообразия. В целом разнообразие связано с различием, т. е. с отрицанием неразличимости. Простей­шей единицей измерения информации является элемен­тарное различие — различие двух объектов. Чем больше в совокупности попарно различных элементов, тем боль­ше она содержит информации. Если рассматриваемые объекты отождествляются, то информация исчезает.

Информационный анализ применяется в некоторых областях географии при соответствующих условиях. В на­стоящее время разработан способ определения количе­ства информации, содержащейся в рельефе, подсчитан объем информации субаквального биоценоза; ведутся поиски критерия связи на примерах зависимости между физическими свойствами горных пород, климатом и рас­тительностью, компонентами и структурными частями биогеоценозов. Теория информации помогла разработать критерий пространственной дифференциации и однород­ности. Информационный анализ предпочтительнее ис­пользовать для выявления закономерностей в общих, а не частных явлениях.

Весь процесс информационного анализа изучаемого явления можно разбить на следующие этапы.

Предварительный этап. При сборе материалов необ­ходимо, чтобы сопоставляемые факторы и явления тер­риториально и во времени соответствовали друг другу во избежание неслучайных ошибок, которые могут привес­ти к возникновению «шума». Факторы и явления долж­ны быть представлены возможно большим числом своих состояний. Они объединяются в более широкие классы в процессе анализа.

Анализ информации. После подготовки материала к обработке оценивается связь изучаемого явления с каж­дым из возможных факторов, из них отбираются наибо­лее информативные. Рассчитываются попарные каналы связи. Оценивается общая информативность всей сово­купности выбранных факторов. Определяется величина «новой информации» и размеры косвенной связи.

Процесс моделирования и его оценка. На основе ана­лиза частных каналов связи в сопоставлении с общими строится логическая функция зависимости явлений от совокупности факторов. Оценивается ошибка распозна­ваний явления по величине «шума» и для составленной логической функции. Проверку достоверности анализа целесообразно проводить и после построения частных ка­налов связей. Если логическая функция недостаточно полно описывает изменения состояний явления (по рас­пределению ошибок), пытаются найти дополнительные факторы, которые смогли бы улучшить распознающую систему.

Прогноз. Если в анализ вошли материалы с достаточ­ным разнообразием состояний и собранные на значи­тельной территории, то прогноз можно осуществить для любой точки, характеристики которой соответствуют со­стояниям факторов, включенных в анализ.

Преимущество информационных методов заключается в том, что они, в отличие от статистического, не требуют применения закона нормального распределения, линей­ности связей, независимости признаков, метричности и упорядоченности.

С практической точки зрения важно уметь численно оценивать степень неопределенности проводимых иссле­дований (энтропия), чтобы их сравнить между собой. Сте­пень неопределенности каждого опыта выражается чис­лом К, поэтому искомая численная характеристика сте­пени неопределенности должна являться функцией числа К. Для К= 1 (неопределенность полностью отсутствует) функция должна обращаться в нуль и возрастать при увеличении числа К.

За меру неопределенности опыта (показатель энтро­пии), имеющего К равновероятных исходов, принято чис­ло lg К. Чаще всего пользуются логарифмами при осно­вании два (f (К) =lg2 К). В данном случае за единицу измерения степени неопределенности принимается неопре­деленность опыта, имеющая два равновероятных исхода (например, при подбрасывании монеты равная вероят­ность появления орла или решки). Такая единица изме­рения неопределенности называется двоичной единицей (бит). Если пользоваться десятичными логарифмами, то за единицу степени неопределенности принимается не­определенность опыта, имеющего 10 равновероятных ис­ходов. Такая десятичная единица примерно в 3,32 раза крупнее двоичной единицы (lg210 ≈ 3,32).

Для перевода десятичных единиц в биты полученную величину делят на lg 2 = 0,30103.

При применении натуральных логарифмов энтропия выражается в нитах. Если величина энтропии получена с применением натуральных логарифмов, а ее требуется перевести в биты, т. е. в двоичную систему, то этот расчет осуществляется путем деления величины в нитах на                              ln 2 = 0,69315.

Чтобы перевести логарифм числа х с основанием b в логарифм с основанием а, используется формула

lgax = lgbx/lgba                                                              (5.1)



Поделиться:


Последнее изменение этой страницы: 2021-05-11; просмотров: 66; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.218.196.182 (0.03 с.)