Математические методы в изучении экосистем 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Математические методы в изучении экосистем



МИНИСТЕРСТВО ОБРАЗОВАНИЯ и науки Р Ф

СУРГУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ПОВОЛЖСКАЯ ГОСУДАРСТВЕННАЯ СОЦИАЛЬНО-ГУМАНИТАРНАЯ АКАДЕМИЯ

В.М. Еськов

Ю.М. Попов

Математические методы в изучении экосистем

Учебное пособие для студентов естественно-научного направления, профиль «Экология»

Часть 2

(стохастический и синергический подходы)

Самара, 2012

УДК 167/168-005; 517.997; 519.25; 57.081; 57.084/.085; 616-092.4(57+61) ББК 3208

Е75

 

 

Рецензенты:

академик РАМН, доктор медицинских наук,

профессор В.Г. Зилов;

член-корреспондент РАН, заслуженный деятель науки РФ, доктор

биологических наук, профессор Г.С. Розенберг

Данное издание является 2-й частью лабораторно-практических работ по математическим методам в изучении экосистем. Учебное пособие направлено на практическое изучение студентами вопросов статистического анализа в системной экологии (стохастические и синергетические методы), а также новых методов прогноза экологических процессов (нейро-ЭВМ, метод минимальной реализации, методы идентификации параметров порядка в хаотических или стохастических режимах поведения биологических динамических систем). Издание рассчитано на студентов биологических факультетов, а также на учащихся профильных старших классов (элективные курсы по естествознанию) и учителей (в качестве учебного пособия).

Оглавление  
  Стр.
8. Функция распределения. Гистограмма  
9. Расчет доверительного интервала на ЭВМ  
  Метод наименьших квадратов в расчети уравнений регрессии.  
11. Основы корреляционного анализа.  
12. Статистическая проверка гипотез в экологии  
13. Элементы дисперсионного анализа  
14. Системный анализ и синтез в экологии. Расчет параметров порядка (3 метода)  
15. Расчет параметров аттракторов экофакторов Югры.  

 

 

Лабораторная работа № 8.

Функция распределения. Гистограмма

Цель работы.

Студент должен знать: смысл первичной статистической обработки результатов исследований, параметры и способы распознания различных типов распределения случайных величин.

Студент должен уметь: произвести первичную статистическую обработку результатов экологических экспериментов, произвести построение гистограмм.

Практическое значение выполняемых исследований

Количественные закономерности в природе и технике могут быть изучены с использованием методов математической статистики. Таким образом может быть выполнен анализ основных погрешностей в различных измерениях с использованием простейших методов статистической обработки результатов экологических и биологических измерений. Использование программ в языках программирования (например, BASIC) для нахождения различных статистических характеристик и обработки результатов позволяет резко облегчить механические многократно повторяемые операции в расчетах и повысить их точность.

Литература

1. Еськов В.М., Филатова О.Е., Рачковская В.А. Статистическая обработка результатов измерений в практикуме по экологии и естествознанию.- Сургут: Изд. СурГУ, 1999.- 43 с.

2. М. Дж. Кендалл, А. Стюарт. Теория распределений.

3. Гмурман В. В.. Теория вероятностей и математическая статистика.

 

Бюджет времени: На изучение темы отводится 6 часов, из них 2 часа лекций, 2 часа лабораторные занятия и 2 часа на самоподготовку.

 

МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО I ЭТАПУ

"Самоподготовка"

Для подготовки к лабораторной работе Вам следует повторить материал прошлых курсов, изучить лекции и ответить на следующие вопросы:

1. Каков смысл статистической обработки результатов?

2. Сформулируйте теорему Бернулли.

3. Что такое случайная величина? Назовите величины ее характеризующие.

4. В чем отличие распределения Гаусса от распределения Пуассона?

5. Как осуществляется поиск грубых ошибок (промахов) эксперимента?

6. Сформулируйте алгоритм поиска ошибки эксперимента.

 

МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО II ЭТАПУ:

“Выполнение лабораторной работы”

1. Отранжируйте ряд с экспериментальными данными (получите их у преподавателя) и разбейте его на 5-7 интервалов.

2. Рассчитайте для каждого интервала и запишите в таблицу ().

3. Постройте гистограмму: по вертикале , а по горизонтали .

4. Сравните график с функцией Гаусса и сделайте вывод.

Блок информации

Классическое и статистическое определение вероятности.

Теорема Бернулли

 

В природе, технике, и особенно в различных естественных науках (которые раньше называли физикой), при проведении различных наблюдений и исследований человек имеет дело с различными величинами, которые мы в дальнейшем будем называть эколого-техническими величинами (ЭТВ), выделяя специфику рассматриваемого вопроса. Вообще под физикой можно понимать все природные явления (от первоначального понятия physic- природа). Эти величины могут быть абсолютными константами (например, скорость света С), относительными константами для данных исследований (например, скорость движения тела- постоянная величина в данном эксперименте), а также переменными ЭТВ, зависимыми или независимыми (рост и масса учащихся в школе №).

Как известно, в природе зависимости между переменными величинами могут быть функциональными, когда одному или нескольким значениям независимых величин xi соответствует вполне определенное значение зависимой величины y, т.е. y=y(x1,x2,...xn) и статистическими, когда одному значению переменной x соответствует целая совокупность (так называемый ряд распределения) другой переменной y. В последнем случае мы будем говорить о влиянии различных случайных факторов на изучаемые физические процессы, в которых, однако, можно установить вполне конкретные, статистические закономерности.

Строго говоря, случайные факторы действуют в любом экологическом или техническом эксперименте, где точность измерительных приборов невысока, а исключить влияние других природных факторов (колебания температур, освещенности, вибрации) представляется невозможным. Отсюда следует целесообразность и необходимость элементарных знаний по статистической обработке результатов измерений у исследователей при выполнении измерений в естествознании и биологии, в частности, довольно часто в методической литературе статистическую обработку сводят к расчетам погрешностей, но, как мы убедимся, круг задач, возникающих при выполнении эколого-технических измерений, значительно шире и требует более глубоких знаний в области математической статистики. Однако, несмотря на большое разнообразие возникающих статистических задач, следует еще раз подчеркнуть главную идею при обработке результатов измерений- установление вполне определенных закономерностей между изучаемыми ФТВ.

Рассмотрение темы начнем с наиболее общего и простейшего раздела - построение гистограмм и расчета погрешностей или ошибок измерений.

Конечной целью многих исследований является нахождение истинного значения ЭТВ (концентрация токсичных веществ в оде или воздухе, скорость прироста численности популяции, отношения половозрелых и неполовозрелых особей в популяции, продолжительность жизни жителя ХМАО и т.д.) или совокупности истинных значений переменных при изучении и проверке законов природы. Эти истинные значения ЭТВ (в дальнейшем будем обозначать xo или yo) можно найти практически, если воспользоваться известной теоремой теории вероятностей - теоремой Бернулли, которая гласит, что частота любого события P* (отношение числа испытаний, в которых событие наступило m к общему числу испытаний n, т.е.

 

P* =m/n (8.1)

сходится по вероятности к вероятности P этого события. Иными словами при неограниченном числе испытаний мы с очень большой точностью можем определить истинное значение Р исследуемой величины. Например, проводя эколого-технические измерения бесконечно большое число раз и получая значения нашей ЭТВ x1,x2,...xn, где n®¥, мы можем вычислить среднее значение

(8.2)

 

которое при n®¥ будет с очень большой вероятностью приближаться к истинному значению xo, при этом . В этом случае говорят, что Р* сходится к Р по вероятности. Это высказывание аналитически запишется так

 

при n®¥, (8.3)

 

где e- любое сколь угодно малое положительное число. Отметим, что вероятность достоверного (происходящего в любом испытании) события- P=1, а невозможного события- P=0.

В указанном методе нахождения xo имеются определенные сложности. Во- пеpвых, бесконечно много раз повторять эксперимент вообще говоря бессмысленно. Во- втоpых, рассуждения справедливы, если отклонения Dx (или ошибки) измеряемой ЭТВ x от xo (Dx=x-xo) являются так называемыми случайными величинами (СВ) или случайными ошибками, которые не зависят от экспериментатора и их невозможно исключить, а можно только учитывать. Практически, исследователь может допустить еще два вида ошибок: промахи и систематические ошибки.

Промахи происходят при неаккуратном выполнении измерений или вследствие незнания исследователем порядка выполнения работ, ее целей и задач. Эти ошибки могут и должны быть исключены путем перехода от незнания к знаниям.

Систематические ошибки есть результат действия некоторых постоянных факторов, которые можно выявить и исключить. Примерами таких ошибок являются: действие выталкивающей силы Архимеда при взвешивании на аналитических весах, наличие теплового расширения шкал измерительных приборов (например, термометров), неправильная установка нуля прибора и т.д. Для измерительных приборов со шкалой всегда указывается класс точности прибора, который равен относительной ошибки в процентах (т.е. отношению абсолютной погрешности прибора Dx в делениях к общему числу делений на шкале x), определяемой как:

 

.

 

Это значит, если класс точности равен 2 и общее число делений на шкале x=200, то (Dx/x)•100%=2. Отсюда Dx=2x/100%=400/100=4 (делениям). Тогда при показаниях прибора 40 делений относительная погрешность измерения составит Z:

, (8.4)

 

так как 4 делениям погрешности по отношению к измеряемым 40 дают 10% погрешности. Таким образом, чем меньше измеряемая величина x, тем выше относительная погрешность измерения. Значит измерять надо во второй половине шкалы приборов!

Итак, в любом измерении после исключения промахов и систематических ошибок остаются случайные ошибки, и нахождение истинных значений ФТВ представляет большие сложности. Существуют методы оценки истинного значения xo, простейший из которых заключатся в нахождении доверительного интервала (x-Dx,x+Dx), т.е. интервала изменения случайной величины х вокруг вычисленного среднего значения , в который с некоторой заданной вероятностью b (доверительной вероятностью) попадает истинное значение xo. Иногда говорят, что полученный доверительный интервал накрывает истинное значение xo с заданной вероятностью b (см. рис. 8.1), т.е.

(8.5)

 

Рис. 8.1. Нахождение истинного значения х0 случайной величины и его среднего значения на числовой оси в рамках доверительного интервала.

 

Для понимания сущности метода расчета доверительного интервала любому исследователю природных явлений необходимо рассмотреть некоторые основные закономерности теории вероятностей (ТВ) и математической статистики (МС), однако, для сугубо практического использования предлагаемых методов приведенную ниже информацию (в 8.7 и 8.8) можно использовать для ознакомления.

В заключение важно отметить, что вероятность события легко (классически) определяется только для схемы урн (шансов), когда мы имеем полную группу событий (в результате испытания одно событие обязательно наступит!) и они равнозначны. Тогда

P(A)=m/n

где m- число шансов (случаев) таких, что событие А наступит, а n- общее число случаев. Например, в карточной колоде 4 туза и всего 36 карт, тогда вероятность вытащить туза (событие А) равна

 

Р(А)= 4/36= 1/6.

Во всех остальных случаях мы должны использовать теорему Бернулли для нахождения Р(А), указывая, что Р*(А)®Р(А) при n®¥, т.е. надо повторять число испытаний для повышения точности идентификации вероятности события A.

Для изучения понятия гистограмм мы сейчас должны рассмотреть ряд важнейших понятий:

1. Понятие ряда распределения.

2. Дифференциальная и интегральная функции распределения.

3. Числовые характеристики случайных величин.

 

1.Случайная величина (СВ) х - переменная, принимающая те или иные значения в результате испытания из множества возможных значений {х}. Если это множество бесконечное и непрерывное, т.е. соответствует определению х на отрезке или прямой, то говорят о непрерывной случайной величине (НСВ), иначе, если множество значений х- дискретный ряд чисел, то говорят о дискретной случайной величине (ДСВ). Каждому значению ДСВ соответствует своя вероятность появления P=P(x), которая связана с частотой события P* предельной теоремой Бернулли (см. выше). Например, возраст особи – НСВ. Численность особей в популяции – ДСВ (хотя иногда мы ее считаем НСВ в 1-й части)

При бросании шестигранного кубика один раз, выпадение 5 очков происходит с вероятностью P=1/6, это означает, что при очень большом числе испытаний n, отношение числа испытаний m с выпаданием 5 очков к общему числу испытаний n приближенно равно P, т.е.

 

(8.6)

 

Отличие Р от Р* определяется теоремой Бернулли (см. 8.3)

Для любой ДСВ можно задать ряд распределения, т.е. таблицу соответствий численных значений х её вероятности. Например, для нашего случая

 

(8.7)

 

Этому ряду распределения P=P(x) соответствует график в координатах P и x в виде набора точек, которые можно соединить отрезками. В нашем примере

P(xi)=1/6=const (8.8)

В термодинамике биосистем (бофизика) в разделе "Энтропия" Вы более подробно познаколись с одной из физических интерпретаций вероятности ДСВ и ее связи с таким фундаментальным понятием, как энтропия и S (забегая вперед, отметим: S~ ln P).

Рис. 8.2. Графическое представление функции распределения

Р(х) для ДСВ (опыт с бросанием кубика).

 

Для НСВ вероятность принятия конкретного значения х всегда равна нулю. На практике это соответствует тому, например, что невозможно изготовить по заданию деталь размером точно 22 мм, т.к. обязательно будет какая-то погрешность. Тогда целесообразно говорить о вероятности попадания х в некоторый интервал Dx около заданного значения x, т.е. хÎ(x±Dx). Очевидно, что эта вероятность P будет зависеть от Dx и самого значения x (см. замечание 1) [1] т.е.

(8.9)1

Функция f(x) называется плотностью вероятности или дифференциальным законом распределения случайной величины. Она не отрицательна, определена для всех хÎ(-¥,+¥) и определяет вероятность попадания х внутрь любого интервала (a,b) формулой

(8.10)

 

В квантовой механике дифференциальная функция распределения может быть получена после решения уравнения Шредингера. Она имеет большой теоретический смысл, т.к. определяет вероятность нахождения частицы (например, электрона) в некоторой области пространства Dv, т.е.

Dv=Dx·Dy·Dz.

По формуле Ньютона-Лейбница

, (8.11)

 

где F(x) первообразная для f(x), и называется интегральной функцией распределения. Она определяет вероятность того, что случайная величина X примет любые значения меньше данного x (см. замечание 2)[2]. Значения f(x) или F(x) для НСВ полностью ее определяют. На практике же найти эти функции бывает очень сложно и чаще определяют так называемые числовые характеристики (ЧХ) или их статистические величины, которые с заданной степенью точности (вероятностью) приближаются к истинным значениям. В математической статистике существует целый комплекс методов оценки достоверности совпадения практически определённых ЧX и их истинных значений (критерий согласия Пирсона, Колмогорова и т.д.) или даже статистической функции распределения F*(x) и истинной F(x). Отметим, что гистограмма грубо представляет f(x), т.е. она является статистическим аналогом дифференциальной функции распределения.

Однако, если известно истинное значение f(x) или F(x), то определить их ЧX несложно. Рассмотрим важнейшие из них.

I Математическое ожидание или момент нулевого порядка характеризует среднее значение СВ. Для ДСВ

(8.12)

Для НСВ

(8.13)

Обратите внимание, что сумма переходит в интеграл, а вместо вероятности Pi=P(xi) в формуле (8.13) стоит f(x)dx).

II Дисперсия или центральный (относительно среднего значения x) момент второго порядка D[0] характеризует величину разброса значений х около x=M[0]. Для ДСВ

, (8.14)

Соответственно для НСВ

(8.15)

Так как по размеру D[0]~x2, то на практике для удобства пользуются средним квадратическим отклонением или стандартом случайной величины

 

(8.16)

 

На рис.8.3 приводятся графики плотности вероятности f(x) для т.н. нормального закона распределения (распределения Гаусса) со значениями D1[0]<D2[0], а на рис.8.4 распределения Гаусса с разными M[0].

III Существуют центральные моменты высших порядков, которые характеризуют, например, асимметричность f(x) (момент третьего порядка)

 

(8.17)

и др. свойства функции f(x).

Отметим, что математическое понятие центрального момента в ТВ пришло из механики. Если на прямой находятся точечные массы m1, m2,..., mn и их абсциссы на числовой оси x1,x2,...,xn, то момент первого порядка или статический момент, деленный на определяет центр массы системы

(8.18)

а момент второго порядка

(8.19)

равен моменту инерции системы материальных точек I.

В ТВ абсциссам x соответствует значение СВ (ДСВ или НСВ), а аналогом mi/m является вероятность

 

поэтому последнюю величину Pi в статистике иногда называют относительным весом или просто весом

.

 

В природе существуют различные законы распределения СВ, из них наибольшее распространение получили: нормальный закон распределения или закон Гаусса, для которого плотность вероятности равна (см. рис.8.3):

 

(8.20)

 

и распределение Пуассона для n целочисленных (дискретных) значений СВ, где n невелико, имеющее вид:

(8.21)

 

где m - среднее значение случайной величины (см. рис. 8.5). Для задания нормального закона достаточно знать s- среднее квадратическое отклонение и (математическое ожидание х). Чтобы определить распределение Пуассона достаточно знать только один параметр m.

Таким образом, зная эти параметры для некоторой СВ мы имеем полную информацию о ней. Вот почему одной из главных задач статистической обработки результатов экспериментальных измерений (СОРЭИ) является получение хотя бы приближенных значений параметров функций распределений и оценка степени точности вычисленных параметров на основе сравнительно небольшого числа измерений (так называемых малых выборках). Конечная задача СОРЭИ - свернуть статистический ряд (совокупность всех возможных экспериментальных значений х) до одной функции распределения, которая в сжатой форме хранит информацию о данной СВ. В нашей работе это делается через построение гистограмм для измеряемых экологических случайных величин.

В заключение приведем графики функции Гаусса.

 

 

Рис.8.3. Две функции Гаусса для 2-х различных дисперсий.

 

Рис.8.4. Две функции распределения Гаусса для 2-х разных значений математического ожидания и двух разных дисперсий (D1>D2).

 

Отметим при этом, что вероятность попасть случайной величине х в интервал () равна b=0.6326, а в интервал равна b=0.9972, т.е. последняя вероятность соответствует "почти достоверному" событию. Вот почему в математической статистике значение СВ, выходящее за интервал в около отбрасывают как маловероятные. Использование этого свойства распределения Гаусса получило название " правило трех сигм ".

График распределения Пуассона имеет следующий вид:

Рис.8.5. График распределения Пуассона.

 

Это распределение асимметрично и при n®¥ переходит в распределение Гаусса. Остановимся более подробно на практической части – построении гистограмм. По определению: “гистограмма – это график, состоящий из прямоугольников, высота которых равна частоте события , а основание – ширина интервала измерения ” (для НСВ и ДСВ). Из определения следует алгоритм нахождения гистограмм:

1. Полученную в опыте выборку (всех xi) необходимо ранжировать (расположить в порядке вырастания от xmin до xmax).

2. Разбить весь интервал измерения (xmin, xmax) на m частей ( где ).

3. Для каждого найти свои значения частот попадания СВ внутрь . Для этого нало подсчитать все попавшие в (включая и принадлежащие левой границы), и разделить это число на число N всех измерений, т.е. .

4. На графике () построить прямоугольники с высотой и основаниями .

5. Приблизительно соеденить верхушки прямоугольников плавной линией и получить грубый вид f(x) (обратить внимание на схожесть Вашей гистограммы с функцией Гаусса (или др. функцией)).

 

 

Лабораторная работа № 9.

Цель работы.

Студент должен знать: смысл первичной статистической обработки результатов исследований до доверительного интервала с погрешностью измерений, правило 3-х сигм для случайных величин.

Студент должен уметь: произвести первичную статистическую обработку результатов экологических экспериментов до x±dx, произвести определение величины (размеров) конкретного биообъекта (среднее значение, выше среднего, высокий).

 

Литература

1. В.М. Еськов, О.Е. Филатова, В.А. Рачковская Статистическая обработка результатов измерений в практикуме по экологии и естествознанию.- Сургут: Изд. СурГУ, 1999.- 43 с.

2. М. Дж. Кендалл, А. Стьюарт. Теория распределений.

3. В. В. Гмурман. Теория вероятностей и математическая статистика.

 

Бюджет времени

На изучение темы отводится 6 часов, из них 2 часа лекций, 2 часа лабораторные занятия и 2 часа на самоподготовку.

 

МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО I ЭТАПУ

"Самоподготовка"

Для подготовки к лабораторной работе Вам следует повторить математику и математические методы за 1-2 курс, изучить лекции и ответить на следующие вопросы:

1. Каков смысл доверительного интервала?

2. Сформулируйте метод нахождения дисперсии и средне квадратического отклонения.

3. Для чего используется коэффициент Стьюдента?

4. Что такое дисперсия результата в экологическом смысле?

5. В чем смысл "правила трех сигм"?

6. Как перейти от доверительного интервала к стандартной форме записи результатов эксперимента?

 

МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО II ЭТАПУ:

“Выполнение лабораторной работы”

Для выполнения этапа наберите описанную в блоке информации программу, реализующую алгоритм нахождения доверительного интервала. Оцените результат по критериям поиска грубых ошибок (промахов) эксперимента. Если таковые присутствуют, удалите их из выборки и проведите расчет заново. Выборку используйте по данным роста и массы студентов свей группы (студенты однокурсники) или из литературы разных пород рыб, одного года (например, двухлетний язь или карп и т.д.)

 

Блок информации

Рассмотрим первичную обработку результатов измерений до доверительного интервала. Определив в предыдущей работе №8 круг основных задач СОРЭИ и исходную информацию в области математической статистики, рассмотрим теперь конкретное применение указанного подхода при выполнении эколого-технических измерений, понимая под этим любые измерения в биологии, экологии, медицине, физике, химии, т.е. в естествознании вообще.

Прежде всего отметим, что вместо вероятности события P(x) мы будем пользоваться частотой P*(x)=m/N (см. л.р. №8) и тогда все формулы ТВ можно применить с некоторой точностью, заменив P(x) на P*(x). При малом числе измерений (n<30) вместо распределения Гаусса используем распределение Стьюдента, которое внесет некоторые коррективы в формулы, приведенные ниже. Сразу отметим, что в экологии (как и в физике, технике и др. науках) могут быть прямые измерения и косвенные. Начнем рассмотрение с 1-го блока, как наиболее распространенного.

I Прямые измерения. Расчет доверительного интервала.

Прежде всего отметим, что общая схема (алгоритм) первичной статистической обработки результатов измерений примет следующий вид для случая прямых измерений:

1. Нахождение выборочного математического ожидания (или среднего арифметического):

 

(9.1)

 

2. Нахождение статистической (выборочной) дисперсии (или центрального момента 2-го порядка):

(9.2)

 

3. Определение статистического (выборочного) среднего квадратического отклонения СВ:

(9.3)

 

Если n велико, то величины , D*(x), могут хорошо характеризовать истинные значения математического ожидания, дисперсии и среднего квадратического отклонения СВ (измеряемой величины). Иная ситуация возникает при небольших n (n<30, например). Вообще говоря тоже является случайной величиной, как и каждая xi, поэтому оно тоже может характеризоваться средним квадратическим отклонением, которое, как показывают расчеты для распределения Стьюдента, определяется по формуле:

 

.

 

Легко видеть, что с увеличением n средняя квадратическая ошибка среднего арифметического (выборочного математического ожидания) ®0. Так как нас интересует истинное значение, x0 для СВ, к которому стремится , то представляет интерес оценка точности наших измерений и ответ на вопрос, как близко подходит к xo.

4. В первом случае используем правило трех сигм и определяем наиболее возможную ошибку отдельного измерения

 

. (9.4)

 

Как известно (см. выше), вероятность непопадания СВ в интервал чрезвычайно мала (1-0.9972=0.0028), поэтому те значения СВ, которые не попали в этот интервал, мы должны отбросить (промахи!), а вычисления повторить заново. Тогда схема вычисления (алгоритм) примет вид:

 

1®2®3®4®5®6 (9.5)

 

5. Далее, точность прямого измерения Dx, т.е. разность между xo (истинным значением СВ) и ее можно определить по формуле:

 

(9.6)

 

где tk,b - параметр, при малых n задается таблицей 1 (для критерия Стьюдента ). Этот параметр можно определить из распределения Стьюдента. Он зависит от числа степеней свободы k, которое на единицу меньше числа измерений, т.е. и доверительной вероятности b.

 

k=n-1 (9.7)

 

6. Для ответа на второй вопрос мы должны записать доверительный интервал (), внутрь которого с доверительной вероятностью b попадает неизвестное нам истинное значение xo СВ. Выбор b определяется требованиями практики. В биологических исследованиях можно брать b=0.9, т.е. из 100 случаев, в среднем, 90 раз вычисленный нами доверительный интервал накроет истинное значение СВ, а в 10 случаях - нет. Иногда предъявляют более жесткие требования (в авиации, медицине b=0.999, в космонавтике – 0,99999).

Важно отметить, что истинные значение СВ мы так и не определим, но получаем определенную оценку xo. Этим объясняется невозможность исключить случайные ошибки. Иногда молодые исследователи говорят, что провели несколько измерений, а результат одинаковый, вывод "нет ошибки". Это утверждение неверное, т.к. фактически такая ситуация означает, что Dx СВ меньше абсолютной погрешности прибора Dxnp, тогда нужно просто приравнять эти две величины без дополнительных расчетов, т.е. сразу 1®6.

II. Косвенные измерения.

Приведенные выше методы расчета применимы при работе с любым измерительным прибором в экологии и при любых прямых измерениях. Однако, во многих случаях необходимая ЭТВ получается при расчете с использованием известных функциональных зависимостей между искомой величиной и непосредственно измеряемыми x1, x2,...,xn, т.е. y=y(x1...xn). В этом случае для каждой xi, используя алгоритм 1-6, находят xi и Dxi, а затем находят среднюю квадратическую погрешность косвенного измерения y по формуле:

 

(9.8)

 

где ¶y/¶xi - частная производная от у по хi.

Приведем простейший пример, если определяют объем цилиндра (часть ствола дерева, червь и т.д.) V=pR2h, то сначала по схеме 1-6 находят , а затем, используя (9.8)

.

Расчет средней квадратической ошибки среднего арифметического

 

,

 

точности измерения и доверительного интервала () ничем не отличается от общей схемы 1-6.

В общем случае естествоиспытатель (биоэколог) должен сам уметь составлять алгоритм расчета доверительного интервала. Конкретный пример такого алгоритма (программы) представлен в приложении 1. В данной работе Вам придется измерить параметры (масса и рост) каждого студента группы и для этих двух СВ (m и n) рассчитать доверительные интервалы. Если бы выборка была побольше, например, юношей n1>10 и девушек n2>10, то можно было бы определить доверительные интервалы для юношей и девушек и сделать вывод о наличии (или отсутствии) гендерных различий среди населения Югры.

Наконец, отметим еще одно важное замечание. Если для данной выборки мы получим и , то любой объект попавший в интервал (, ) характеризуется как объект со средними значениями (массы, роста и т.д.). Если же его данные попали в интервал ( ) или в интервал ( ), то мы говорим, что рост (например, h) человека ниже среднего или выше среднего. Наконец, если параметры объекта лежат за границей , то это или низкий (рост) или высокий (рост) показатель объекта. Так в экологии мы можем говорить о загрязненности (воды, атмосферы, почвы, крови или лимфы человека) в пределах нормы, выше (ниже) нормы (среднее) или о высоких (низких) показателях внешней для человека (или внутренней) среды.

Доверительные интервалы можно сравнивать, но для этого лучше применять статистическую проверку гипотез (см. Лаб.р. №12, №13).


Приложение 1

 

ПРОГРАММА РАСЧЕТА ДОВЕРИТЕЛЬНОГО ИНТЕРВАЛА

REM *******************************************************

CLS

j = 0: Dsp = 0:

INPUT "Tkb (критерий Стьюдента) = ", Tkb

INPUT "количество n = ", n

DIM x(n)

REM *********** заполнение массива **************************

FOR i = 1 TO n

PRINT "x ("; i; ") = ";: INPUT "", x(i)

NEXT i

REM *******************************************************

REM ************** среднее значение x ***********************

FOR i = 1 TO n

j = j + x(i)

NEXT i

j = j / n

PRINT "Среднее арифметическое значения <x> = "; j

REM *******************************************************

REM *********** Статистическая дисперсия ********************

FOR i = 1 TO n

Dsp = Dsp + (j - x(i)) * (j - x(i))

NEXT i

Dsp = Dsp / n

PRINT "Статистическая дисперсия, D = "; Dsp

REM ******** Cреднее квадратичное отклонение ****************

Sc = SQR(Dsp)

PRINT "Среднее квадратичное отклонение x = "; Sc

REM *Среднее квадратичное отклонение среднего арифметического *

k = n - 1

Sxc = Sc / (SQR(k))

PRINT "Среднее квадратичное отклонение среднего арифметического ="; Sxc

REM ************ доверительный интервал ********************

dx = Tkb * Sxc

PRINT "доверительный интервал = ("; j - dx; ","; j + dx; ")"



Поделиться:


Последнее изменение этой страницы: 2016-04-07; просмотров: 347; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.191.88.249 (0.238 с.)