Основные выборочные параметры 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Основные выборочные параметры



 

Характеристику генеральной совокупности дают по параметрам, полученным на основании выборки. Основ­ные выборочные параметры подразделяют на три груп­пы. Первую группу образуют показатели среднего поло­жения, или центральной тенденции. К ним относятся мо­да, медиана, различные виды средних. Они выражаются именованными величинами, т. е. сохраняют размер­ность признака. Вторую группу образуют показатели разнообразия признака (разброса, изменчивости): сред­нее квадратическое отклонение, квадрат отклонений, коэффициент вариации. Третью группу образуют пока­затели формы распределения: показатели асимметрии и эксцесса. Рассмотрим все три группы показателей.

Показатели среднего положения. Для того чтобы по­лучить достаточно обоснованное представление о гене­ральной совокупности на основании выборки, необходимо использовать наиболее характерные параметры призна­ка. К ним относятся показатели среднего положения: непараметрические, т. е. менее точные (мода, медиана) и параметрические, т. е. более точные (средние величины: арифметическое, гармоническое, квадратическое, куби­ческое, геометрическое).

Мода (Мо) представляет собой наиболее часто встре­чающуюся варианту в вариационном ряду. На графике она соответствует максимальной ординате и находится на вершине вариационной кривой. Если вариационный ряд разбит на классы, то мода соответствует максимальной частоте класса, который называется модальным, и оп­ределяется по формуле:

 

,

где хм — меньший предел модального класса: i — клас­совый интервал; f 1 — частота класса, предшествующего модальному; f 2 — частота модального класса; f 3 — ча­стота класса, следующего за модальным.

При полимодальном (многовершинном) распределе­нии вариационный ряд имеет несколько значений моды.

Медиана (Me) представляет собой среднюю варианту в ранжированном вариационном ряду, которая делит его на две равные по числу вариант части. При нечетном числе вариант середину ряда будет составлять одна ва­рианта (медиана). При четном числе вариант середину ряда образуют две варианты, среднее арифметическое которых будет характеризовать медиану.

При группировке вариационного ряда в классы ме­диану определяют по следующей формуле:

 

,

где хМе — начало класса, в котором находится медиана; N — объем выборки; Σf — сумма частот всех классов, предшествующих модальному классу; fM о — частота мо­дального класса.

При наличии в вариационном ряду сильно отличаю­щихся вариант медиана будет характеризовать середи­ну ряда более точно, чем среднее арифметическое.

Мода и медиана используются в тех случаях, когда о выборочных параметрах необходимо иметь ориентиро­вочное представление.

Среднее арифметическое (М, х ) представляет собой величину, сумма положительных и отрицательных откло­нений от которой равна нулю. Оно является основной характеристикой статистической совокупности. Для не­взвешенного вариационного ряда среднее арифметиче­ское вычисляется по формуле M = Σ x / N, где Σx — сумма всех вариант совокупности.

 

Пример. Определено следующее количество осадков, выпав­ ших в трех пунктах наблюдений: 10, 15 и 20 мм (N =3); M = (10+15+20):3=15 мм.

 

Среднее арифметическое выборки характеризует среднее арифметическое генеральной совокупности, аб­солютная и точная величина которого нам неизвестна. Для точности определения выборочных параметров необ­ходимо установить величину ошибок репрезентативно­сти. Ошибку среднего арифметического выборки обоз­начают индексом mм. Если тм = 0, величина выборочной совокупности равна величине генеральной совокупности. Ошибка среднего арифметического выборки рассчиты­вается по формуле:

тм = σ/√ N,                                                    (1.1)

 

где σ — среднее квадратическое отклонение.

В примере ошибка равна: тм= 5: 3 = 2,88 ≈ 2,9. По­лученный показатель включается в таблицу эксперимен­тальных данных: М ± mм(15 ± 2,9 мм). Пригодность сред­него арифметического выборки для характеристики среднего арифметического генеральной совокупности оп­ределяется путем установления достоверности. Досто­ верность — это априорное убеждение в осуществимости некоторого явления, исключающее всякое сомнение. До­стоверность характеризует реализуемость некоторого со­бытия, подтверждая его осуществимость высокими зна­чениями уровней вероятности (Р = 0,95; 0,99). Достовер­ность среднего арифметического оценивают по критерию Стьюдента:

t Ф =М/тм.                                                            (1.1)

 

Расчетное значение критерия Стьюдента для оценки достоверности среднего арифметического в примере со­ставит tф = 15: 2,9 = 5,7. Расчетный критерий Стьюдента tФ сопоставляют с его табличным значением tт (прило­жение 4). Для этого необходимо знать число степеней свободы v и уровень вероятности, или доверительную ве­роятность Р.

Среднее гармоническое (Mгар) используется при усреднении меняющихся скоростей протекания природ­ных процессов и показателей обратно пропорциональной зависимости между природными процессами или явле­ниями. Среднее гармоническое для невзвешенного ва­риационного ряда определяется по формуле:

Для расчета среднего гармонического сохраним те же данные, что и для расчета среднего арифметического (см. с. 21).

 

Пример. При измерении скорости воды в реке на трех от­резках русла получены следующие результаты: 10, 15 и 20 м/с. Среднее гармоническое составит:

Если среднюю скорость воды в реке рассчитывать по среднему ариф­метическому, то ее величина составит 15 м/с. Различие считается существенным в тех случаях, когда необходима высокая точность.

Среднее квадратическое (МКВ) используется, когда необходима проверка результатов эксперимента на един­ство суммарного действия (например, требуется опреде­лить средний радиус или диаметр исследуемого объекта). Для невзвешенного ряда используется формула:

 

(1.2)

Для расчета среднего квадратического применяем те же данные, что и в предыдущих примерах, но характе­ризующие другой признак.

Пример. Имеются данные по величине радиусов трех спилов Дуба: 10, 15, 20 см. В данном случае вместо среднего арифметическо­го при расчетах следует использовать среднее квадратическое:

Среднее кубическое (Мкуб) применяется в тех же слу­чаях, что и среднее квадратическое, т. е. При проверке на единство суммарного действия (например, при нахождении объема), и определяется по формуле:

(1.3)

Пример. Кубатура древесины по трем ключевым участкам составила 10, 15, 20 м3. Среднее кубическое равно

Эта величина существенно отличается от среднего арифметического.

Среднее геометрическое (Мг) необходимо для расчета в случаях, когда требуется определить средние темпы прироста (например, сельскохозяйственной продукции или вегетативной массы деревьев за вегетационный пе­риод и т. д.). Этот показатель дает более точное пред­ставление о приросте по сравнению со средним арифме­тическим и рассчитывается по формуле

(1.4)

 

Пример. Увеличение опада за июнь, июль и август в лист­ венном лесу составило соответственно 10, 15, 20 г/м2. Определяем среднее геометрическое:

                                                              

При наличии нулевого показателя вместо среднего геометрического вычисляется приближенное среднее арифметическое.

По абсолютной величине рассмотренные выше сред­ние значения располагаются в следующем порядке: Мгар<=Мг<=М<=Мкв<=Мкуб. Степень различия между средними зависит от величины коэффициента вариации рассматриваемой совокупности: чем больше коэффи­циент вариации, тем сильнее различаются по величине показатели среднего положения.

Показатели разнообразия признаков. В каждой сово­купности варианты отклоняются от среднего значения. Поэтому для изучаемой статистической выборки недо­статочно определить лишь среднее значение, необходимы показатели, характеризующие степень разнообразия со­вокупности. К показателям разнообразия признаков от­носятся максимальная и минимальная величины в ва­риационном ряду (лимит), амплитуда варьирования, среднее квадратическое отклонение, квадрат отклонений от среднего, коэффициент вариации. Эти показатели признаков характеризуют различную степень и особен­ности разброса.

Разность между максимальной и минимальной вари­антами (lim) характеризует амплитуду варьирования. Чем ближе минимальные и максимальные варианты к среднему и чем меньше амплитуда варьирования, тем меньше степень разнообразия между переменными в ва­риационном ряду, тем надежнее характеризуют стати­стические показатели искомую закономерность. Более точно степень разнообразия признака можно характери­зовать другими показателями.

Среднее квадратическое отклонение, или сигма (а), показывает степень рассеяния значений статистической совокупности около среднего значения. Среднее квадра­тическое отклонение определяется для невзвешенного ряда по формуле

                                                        (1.5)

 

 

для взвешенного — по формуле

                                                        (1.6)

 

где Xi — индивидуальная варианта совокупности; XiМ — отклонение от среднего индивидуальных вариант; M)2 f — сумма произведений квадратов отклонений вариант от среднего на соответствующие частоты.

Для получения исходных данных составляется табл. 1. Подставив в формулу полученные данные, определяем σ = . Если значение σ = 3,17 прибавить к среднему арифметическому и вычесть из него, то определим граничные значения, в которых будет находиться определенная часть вариант исследуе­мой статистической совокупности.

 

Таблица 1. Форма записи и расчета среднего квадратического отклонения

 

Х i xi — M (xi –M)2

Х i xi — M (xi –M)2

20

20

22

23

24

25

25

 

— 4,54

— 4,54

— 2,54

— 1,54

— 0,54 0,46

0,46

 

20,61

20,61

6,45

2,37

0,29

0,21

0,21

 

  26 27 28 30 1,46 2,46 3,46 5,46 2,27 6,05 11,97 29,81
Σ 269 М=24,54 —0,06 100,85

 

 

Пример. Среднее арифметическое относительной высоты хол­ мов составляет M =24,54 м, σ =3,17 м. Вариационный ряд высоты холмов следующий: 20,20, 22, 23, 24, 25, 25, 26, 27, 28, 30 м. Исходя из величины σ можно сделать вывод, что до 68,0% вариант в ста­ тистической совокупности находятся в пределах от 21,33 (24,54 — —3,17=21,33) до 27,71 м (24,54+3,17=27,71). Лишь 32,0% вариант выходит за пределы указанных значений (эти варианты не выде­лены).

 

Ошибка среднего квадратического отклонения опре­деляется по формуле

mσ =   (1.7)

 

Точность вычисления ошибок среднего квадратического отклонения и среднего арифметического можно про­верить приближенно при помощи соотношения: т σм = 0,70711. Если соотношение окажется близким к 0,7, то полученные результаты вычислений следует считать реп­резентативными. В противном случае необходимо прове­рить расчет. При получении тех же результатов прихо­дим к выводу, что изучаемое явление не соответствует закону нормального распределения и его оценку следует проводить с использованием непараметрических пока­зателей.

Средний квадрат отклонений, или дисперсия (σ2) — по­казатель, характеризующий степень рассеяния значений переменных около среднего значения. Средний квадрат отклонений можно вычислить путем возведения в квад­рат показателя среднего квадратического отклонения или определить по формуле

 (1.8)

Средний квадрат отклонений выражается в тех же едини­цах, что и соответствующие показатели среднего поло­жения. Форма записи исходных данных для расчета σ2 такая же, как и для σ (см. табл. 1). В примере σ2 =10,08 м. Исходя из величины дисперсии, можно опре­делить интервал, в пределах которого находятся вариан­ты выборки: от 14,5 м (24,5—10,0) до 34,5 м (24,5+10,0). Минимальное и максимальное значение вариант соответ­ственно составляет 20 и 30 м.

При объединении нескольких аналогичных выборок в общую выборочную совокупность можно рассчитать общий средний квадрат отклонений, если имеются сведения о дисперсии по каждой выборке в отдельности:

(1.9)

где σ2i – дисперсия индивидуальной выборки; k – число частных выборок.

 

Пример. Вычислим общий средний квадрат отклонений для четырех выборок, отражающих содержание кальция в озерных водах Белоруссии: σ 2 1 = 2, N 1 = 8; σ 2 2 = 2,5, N 2 = 6; σ 3 2 =3,0, N 3 = 7; σ 2 4 = 3,5, N 4 = 8. По формуле(1.9) имеем:

 

По величине общей средней дисперсии легко опреде­лить общее значение среднего квадратического отклоне­ния: σобщ = = 1,66.

Коэффициент вариации (V) представляет собой от­носительный показатель разнообразия признаков. По абсолютным значениям среднего квадратического откло­нения и дисперсии трудно определить, насколько сильно варьирует признак при сравнении различных по пара­метрам совокупностей, особенно если они выражаются в разных единицах измерения, но имеют между собой вза­имную связь (например, абсолютная влажность воздуха и количество выпавших осадков). В таких случаях со­пряженный анализ варьирования признака производится на основании коэффициента вариации. Он показывает отношение величины среднего квадратического отклоне­ния к величине среднего арифметического и выражается в процентах. Чем более однороден по размаху варьиро­вания исследуемый признак, тем меньше будет коэффи­циент вариации в данной совокупности; соответственно меньшими будут значения среднего квадратического от­клонения и дисперсии.

Для числовых величин с одинаковым знаком коэф­фициент вариации вычисляется по формуле

 

V = (σ/M)100          (1.10)

Если в статистической совокупности имеются показа­тели с положительным и отрицательным знаком (напри­мер, температуры воздуха), то коэффициент вариации рекомендуется вычислять по формуле

V = 100 σ /(          (1.11)

где 1\ — числовое выражение наименьшей отрицатель­ной варианты (без минуса). В данном случае имеется в виду, что при вычислении коэффициента вариации сред­нее арифметическое и среднее квадратическое отклоне­ния должны быть представлены в виде отрезков на число­вой оси. Приведем алгоритм вычисления коэффициента вариации для относительных и абсолютных величин.

Пример. Температура воздуха в течение суток в октябре составила (в градусах Цельсия): —4, —3, — 1, +1, +3. Среднее арифметическое равно М = — 0,6, среднее квадратическое отклонение σ =1,95. Если не учитывать наличия интервальной шкалы и опреде­лять коэффициент вариации по формуле (1.10), то получим следую­ щую величину: V = (1,95*100): (—0,6) =—325%. Результат противо­речит исходным данным, которые фактически характеризуются не­большим размахом варьирования температур в течение суток. Если среднее арифметическое представить как отрезок от точки — 4 до —0,6, то оно равно: |— 4| + |— 0,6| =3,4. Используя формулу (1.11), получаем коэффициент вариации, соответствующий условиям задачи:

 

По размаху варьирования признака выделяется 5 групп коэффициента вариации. Если изменение призна­ка находится в пределах величины коэффициента вариа­ции 0—10%, то такое варьирование считается малым, при 10—30 —средним, 30—60 — высоким, 60—100 — очень высоким, при более 100% — аномальным.

Показатели асимметрии и эксцесса. Распределение частот в изучаемом объекте не всегда подчиняется за­кону нормального распределения. Это особенно четко проявляется при выражении вариационного ряда в виде графика. Распределение частот может быть представле­но асимметричной, островершинной или туповершинной кривой.

Асимметрия кривой распределения обусловлена не­равномерным размещением вариант по обе стороны от модального значения признака. Если число вариант больше справа от моды, распределение имеет положи­тельную асимметрию, если слева — отрицательную (рис.1). При получении асимметричной кривой следует про­верить асимметричность распределения. Если асиммет­ричность не будет доказана, то рассматриваемое распре­деление относят к симметричному.

                                                        М МО               МО М               х

Рис. 1. Асимметричное распределение:

а — отрицательная асимметрия, б — положительная асимметрия

 

Для проверки асимметричности распределения вычис­ляют коэффициент асимметрии, его ошибку, затем на основании показателя достоверности устанавливают вид кривой распределения.

Коэффициент асимметрии находят по формулам

Kas = (М — Мо)/ σ или Ка s = (М — Ме)/ σ.

 

Пример. При изучении содержания подвижного бора в дер­ ново-подзолистых почвах были получены следующие показатели: M =0,25 мг/кг, Mo =0,28, σ =0,02, N =20. Для получения представ­ ления о форме кривой распределения бора предварительно вычисляем коэффициент асимметрии: Ка s = (0,25— 0,28): 0,02=— 1,5. Полученная величина указывает на наличие отрицательной асимметрии в распре­ делении вариант содержания подвижного бора в дерново-подзолис­ тых почвах.

Затем находим ошибку коэффициента асимметрии

mas = .

По условиям задачи она будет равна т as =6: (20+3) =0,29.

Достоверность коэффициента асимметрии определяется по кри­ терию Стьюдента:

t = Kas / mas

Подставляя необходимые показатели, имеем t =1,5:0,29 = 5,1.

Величина критерия Стьюдента (см. приложение 4) для Р=0,99 и при v = oo составляет 2,58 (число степеней свободы принимается равным бесконечности). Рассчитанный критерий достоверности (5,1) больше табличного (2,57), что говорит об асимметричном распреде­ лении подвижного бора. Если бы расчетная величина критерия Стьюдента была меньше табличной, то распределение отнесли к сим­ метричному даже при наличии незначительной асимметрии.

Эксцесс кривой распределения (Е ) имеет место в тех случаях, когда большинство вариант совокупности сосре­доточено около среднего арифметического. Тогда эмпи­рическая кривая распределения отклоняется от нормаль­ной теоретической кривой у ее вершины и количественно выражается показателем эксцесса (рис. 2).

Положительный эксцесс представлен кривой остро­вершинной (эксцессивной, или лептокуртичной) (см. рис. 2, а), отрицательный — плосковершинной (депрессив­ной, или платикуртичной) (см. рис. 2, b). При сильном отрицательном эксцессе кривая может приобрести вид двухвершинной.

Показатель эксцесса определяется по формуле

 

Е = -3.

 

 

Ошибка коэффициента эксцесса вычисляется следующим образом:

тЕ = 2

Оценка достоверности показателя эксцесса произво­дится аналогично оценке показателя асимметрии по кри­терию Стьюдента: t = E / mE.

Оценить достоверность показателей эксцесса и асим­метрии можно более простым способом. Отклонение эмпирического ряда по асимметрии и эксцессу от нор­мального распределения считают существенным, если

Рис. 2. Эксцесс кривой распределения положительный (а) и отрицательный (б):

1—теоретическая линия распределения, 2— эмпирическая кривая распределения

 

 

Kas и Е более чем в 3 раза превышают свои ошибки (mas, тЕ). Если показатель эксцесса меньше —2, это указывает на наличие в выборке вариант, относящихся к разным совокупностям. Эксцесс считается незначитель­ным, если |E|<0,4. Чем меньше показатель эксцесса, тем ближе распределение к нормальному.

Асимметрия и эксцесс эмпирических кривых указы­вают иногда на важные особенности объекта исследова­ния (например, на изменение признака в ходе диффе­ренциации природно-экологических условий в ландшаф­те). В таких случаях изучение степени и характера асим­метрии и эксцесса вариационных кривых может быть самостоятельной задачей при проведении исследователь­ских работ.

Показатели точности опыта. При исследованиях ме­тодического характера обычно приводят точность опыта. Точность опыта показывает, какова величина ошибки среднего арифметического в процентах от величины сред­него арифметического, и фактически устанавливает точ­ность определения последней. Показатель точности опы­та можно найти по одной из двух формул:

(1.12)

 

Опыт считается достаточно точным, если р<3%, и удовлетворительным при изменении точности опыта от 3 до 5%. Если значение показателя точности опыта более 5%, к полученным выводам следует относиться осто­рожно и увеличить число наблюдений или повторностей. Для некоторых исследований методического характера существуют другие градации в оценке точности опыта. Например, при использовании для определения содер­жания химических элементов в компонентах ландшафта спектрального анализа показатель точности опыта до 15% считается удовлетворительным.

Ошибка показателя точности опыта вычисляется сле­дующим образом:

(1.13)

 

 

Пример. Среднее арифметическое общей биомассы трав в луговом ландшафте прирусловой поймы M =235 ц/га, ошибка сред него арифметического тм = ±4 ц/га, N=20. Используя формулы (1.12), (1.13), произведем расчет показателей:

р = (4: 235)-100 = 1,7%;

Полученная величина точности опыта удовлетворительна.



Поделиться:


Последнее изменение этой страницы: 2021-05-11; просмотров: 109; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.218.196.182 (0.079 с.)