Некоторые методы вариационной статистики 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Некоторые методы вариационной статистики



 

Математическая статистика – наука о математических методах систематизации и использования статистических данных для научных и практических выводов. Во многих своих разделах математическая статистика опирается на теорию вероятностей, позволяющую оценить надёжность и точность выводов, делаемых на основании ограниченного статистического материала (например, оценить необходимый объём выборки для получения результатов требуемой точности при выборочном обследовании).

Прежде чем погрузиться в познание количественных методов исследования, основанных на использовании математического аппарата, мы рекомендуем проникнуться представлением о статистике и «статистикуляции» – искусстве обмана, сохраняющего видимость объективности и разумности. Иногда статистика насмешливо сравнивают с человеком, который тонет, переходя вброд реку со средней глубиной 90 см, или сидит, держа голову в холодильнике, а ноги в печи, и говорит: «В среднем я чувствую себя прекрасно». Известны более циничные, подозрительные и презрительные отношения к статистике. Так, однажды замечено, что «есть ложь, наглая ложь и статистика». Существует множество примеров тому, как неправильное применение методов математической статистики приводило к заведомо ложным выводам. Все эти нелепости приведены нами лишь с одной целью – показать, что точный (математический) инструмент познания работает только в умелых руках.

Начиная заниматься изучением статистики, нужно понимать, что абсурд может найти своё выражение как в словесной, так и в цифровой формах. Знание логики является надёжной гарантией от некритичного принятия словесного абсурда, а знание статистики представляет собой лучшую защиту от абсурда цифрового. Первый шаг к реальному представлению статистики – это изучение структуры дисциплины «Статистические методы» и её исторических предшественниц.

На первоначальное развитие статистических методов оказало влияние их происхождение. У статистики были и «мать», которой нужно было предоставлять регулярные отчёты правительственных подразделений (штат и статистика происходят от одного латинского корня – status), и «отец» – честный карточный игрок, который полагался на математику, усиливавшую его ловкость, – умение брать решающие взятки в азартных играх. От матери ведут своё происхождение счёт, измерение, описание, табулирование, упорядочение и проведение переписей, т. е. все то, что привело к современной описательной статистике. От предприимчивого интеллектуалаотца в конечном счёте возникла современная теория статистического вывода, непосредственно базирующаяся на теории вероятностей. Недавнее дополнение, называемое планированием эксперимента, опирается в основном на сочетание теории вероятностей с несколько элементарной, но удивительной логикой.

В дальнейшем мы остановимся лишь на краткой характеристике и назначении статистических показателей, наиболее распространённых при исследованиях в спорте.

Средняя арифметическая. Характеризуя тот или иной вид спорта, говорят, например, о среднем уровне физического развития, средней аэробной или анаэробной производительности организма, о среднем развитии двигательных качеств и многих других средних величинах. Значение средних заключается в их свойстве нивелировать индивидуальные различия, в результате чего выступает более или менее устойчивая числовая характеристика признака. 

Среднее значение характеризует групповое свойство. В средней находит своё отражение внутренняя связь, существующая между отдельными вариантами (отдельные значения или единицы, входящие в состав статистической совокупности) и всей их совокупностью в целом. Средняя – это центр распределения: она занимает центральное положение в общей массе варьирующих значений признака.

Из всех параметрических средних наиболее часто применяется средняя

арифметическая ( ), представляющая частное от деления суммы всех вариант (Xi) на их общее число (n):  i .

 

n

Средняя арифметическая – величина именованная, она выражается теми же единицами измерения, что и характеризуемый ею признак.

Являясь важной статистической характеристикой, средняя ничего не говорит о величине варьирования изучаемого признака. Самой простой характеристикой вариации является размах варьирования. Например, если лимиты (экстремумы) одной выборки равны min = 4 и max = 16, а другой – min = 3 и max = 19; то размах вариации в первом случае равен 16 – 4 = 12, во втором – 19 – 3 = 16. Отсюда следует, что вариабельность первого признака меньше, чем второго.

Описываемые показатели вариации, в силу присущих им недостатков, редко применяются в качестве основного мерила вариабельности. Во-первых, потому что способны сильно менять своё значение, а во-вторых, в силу их неспособности характеризовать существенные черты варьирования. Например, подтверждением этому могут служить следующие ряды ранжированных значений двух выборок х и у: х: 10 15 20 25 30 35 40 45 50; Х = 30. у: 10 28 28 30 30 30 32 32 50; У = 30.

Средние арифметические этих рядов одинаковы, одинаковыми являются и лимиты, а следовательно, и размах вариации. А характер варьирования у них разный, что не отражается на величине этих показателей.

Дисперсия и среднее квадратическое (или стандартное) отклонение. Наиболее подходящей мерой варьирования служит центральный момент второго порядка. Этот показатель, обозначаемый символом σ 2, называется средним квадратом отклонений, или дисперсией, и выражается формулой:

2 (Х i X)2

.

n 1

Извлекая корень квадратный из дисперсии, получим другой показатель – стандартное отклонение:

.

Величина n – 1 носит название числа степеней свободы, под которым подразумевается число свободно варьирующих членов (Xi) совокупности.

Р. Н. Бирюковой предложен более простой, но приближенный метод вычисления стандартного отклонения – σ (см. прил. 1, табл. I).

Стандартное отклонение – величина именованная и выражается в тех же единицах измерения, что и признак. Чем сильнее варьирует признак, тем больше и стандартное отклонение, и наоборот – при слабом варьировании признака стандартное отклонение будет меньше.

Средняя и стандартное отклонение дают полную количественную характеристику любой эмпирической совокупности, распределяемой по нормальному закону. Среднее значение отображает действие на признак основных причин, определяющих типичный для популяции уровень его развития, тогда как стандартное отклонение характеризует варьирование значений этого признака вокруг центра распределения, т. е. средней арифметической. Стандартное отклонение является мерой степени влияния на признак различных второстепенных причин, вызывающих его варьирование.

Стандартное отклонение не зависит от числа наблюдений и потому может использоваться для оценки варьирования однородных признаков. Однако для сравнения вариации двух и более признаков, имеющих различные единицы измерения (например, результаты в беге на 100 м, прыжках в высоту, метаниях гранаты и т. п.), эта характеристика не пригодна. Для этого используется коэффициент вариации.

Коэффициент вариации. Чтобы стандартное отклонение могло быть использовано в качестве меры сравнения вариабельности признаков (независимо от того, какими единицами измерения они выражены), его принято выражать в процентах от средней арифметической. Полученный таким образом показатель оказывается числом относительным, выражающим изменчивость признаков в процентах; его называют коэффициентом вариации и обозначают символом CV. Вычисляется он по формуле:

CV 100%.

Коэффициент вариации, будучи величиной относительной, позволяет сравнивать между собой вариабельность (колеблемость) разнородных признаков, имеющих различные единицы измерения. При нормальных распределениях CV обычно не превышает 45-50%. В случаях асимметричных распределений он может быть довольно высоким (до 100% и выше). На практике внутренняя вариабельность признака считается небольшой при CV от 0 до 10%, средней – от 11 до 20% и большой – >20%.

Ошибка средней арифметической (m) – величина не техническая, а статистическая. Она характеризует закономерные колебания (вариации) средней арифметической величины. Ошибка средней вычисляется по формуле:

                                                                                              (x i x)2

m , или m . n 1    n (n 1)

В. А. Березовский предложил более простой, но приближённый метод вычисления ошибки средней – m (см. прил. 1, табл. II).

Ошибка средней показывает варьирование выборочных показателей вокруг их генеральных параметров. Она обладает теми же свойствами, что и стандартное отклонение. Чем больше объём выборки, тем точнее средний результат, тем меньше выборочная средняя будет отличаться от средней генеральной совокупности. Следовательно, при увеличении числа испытаний ошибка выборочной средней будет уменьшаться. Отсюда становится яснее значение выборочной ошибки: она указывает на точность, с какой определена сопровождаемая ею средняя величина.

Оценка по критерию t-Стьюдента. В спорте часто на одних и тех же спортсменах проводится измерение через некоторое время (например в начале и конце этапа подготовки) или сравнение результатов одной группы (контрольной) с другой (экспериментальной). Во всех этих и подобных случаях ставится практически одна задача – выяснить, достоверно или нет одни результаты исследования отличаются от других. Для этих целей используется метод сравнения двух выборочных средних арифметических по критерию t-Стьюдента, который рассчитывается по формуле:

t X 2  X 1,

m 12  m 22

где X 1 и X 2 – сравниваемые средние; m 1 и m 2 – ошибки сравниваемых средних.

Принципиально важным является то, что применение указанного метода возможно только для однородных признаков.

После того, как опредёлен критерий и вычислено значение tрасчет .,егосравнивают с критическим значением tтабл., предварительно определив число степеней свободы (k =n 1 + n 2 - 2).

Ответом на вопрос о достоверности различий между двумя однородными признаками служит уровень значимости (Р), определяемый по таблице III (прил. 1). При уровне значимости Р < 0,0 5 (что соответствует 95% вероятности события) можно говорить о наличии достоверных различий между сравниваемыми средними, при Р < 0,01 и особенно при Р < 0,001 (когда 99,9% случаев подлежат общей закономерности) можно утверждать, что средние значения отличаются друг от друга с высокой вероятностью или закономерностью. Свидетельством отсутствия достоверных (статистических) различий между средними является Р > 0,05 (т. е. менее 95% случаев подлежат общей закономерности).

Сравнение средних значений двух малых выборок по û -критерию (по Lord). Сравнение средних значений независимых рядов измерений равного объёма (n 1 = n 2≤ 20) осуществляется по формуле:

1 2

û ,

(R 1 R 2)/2

где X 1 и X 2 – сравниваемые средние; R 1, R 2 – разности между экстремумами

(Х max – X min).

Если статистика û (по Lord) достигает или превосходит границу таблицы IV (прил. 1), то разность средних значений достоверна. Критерий û предполагает нормальное распределение выборки и равенство дисперсий в табулированной области, он имеет такую же мощность, как и критерий t- Стьюдента.

Сравнение дисперсий по критерию Фишера. Для установления равенства (или неравенства) двух выборочных дисперсий, принадлежащих к одной и той же генеральной совокупности, рассчитывается критерий Фишера:

22

                                                                                             F 2

1

(дробь 22 /12должна быть > 1, т. е. числитель должен быть всегда больше знаменателя). Значение Fрасчет. сравнивается c критическим значением теоретического распределения Фишера (прил. 1, табл. V). Если Fрасчет. равна илибольше табличного, значит существует достоверное отличие между дисперсиями при соответствующем уровне Р.

Критерий Фишера применяется для больших (n > 30) и малых выборок (n < 30). Он функционально связан с вероятностью, имеет непрерывную функцию распределения и зависит от чисел степеней свободы: k 1 = n 1 k 2 = n 2 1сравниваемых дисперсий.Характерным для F-критерия оказывается то, что он полностью определяется выборочными дисперсиями и не зависит от генеральных переменных.

Корреляционный анализ сводится к измерению тесноты или степени сопряжённости между разнородными признаками, а также к определению формы и направления существующей между ними связи.

Для оценки тесноты взаимосвязи в корреляционном анализе используется значение (абсолютная величина) специального показателя – коэффициента корреляции (r). Абсолютное значение любого коэффициента корреляции лежит в пределах от 0 до 1. Чем больше коэффициент корреляции приближается к 1, тем теснее связь между признаками и наоборот. В упрощённом виде значение этого коэффициента интерпретируют следующим образом:

r = 1,00 (такая взаимосвязь встречается только в точных науках);

r = 0,99-0,70 (сильная статистическая взаимосвязь);  r = 0,69-0,50 (средняя статистическая взаимосвязь);

r = 0,49-0,20 (слабая статистическая взаимосвязь);  r = 0,19-0,09 (очень слабая статистическая взаимосвязь);  r = 0,00 (корреляции нет).

Коэффициент корреляции может иметь знаки плюс или минус, что говорит о направленности связи – положительная (прямая) или отрицательная (обратная). Коэффициент r служит мерилом только качественной связи между изучаемыми признаками. С помощью специальных расчётных процедур в каждом конкретном случае устанавливается форма связи (линейная, нелинейная). Существуют методы парной и множественной корреляции; для определения связи между количественными и качественными признаками прибегают к разным корреляционным анализам.

Когда измерения производят в шкале отношений или интервалов и форма взаимосвязи двух разнородных (например бег на 100 м и прыжки в длину) признаков линейная, то для определения взаимосвязи используется коэффициент корреляции Бравэ – Пирсона. Чаще всего он вычисляется по формуле: r (X i X)(Y i Y), n  x  y

где  и  – средние арифметические двух признаков; σх и σу – стандартные отклонения; n – объём выборки или общее число парных наблюдений. Статистически значимая связь определяется по таблице VI (прил. 1).

Наряду с параметрическими показателями корреляционной связи существуют и непараметрические (порядковые) показатели, применяемые в тех случаях, когда изучаемые объекты (качественные) ранжируются по учитываемым в эксперименте признакам. Наиболее известным непараметрическим показателем связи является ранговый коэффициент корреляции Спирмена, определяемый по формуле:

6 d 2

                                                                                    R 1 2 ,

n (n 1)

где Σ – знак суммирования; d – разность между рангами сопряжённых значений признаков х и у, т. е. d = хiуi; n – объём выборки или общее число парных наблюдений. Статистически значимая связь определяется по таблице VII

(прил. 1).

В некоторых случаях тесноту взаимосвязи определяют на основании коэффициента детерминации (D), который вычисляют по формуле:

Dr 2 100%.

Этот коэффициент определяет часть общей вариации одного показателя, которая объясняется вариацией другого показателя. Так, например, для вычисленного значения r = -0,7 между результатом в беге на 30 м и прыжком в длину с разбега коэффициент детерминации определится как:

D = (-0,7)2 · 100% = 49%.

Следовательно, только 49% взаимосвязи спортивных результатов объясняется их взаимовлиянием. Остальная часть (100% – 49% = 51%) вариации объясняется влиянием других неучтённых факторов.

Регрессионный анализ есть продолжение корреляционного анализа, где с помощью выведенного уравнения регрессии можно показать количественную степень связи (или взаимовлияния одного признака на другой). Например, насколько повысится результат в прыжках в длину с разбега, если скорость бега на 30 м увеличится на 2 м/с. Уравнение парной линейной регрессии имеет вид:

y = a + b·x,

где у – искомое значение; a – свободный член; b – коэффициент регрессии; х – заданное значение.

Дисперсионный анализ позволяет оценить влияние разнообразных факторов на результат исследования. Например, какие из факторов физической подготовленности в большей мере влияют на спортивный результат. Дисперсионный анализ проводится как на малых, так и на больших выборках, на однородных и неоднородных признаках. В основе дисперсионного анализа лежит сравнение выборочных дисперсий или их отношений с критическими значениями критерия F- Фишера.

Более подробно с методами математической статистики можно ознакомиться в специальной литературе (см. список).

 

Основы теории тестов

 

Измерение (испытание), проводимое с целью определения состояния или способностей спортсмена, называется тестом. Не всякие измерения могут быть использованы как тесты, а только те, которые отвечают специальным требованиям: стандартность, наличие системы оценок, надёжность, информативность, объективность. Тесты, удовлетворяющие требованиям надёжности, информативности и объективности, называют добротными.

Процесс испытания называется тестированием, а полученные в итоге измерения числовые значения – результатом тестирования.

Тесты, в основе которых лежат двигательные задачи, называют двигательными, или моторными. В зависимости от задания, которое стоит перед исследуемым, различают три группы двигательных тестов (табл. 2).

Таблица 2



Поделиться:


Последнее изменение этой страницы: 2021-12-07; просмотров: 196; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.222.118.159 (0.042 с.)