T-критерий Стьюдента для зависимых выборок 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

T-критерий Стьюдента для зависимых выборок




Цель метода: определить, есть ли достоверные статистические различия между средними значениями генеральных совокупностей, из которых сформированы две исследуемые зависимые выборки.

Нулевая гипотеза: между средними значениями генеральных совокупностей, из которых сформированы две исследуемые зависимые выборки отсутствуют достоверные статистические различия (M1=M2)
Альтернативная гипотеза: между средними значениями генеральных совокупностей, из которых сформированы две исследуемые зависимые выборки есть достоверные статистические различия. Среднее значение первой выборки достоверно выше среднего значения второй выборки или среднее значение второй выборки достоверно выше среднего значения первой выборки.

Ограничения метода:

 

4. Каждого значение по одной переменной, логически сопоставлено со значением другой переменной (признак измерен на одной и той же выборке дважды, выборки имеют одинаковый размер);

5. Данные двух выборок положительно коррелируют между собой (если данные коррелируют между собой отрицательно, то целесообразно использовать t-критерий для независимых выюорок);

6. Измеренные данные в выборках подчиняются закону нормального распределения (если требование не выполняется, в качестве альтернативы используют непараметрический T-критерий Вилкоксона); где Md – средняя разность значений; σd – стандартное отклонение разностей, N-размер выборки.
Для определения уровня значимости используется таблица критических значений t-критерия Стьюдента. В случае если tэпирическое≥tкритическое, то нулевая гипотеза о равенстве средних отклоняется, на выбранном уровне статистической значимости.

 

23. Доверительный интервал. Доверительная вероятность.

Доверит. Интервал – случайный интервал, который накрывает неизвестную искомую хар-ку с доверит. вероятностью Р. Используют для того, чтобы статистически оценить искомое, неизвестное значение генеральной совокупности. Построение доверит инт. происх след. Образом: 1. зад-ся дост. большая веро-ть Р (Р = 0,9; 0,95; 0,99; 0,999)так, чтобы события заключ-ся в нахождении искомой величины, можно было подсчитать достаточно дост-но. Эту веро-ть наз. Доверит. Вероятностью. Чаще всего в биологич. и спорт исслед-х Р=0,95. 2. Затем для заданной величины Р расчит. по формулам нижнюю и верхн. границу доверит интервала (генерального среднего значения нормального распределения. См. вопрос №24)

 

24. доверительный интервал для оценки генерального среднего нормального распределения.

Доверит. Интервал – случайный интервал, который накрывает неизвестную искомую хар-ку с доверит. вероятностью Р.

Чтобы статистически оценить искомое истинное значение характеристики Q, поступают следующим образом:

1) Задаются некоторой достаточно большой вероятностью p (например, p = 0,9; 0,95; 0,99; 0,999), чтобы событие, заключающееся в нахождении искомого значения Q с этой вероятностью в соответствующем интервале можно было считать статистически достоверным. Эту вероятность называют доверительной вероятностью. В спортивных исследованиях обычно принимают p = 0,95 (иногда 0,99).

2) Затем для заданной величины p рассчитывают по формулам математической статистики нижнюю Q1 и верхнюю Q2 границы интервала Jp.

Доверительным интервалом Jp называют случайный интервал (Q1, Q2), который накрывает неизвестную характеристику Q с доверительной вероятность p.

Границы доверительного интервала Jp называют:

Q1 = Q* - e1 – нижней доверительной границей;

Q2 = Q* - e2 – верхней доверительной границей.

Значения e1 и e2 могут совпадать (при симметричном распределении Q*) и быть разными (при несимметричном распределении Q*). Они характеризуют точность, а вероятность p – надежность определения Q. Между надежностью и точностью существует обратная зависимость: чем выше надежность, тем ниже точность определения Q и наоборот.

С увеличением числа измерений при заданном p повышается точность определения Q (уменьшаются e1 и e2).

Для точного расчета границ доверительного интервала необходимо знать закон распределения выборочной характеристики Q*.

 

5.5.2. Доверительные интервалы для оценки среднего значения нормального распределения.

Задача определения доверительных интервалов для оценки генерального среднего арифметического значения x г нормального распределения решена математической статистикой для следующих двух случаев:

а) генеральная дисперсия известна;

б) генеральная дисперсия неизвестна.

Рассмотрим второй случай.

В этом случае искомое генеральное среднее арифметическое находится в следующем доверительном интервале:

 

x - taS x < x г < x + taS x,

где x – среднее арифметическое значение выборки; ta – величина, которая находится по таблицам распределения Стьюдента в зависимости от числа степеней свободы k = n - 1, уровня значимости a; S x стандартная ошибка среднего арифметического, рассчитывается по формуле:

 

s

S x = – –.

Ö n

 

25. тесты (определения, требования)

Тест – измерение или испытание, которое проводится с целью определения способности спортсмена, его состояния, уровня подготов-ти. Тесты в основе которых лежат двигат. задания – наз двигательнами или моторными. К тестам предъявл. След требовани я: роцедура по провед тестов должна быть строго регламентирована, наличие системы оценок, требования надежности, информативности.

Тесты, кот отвеч требован надежности и инф-ти назыв добротными или аутентичными.

Классиф тестов: 1 группа- контрольные упр – тесты, в которых испытуемый должен показать наилучший рез-т при выполн стандарт упр. 2 группа – стандарт функцион. пробы – это тесты, в кот провер-ся: А) физиологич и биохим показатели при стандарт-й нагрузке (20 приседаний). Б) двигат показатели при станд величине двигат сдвигов(регистрир скорость бега при ЧСС 60 уд/мин) В) макс функц пробы-тесты, в которых фиксируется физиологич или биохим показатели при макс нагрузках (работа на велоэргометре)

26. надежность тестов

Надежностью теста называется степень совпадения результатов при повторном тестировании одних и тех же людей (или других объектов) в одинаковых условиях. Вариацию результатов при повторных измерениях называют внутрииндивидуальной или (используя более общую терминологию математической статистики) внутригрупповой либо внутриклассовой. Четыре основные причины вызывают эту вариацию.

1. Изменение состояния испытуемых (утомление; врабатывание; научение; изменение мотивации, концентрации внимания и т.п.)

2. Неконтролируемые изменения внешних условий и аппаратуры (температура, ветер, влажность, напряжение в электросети, присутствие посторонних лиц и т.п.), т.е. все то, что объединяется термином «случайная ошибка измерения».

3. Изменение состояния человека, проводящего или оценивающего тест (и, конечно, замена одного экспериментатора другим или замена судьи).

4. Несовершенство теста (есть такие тесты, которые заведомо малонадежны, например, штрафные броски в баскетбольную корзину до первого промаха. Даже баскетболист, имеющий высокий процент попадания, может случайно ошибиться при первых бросках).

Различают след разновидности надежности тестов: стабильность, согласованность, эквивалентность. См вопрос № 27,28,29.

Пути повышения надежности теста.

Надежность тестов может быть повышена до определенной степени путем:

а) более строгой стандартизации тестирования;

б) увеличения числа попыток;

в) увеличения числа оценщиков (судей, экспертов) и повышения согласованности их мнений;

г) увеличения числа эквивалентных тестов;

д) лучшей мотивации испытуемых.

Среди упомянутых путей следует выделить, отличающееся высокой эффективностью, повышение надежности путем увеличения длины теста. Удлинение теста достигается увеличением числа попыток, числа испытуемых и того и другого вместе.

При увеличении длины теста в m раз надежность теста rtt возрастает до величины r0tt, приближенно равной:

m * rtt

r0tt = – – – – – –.

1 + (m - 1) rtt

Из этой формулы можно определить, во сколько раз нужно увеличить тест, чтобы получить желаемую надежность r0tt:

r0tt (1 - rtt)

m = – – – – –.

rtt (1 - r0tt)

Очевидно, что целесообразно повышать длину теста лишь при не слишком больших величинах m. При значениях m, трудно реализуемых практически, лучше ненадежный тест заменить другим, более надежным.

 

 

27. стабильность тестов

Под стабильностью теста понимают воспроизводимость результатов при его повторении через определенное время в одинаковых условиях. Повторное тестирование обычно называют ретестом. Схема оценки стабильности теста такова:

 

ВРЕМЕННОЙ

ТЕСТ РЕТЕСТ

ИНТЕРВАЛ

 

Степень надежности тестов определяется с помощью коэффициентов взаимосвязи, полученных из корреляционного или дисперсионного анализа.

Выбор коэффициента взаимосвязи зависит от типа применяемой шкалы измерений, от числа выполненных попыток (попыткой считается, например, исходное или повторное тестирование) и количества факторов, влияние которых надо исследовать.

Если изучается влияние только одного фактора и при этом количество попыток не более двух, то надежность теста может быть приближенно оценена с помощью коэффициента корреляции между тестом и ретестом. В остальных случаях рекомендуется использовать дисперсионный анализ.

Стабильность теста зависит от:

1) вида теста;

2) контингента испытуемых;

3) временного интервала между тестом и ретестом.

Например, морфологические характеристики при небольших временных интервалах весьма стабильны; наименьшую стабильность имеют тесты на точность движений (например, броски в цель).

У взрослых результаты тестирования более стабильны, чем у детей; у спортсменов – более стабильны, чем у не занимающихся спортом.

С увеличением временного интервала между тестом и ретестом стабильность теста снижается

28. согласованность тестов

Согласованность хар-ся независимостью результатов тестирования от личных качеств лица, проводящего или оценивающего тест. Согласованность определяется по степени совпадения результатов, полученных на одних и тех же испытуемых разными экспериментаторами, судьями, экспертами. При этом возможны два варианта:

1) лицо, проводящее тест, только оценивает его результаты, не влияя на них. Например, одну и ту же письменную работу разные экзаменаторы могут оценивать по-разному. Нередко различаются оценки судей в гимнастике, фигурном катании на коньках, боксе, показатели ручного хронометрирования, оценка электрокардиограммы или рентгенограммы разными врачами и т.п.;

2) лицо, проводящее тест, влияет на его результаты. Например, некоторые экспериментаторы более настойчивы и требовательны, чем другие, лучше мотивируют испытуемых. Это сказывается на результатах (которые сами по себе могут измеряться вполне объективно).

Согласованность теста – это, по существу, надежность оценки его результатов при проведении теста разными людьми.

Особенно актуальна задача оценки согласованности при количественном определении качественных показателей.

29. эквивалентность тестов

Эквивалентность хар-ся степенью совпадения рез-тов, получаемых на одних и тех же испытуемых в одних условиях, при использовании разных тестов, предназнач для проверки одного и того же св-ва или кач-ва. Например, броски в баскетбольную корзину можно выполнять с разных точек; спринтерский бег может проводиться на дистанции, скажем, 50, 60 или 100 м; подтягивания можно выполнять на кольцах или перекладине, хватом сверху или снизу и т.п. В таких случаях может использоваться так называемый метод параллельных форм, когда испытуемым предлагают выполнить две разновидности одного и того же теста и затем оценивают степень совпадения результатов. Схема тестирования здесь следующая:

 

МИНИМАЛЬНЫЙ

ФОРМА АФОРМА Б

ВРЕМЕННОЙ ИНТЕРВАЛ

 

Рассчитанный между результатами тестирования коэффициент корреляции называют коэффициентом эквивалентности. Отношение к эквивалентности тестов зависит от конкретной ситуации. С одной стороны, если два или больше тестов эквивалентны, их совместное применение повышает надежность оценок; с другой – может оказаться полезным применять только один эквивалентный тест: это упростит тестирование и лишь незначительно снизит информативность батареи тестов. Решение этого вопроса зависит от таких причин, как сложность и громоздкость тестов, степень необходимой точности тестирования и т.п.

Весь этот комплекс измеряет одно какое-то свойство моторики человека. Скажем, комплекс, состоящий из прыжков с места в длину, вверх и тройного, вероятно, будет гомогенным Группа тестов, использ-х для оценки состояния или подгот-ки сп-на, назыв батареей тестов. Если все тесты в этой группе высокоэк-ны, то эта группа наз гомогенной.

Наоборот, если в комплексе нет эквивалентных тестов, то все тесты, входящие в него, измеряют разные свойства. Такой комплекс называется гетерогенным. Пример гетерогенной батареи тестов: подтягивание на перекладине, наклон вперед (для проверки гибкости), бег на 1500 м.

 

30. Информативность тестов (определение, общая характеристика)

Информативность- это то, на сколько тест соответствует своему назначению. Др. словами – это степень точности, с которой данный тест измеряет свойства или качества, для оценки которого он служит. Вопрос об информативности распадается на 2 частных вопроса:

1.что измеряет данный тест?

2.как точно он измеряет? Например. можно ли по такому показателю как МПК, судить о подготовленности бегунов-стайеров, и если модно, то с какой степенью точности? Иными словами какова информативность МПК у стайеров? Можно ли использовать этот тест в процессе контроля? Если тест используется для определения состояния в момент обследования, то говорят о диагностической информативности теста. Если же на основе результатов тестирования хотят сделать вывод о возможных будущих показателях спортсмена,- о прогностической информативности. Тест может быть диагностически информативен, а прогностически нет, и наоборот. Степень информативности может характеризоваться количественно на основе опытных данных (эмпирическая инф-ть) и качественно- на основе содержательного анализа ситуации(содержательная или логическая инф-ть). Коэффициент информативности очень сильно зависит от надежности теста и критерия. Прослеживается зависимость между надежностью и информативностью теста. Тест с низкой надежностью и как правило мало информативен, поэтому нет смысла малонадежные тесты проверять на информативность. Тесты не отвечающие требованиям высокой надежности и информативности не является добротным, их нельзя использовать в спорт. практике.

 

31. Эмпирическая и логическая информативность.

Логическая (содержательная) инф-ть- информативность, выведенная на основе качественного анализа. Суть заключается в логическом сопоставлении биомеханических, физиологических, психологических и других характеристик критерия и тестов. Чаще всего логический метод определения информативности используется в видах спорта, где нет четкого количественного критерия, например, в спортивных играх логический анализ фрагментов игры позволяет в начале сконструировать специфический тест, а затем проверить его информативность. Эта процедура позволяет отсеять заведомо неинформативные тесты, содержательная информативность которых мало соответствует структуре основной деятельности спортсменов. Остальные тесты, содержательная информативность которых признана высокой. Должны пройти дополнительную эмпирическую проверку.

Эмпирическая инф-ть- в качестве показателя информативности эмпирич. инф-ти могут быть использованы коэффициенты корреляции, взятые из корреляционного анализа. Выбор коэффициента корреляции зависит от шкалы измерения. При оценки информативности устанавливают связь между тестом и критерием. Поэтому наиболее сложным вопросом при оценки информативности является выбор критерия. Чаще всего в спортивной метрологии критериями служат: -Спортивный результат, - какая-либо важная биомеханическая характеристика соревновательной деятельности (скорость разбега, сила отталкивания и др.), - другой тест, высокая информативность которого доказана,- Составной критерий(сумма очков в многоборье). В видах спорта, где нет объективной оценки спорт. Мастерства, вводится искусственный критерий, например, в командных спортивных играх эксперты ранжируют игроков по мастерству, его ранг, это рассматривается как критерий с которым сравнивают результат тест.



Поделиться:


Последнее изменение этой страницы: 2016-08-14; просмотров: 825; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.118.200.136 (0.045 с.)