Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь FAQ Написать работу КАТЕГОРИИ: ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву
Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Непараметрические (свободные от распределения) критерии однородности статистических данныхСодержание книги
Похожие статьи вашей тематики
Поиск на нашем сайте СПИСОК ОБОЗНАЧЕНИЙ
μ – математическое ожидание;
α – уровень значимости; N(0,1) – нормальное стандартное распределение;
ВВЕДЕНИЕ Данная курсовая работа посвящена изучению непараметрических критериев однородности статистических данных, которые позволяют проверять различные статистические гипотезы, не зная законов распределения случайных величин. Непараметрический критерий особенно пригоден, когда объем выборки небольшой (настолько, что невозможно было бы оценить закон распределения данных) и данные выражаются в категориальной шкале [5]. Курсовая работа состоит из трех глав. Первая глава посвящена теоретическим основам. В ней рассмотрены существующие непараметрические критерии однородности в статистических данных, их математические модели и применение. Во второй главе, используя данные, полученные из теории, показана реализация непараметрических критериев в статистическом пакете R. Третья глава посвящена исследованиям реализованных критериев. Было проведено исследование распределения статистик рассматриваемых гипотез при "малых" и "больших" выборках. Исследовано распределение статистик по критериям согласия Колмогорова и Смирнова. Была построена эмпирическая функция мощности критериев. Также были собраны реальные данные и проведен анализ данных изученными методами. Реализация критериев и исследования были выполнены при помощи статистического пакета R. Непараметрические критерии сдвига Сравнение параметров сдвига двух совокупностей Быстрый (грубый) критерий Кенуя Пусть Вычисляется среднее значение
со стандартным отклонением
Для очень несимметричных распределений используются оценки
Проверка разности в параметрах положения проверяется критерием
(индексы относятся к номерам проверяемых выборок). При объемах проверяемых выборок свыше 20 статистика критерия распределена нормально. Поэтому нулевая гипотеза отсутствия сдвига не отклоняется при доверительной вероятности α, если Критерий устойчив к отклонениям от нормальности, имеет эффективность по сравнению с параметрическим критерием Стьюдента не хуже ≈93%. Ранговые критерии основываются на последовательности рангов выборочных значений случайных величин. При этом рассматриваются не сами выборочные значения, а их ранги, определяемые порядковым номером элемента выборки в общем ряду, упорядоченном по возрастанию. Например, в упорядоченной выборке Быстрый (грубый) ранговый критерий Рассматриваются две выборки объемов Вычисляем
Поэтому при Эффективность критерия для нормально распределенных выборок 0,95 (для любого другого исходного распределения — не хуже 0,86). Критерий Фишера-Йэйтса-Терри-Гёфдинга Критерий основан на статистике Для
Гипотеза сдвига отклоняется, если статистики Фишера-Йэйтса-Терри-Гёфдинга [1]. Критерий Ван дер Вардена Статистика критерия имеет вид
где Для вычисления квантилей
Гипотеза сдвига отклоняется, если При
Если При Медианный критерий Статистика критерия строится следующим образом. Находится медиана
При
Если
то с достоверностью Иногда применяется другая форма медианного критерия. Пусть А и С — количества элементов выборки
имеющая, при отсутствии сдвига, распределение хи-квадрат с Критерий неприменим, если А, В, С или D < 5 и Критерий Мостеллера Гипотеза равенства средних двух выборок одинакового объема Критерий Розенбаума Применим для двух выборок равного объема. Если не менее 5 (для Критерий рекомендуется использовать для быстрой приближенной проверки гипотезы сдвига [1]. 1.1.2 Сравнение параметров сдвига нескольких ( Критерий Круcкала—Уоллиса Пусть в нашем распоряжении имеются
Упорядочим все Статистика критерия Крускала-Уоллиса для проверки гипотезы о наличии сдвига в параметрах положения нескольких сравниваемых выборок имеет вид [1]
где Критерий Крускала-Уоллиса является многомерным обобщением двухвыборочного критерия Вилкоксона-Манна-Уитни. Гипотеза сдвига отклоняется на уровне значимости α, если Аппроксимация Крускала-Уоллиса. Пусть [1]
Тогда статистика [1]
будет иметь при отсутствии сдвига -распределение с
Аппроксимация Имана-Давенпорта. В соответствии с ней нулевая гипотеза сдвига отклоняется с достоверностью α, если [1]
где
Это более точная аппроксимация, чем аппроксимация Крускала-Уоллиса. При наличии связанных рангов (т. е. когда совпадают значения величин из разных выборок и им присваивается одинаковые средние ранги) необходимо использовать модифицированную статистику [1]
где
При Критерий Неменьи Критерий применим для выборок равного объема Гипотеза сдвига считается принятой, если Критерий Вилкоксона—Вилкокс Критерий подобен критерию Неменьи. Пусть имеются
Статистикой критерия является разность
где При Так же, как и критерий Неменьи, настоящий критерий позволяет выявить выборки, приводящие к отклонению нулевой гипотезы [1]. 1.1.2.4. „Быстрый” критерий Кенуя Среди Критерий Ван дер Вардена Статистика Ван дер Вардена для
При справедливости нулевой гипотезы статистика Медианный критерий Для множественного аналога двухвыборочного медианного критерия используется статистика
имеющая при Критерий Хеттманспергера Используется для проверки равенства параметров положения
Нулевая гипотеза отклоняется с достоверностью α, если
где
при Как и в критерии Крускала-Уоллиса, приняты обозначения
и Критерий Ансари—Бредли Является масштабным аналогом критерия Вилкоксона. Сравниваются две выборки
Вычисление статистики критерия может быть выполнено и другим, более простым методом. Поставим элементам упорядоченной по возрастанию выборки
Тогда статистика критерия равна
т. е. она определяется суммой специальным образом назначенных рангов одной выборки. Легко видеть, что при четном (
а при нечетном (
Гипотеза равенства параметров масштаба не отклоняется с достоверностью α, если [1]
где При
где
Нулевая гипотеза равенства параметров масштаба в двух выборках принимается с достоверностью α, если [1]
Эффективность критерия по сравнению с F-критерием в случае нормального распределения равна Критерий Муда Рассмотрен в качестве альтернативы критерию, основанному на F-статистике Фишера, когда вместо наблюдений используются их ранги. Статистика критерия имеет вид [1]
где Нулевая гипотеза равенства параметров масштаба в обеих выборках принимается, если [1]
где При
где
Нулевая гипотеза принимается, если [1]
Эффективность критерия Муда по отношению к F-критерию в случае исходного нормального распределения равна 0,76. Необходимо отметить, что критерий Муда (как и все ранее рассмотренные критерии) предполагает равенство средних (параметров положения). Критерий Сижела-Тьюки Сижел и Тьюки предложили преобразование критериев сдвига в критерии масштаба. Суть их способа сводится к преобразованию первичной упорядоченной объединенной выборки. Пусть
(т. е. оставшийся ряд „переворачивается" каждый раз после приписывания рангов паре крайних значений). Далее проверка гипотезы о разности параметров масштаба в двух выборках аналогична проверке гипотезы сдвига в новой последовательности с описанным правилом нумерации рангов. Если использовать в качестве критерия проверки нулевой гипотезы сумму рангов
Здесь При
Если Критерий Кейпена Является масштабным аналогом критерия Фишера-Йэйтса-Терри-Гёфдинга. Если
где Нулевая гипотеза отклоняется, если
где При
где
При Квартальный критерий Критерий является интуитивным аналогом медианного критерия сдвига. Статистика критерия имеет вид
Название критерия исходит из того, что S приблизительно равно числу наблюдений из первой выборки, лежащих за пределами первой и третьей квартилей объединенной выборки. Точнее, S получается, если подсчитать количество наблюдений При
Поэтому нулевая гипотеза равенства параметров масштаба принимается, если
где α – доверительная вероятность. Эффективность критерия по сравнению с F-критерием в случае нормального распределения невелика и равна ≈ 0,37, поэтому им рекомендуется пользоваться при
Реализация критерия Муда В статистическом пакете R сформируем две выборки по стандартному нормальному закону распределения с объемами выборок Увеличим объем выборок. При Для данных выборок по критерию Муда принимается гипотеза ИССЛЕДОВАНИЯ 3.1. Исследование распределения статистик рассматриваемых гипотез при "малых" и "больших" выборках Рассмотрим критерий Манна-Уитни-Вилкосона. При выполнении гипотезы
Методом Монте-Карло смоделируем выборку, состоящую из статистик Вилкоксона при выполнении гипотезы
Рисунок 3.1 – График теоретической и эмпирической функций распределения статистики Вилкоксона критерия Манна-Уитни-Вилкоксона при объеме смоделированных значений статистик mm=100 и объеме выборок m=25 и n=30, моделируемых по стандартному нормальному закону распределения (α=0,05)
Рисунок 3.2 – График теоретической и эмпирической функций распределения статистики Вилкоксона критерия Манна-Уитни-Вилкоксона при объеме смоделированных значений статистик mm=1000 и объеме выборок m=25 и n=30, моделируемых по стандартному нормальному закону распределения (α=0,05) Из рисунков 3.1 и 3.2 видим, что при увеличении объема выборки эмпирическая функция распределения статистики стремится к ее теоретической функции распределения. Реальные данные 1. Имеются две выборки случайных величин:
Необходимо проверить гипотезу сдвига критериями группы Манна-Уитни-Вилкоксона при доверительной вероятности α=0,95. При реализации данного критерия c заданными выборками в статистическом пакете R получаем, что по статистике Манна-Уитни гипотеза сдвига отклоняется. Ограничим исходную выборку восьмью значениями.
Применив критерий Манна-Уитни-Вилкоксона для полученной выборки получаем, что по статистике Манна-Уитни и по ранговой статистике Вилкоксона гипотеза сдвига отклоняется. 2. Перед началом игры двум группам детей дошкольного возраста показали два мультипликационных фильма. Одна группа (условие А) просмотрела фильм, содержание которого было с ярко выраженными агрессивными элементами; второй группе (условие В) был показан фильм без каких-либо агрессивных элементов. После просмотра фильмов каждый ребенок некоторое время играл отдельно от своих товарищей, причем опытные наблюдатели зарегистрировали количество поступков агрессивного характера, совершенных ребенком по отношению к его игрушкам в течение этого периода. Отметкой для каждого ребенка в данном случае является общее число совершенных им подобных поступков, которые, однако, различаются по характеру и по силе. Поэтому исследователи сочли более правильным рассматривать эти отметки только как относительную меру агрессивности (порядковая шкала). Полученные результаты были следующими [4]: Условие А: 26,22,19,21,14,18,29,17,11,34; Условие В: 16,10,8,13,19,11,7,13,9,21;
Проверить какая гипотеза выполняется с помощью критерия Манна-Уитни-Вилкоксона. Воспользовавшись реализацией данного критерия в статистическом пакете R, получили следующие результаты: по статистике Манна-Уитни и по ранговой статистике Вилкоксона принимается гипотеза 3. Чтобы установить, отличаются ли механизмы фатальной соевой астмы от механизмов обычной фатальной астмы, число CD3+ Т-клеток в подслизистой основе, показателе иммунной системы организма, сравнили с числом клеток в 7 случаях фатальной соевой астмы и в 10 случаях фатальной астмы. Из-за маленьких размеров выборки и явно скошенных (асимметричных) данных используем двухвыборочный критерий Манна-Уитни-Вилкоксона [5]. Соевая астма: 0,00; 0,00; 0,00; 1,36; 1,43; 4,01; 34,45. Фатальная астма: 3,76; 4,32; 13,75; 37,50; 58,33; 73,63; 74,17; 99,99; 154,86; 1225,51. Рассматриваются гипотезы:
Используем критерий Манна-Уитни-Вилкоксона для данных выборок и получаем, что механизмы фатальной соевой астмы отличаются от механизмов обычной фатальной астмы (принимается гипотеза 4. В результате наблюдений получены пять выборок случайных величин (k = 5)
Необходимо проверить гипотезу об отсутствии сдвига между параметрами положения в выборках критерием Крускала-Уоллиса на уровне значимости α=0,05 [1]. Используя реализацию данного критерия в статистическом пакете R получаем следующий результат: по аппроксимации Крускала-Уоллиса и по аппроксимации Имана-Давенпорта гипотеза сдвига принимается. 5. Имеются две выборки случайных величин:
Проверить гипотезу равенства параметров масштаба в выборках критерием Ансари-Бредли при достоверности α=0,95 [1]. При проверке получаем, что гипотеза равенства параметров масштаба принимается. 6. Даны две выборки случайных величин:
Поверить гипотезу равенства параметров масштаба критерием Муда при достоверности α=0,95 [1]. Применив критерий Муда к данным выборкам, получаем, что гипотеза равенства параметров масштаба принимается. 7. 95 призванных на военную службу мужчин в возрасте 16-20 лет прошли осмотр зубов, когда зачислялись в Королевские вооруженные силы. Их зубы были осмотрены через год после лечения. У человека 28 зубов кроме зубов мудрости, и в этом исследовании каждый зуб имел 4 интересующие дантистов точки; каждый участник имел минимум 84 и максимум 112 измеряемых точек. Изучали влияние лечения на глубину десневого кармана (большая глубина кармана означает ухудшение состояния зуба). Данные показывают процент измеряемых сайтов, для которых была утрата прикрепления при каждой оценке в каждом из 14 этих участников. Утрата прикрепления — показатель заболевания десен, которое может
|
||
|
Последнее изменение этой страницы: 2016-08-16; просмотров: 2631; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 216.73.216.119 (0.014 с.) |