Применение параметрических и непараметрические критериев к оценке статистических гипотез 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Применение параметрических и непараметрические критериев к оценке статистических гипотез



(ПЗ-2,3 (упражнение) – 4 часа)

Учебные цели:

1. Закрепить знания по основам математической статистики, изученным в ходе предшествующей подготовки, и материал, доведенный на лекциях.

2. Изучить порядок обработки результатов статистического наблюдения.

 

Учебные вопросы:

1. Нормальное распределение и статистические оценки

2. Статистические распределения и их применение в экономических исследованиях.

Непараметрические методы в анализе экономических процессов.

Время проведения: 2+2 часа.

Место проведения и учебно-материальное обеспечение: компьютерный класс со стандартным матобеспечением.

Метод проведения: упражнение.

1-й учебный вопрос. Нормальное распределение и статистические оценки

 

Используя навыки предшествующего занятия самостоятельно решить следующую задачу:

«Служба маркетинга фирмы анализирует продажи. Сведения об объеме ежедневных продаж товара (в тыс. ден. ед.) за последние 100 дней приведены для каждого варианта в прил. 1.

1.Построить:

интервальный вариационный ряд;

полигон и гистограмму (на одном рисунке);

кумуляту (на другом рисунке).

2.Вычислить выборочные характеристики: среднее, дисперсию, среднее квадратическое отклонение, коэффициент вариации, асимметрию, эксцесс, моду, медиану.

3. Заменив параметры нормального закона распределения их выборочными характеристиками, рассчитать и построить графики функции плотности и функции распределения нормального закона, наложив эти графики соответственно на полигон и кумуляту.

ПРИЛОЖЕНИЕ 1

Исходные данные

для построения интервального вариационного ряда,

оценивания нормального закона распределения и его параметров

(разделитель между числами - пробел)

1 вариант

0,91 0,62 1,07 1,38 1,36 1,52 0,34 0,93 1,33 0,67 0,79 0,49 0,45 0,71 0,77 0,36 0,83 0,88 1,04 0,89

0,90 0,89 1,40 0,97 0,94 0,85 1,59 1,26 1,71 0,80 1,50 0,52 1,16 1,27 1,58 0,97 0,84 1,20 0,89 1,23

0,57 0,75 0,54 0,89 0,99 1,01 0,90 1,66 0,48 0,78 0,23 1,43 0,62 0,80 1,23 1,14 1,26 1,18 0,59 0,67

1,21 1,10 0,72 0,93 1,04 1,17 1,04 0,73 1,57 1,15 1,02 1,25 1,26 0,81 0,72 1,33 0,64 0,53 1,21 1,19

1,66 1,43 1,39 1,03 1,00 1,14 0,99 0,68 0,47 1,25 1,13 1,19 1,06 0,69 1,37 0,91 0,75 0,75 0,87 0,86

2 вариант

2,39 1,80 1,91 1,64 1,91 0,66 1,92 1,20 2,09 2,30 2,79 1,63 1,55 2,09 1,86 1,88 2,95 2,02 1,91 3,10

1,62 2,76 1,99 1,96 2,97 2,22 2,26 1,86 2,41 1,96 1,56 1,34 2,12 1,41 3,16 1,92 1,05 1,80 2,57 1,77

1,61 1,18 2,19 1,90 2,34 1,62 1,79 2,17 1,80 2,13 0,52 1,96 2,15 3,27 1,08 1,06 0,62 2,70 3,42 1,77

1,40 2,33 2,40 1,49 2,49 2,40 1,88 1,07 2,61 2,46 1,79 1,59 2,52 2,21 2,33 3,25 2,16 1,34 2,29 1,26

2,34 1,91 2,18 2,21 2,08 1,84 1,19 3,27 2,96 2,63 1,11 1,33 2,32 2,04 1,99 2,10 0,87 1,85 1,44 1,40

3 вариант

2,54 3,42 3,32 2,92 2,90 3,81 1,47 1,46 3,52 4,64 1,52 4,12 3,87 3,82 2,53 2,98 3,36 2,95 5,26 2,24

3,65 3,55 3,60 3,63 3,22 3,58 1,73 1,34 4,03 4,33 2,94 4,01 3,25 1,74 3,29 3,08 2,90 2,81 3,95 3,20

3,41 3,67 2,34 3,29 3,16 3,00 2,89 3,72 3,15 2,55 4,71 2,86 3,71 3,33 2,97 4,38 2,76 3,74 2,25 4,03

2,96 2,79 0,51 3,52 3,65 2,94 1,00 2,42 4,05 3,12 3,21 3,61 3,18 2,65 2,50 2,13 3,20 2,35 3,72 2,94

2,80 5,11 2,76 2,62 3,98 2,60 1,63 1,97 3,20 2,76 3,03 3,50 2,83 4,14 2,93 3,93 3,76 1,17 3,12 3,33

4 4,95 4,03 4,16 5,09 3,10 4,78 3,64 2,96 3,02 3,61 2,64 1,44 4,55 5,11 3,04 3,83 3,61 4,77 4,28 3,85

3,52 4,27 4,18 4,12 3,74 3,53 3,54 2,08 5,85 3,62 2,47 3,79 4,25 2,97 2,76 3,66 3,81 3,37 3,28 3,69

3,09 4,39 5,11 3,56 5,47 5,68 3,51 5,39 3,62 4,12 4,53 2,37 5,07 6,73 2,36 3,59 6,53 4,65 3,92 5,59

3,15 3,57 2,61 3,99 4,85 3,20 2,52 3,90 3,58 1,06 5,22 2,90 4,48 3,06 5,06 6,24 5,21 2,79 6,73 5,86

5,89 3,27 2,03 4,12 4,61 4,21 5,10 3,42 6,01 4,17 1,84 4,69 5,18 5,79 6,09 3,78 3,76 4,37 5,21 2,04

5 5,73 5,87 3,14 4,29 5,37 4,77 3,35 3,11 4,45 5,49 5,89 3,70 5,12 5,97 5,26 6,61 5,95 3,45 4,53 7,68

6,98 7,99 5,16 5,28 5,35 6,26 3,22 5,68 7,57 4,26 8,23 3,99 5,44 4,69 5,56 5,25 7,80 6,69 5,12 6,62

3,77 6,67 3,88 4,18 5,43 6,08 5,12 4,56 4,44 4,38 6,03 6,09 4,60 5,77 3,43 4,92 5,68 4,24 7,00 5,53

4,00 3,91 5,39 5,99 5,13 2,89 4,91 4,58 3,99 5,66 5,13 5,62 4,37 1,40 6,09 2,54 4,65 5,17 4,97 3,02

7,00 4,16 3,51 5,23 5,68 6,08 5,19 4,91 1,90 4,64 6,20 5,92 9,01 4,43 2,34 5,32 2,14 3,79 4,36 6,51

Указание. Задачу решить в пакете EXCEL.

2-й учебный вопрос. Статистические распределения и их применение в экономических исследованиях

Задание 1.

С помощью t -теста решите следующую задачу.

По имеющимся данным =118,2, n = 16, sX =3,6 и при уровне значимости α = 5% проверить:

H 0: MX =120 при H 1: MX ¹ 120.

Задание 2.

Проверьте расчетами правильность ответа в следующей задаче:

 

«По данным: проверить H 0:

Ответ: Поскольку расчетное значение критерия меньше табличного, то H 0отвергается с уровнем значимости 5%.»

Сведения из теории:

Статистической называется гипотеза о виде неизвестного распределения либо о параметрах известного распределения. Например, требуется проверить гипотезу о равенстве математического ожидания MX гипотетическому значению C.

Проверяемую гипотезу называют нулевой и обозначают H 0. Гипотезу, противоречащую нулевой, называют конкурирующей (альтернативной) и обозначают H 1. Конкурирующие гипотезы могут быть трех типов. Например, для H 0: MX = C могут применяться следующие альтернативные гипотезы:

· H 1: MX > C («больше чем») – положительное отклонение оцениваемого параметра MX от гипотетического значения С;

· H 2: M X < C («меньше чем») – отрицательное отклонение оцениваемого параметра MX от гипотетического значения С;

· H 3: M XC («не равно») – отклонение оцениваемого параметра MX от гипотетического значения С по абсолютной величине.

Статистические гипотезы проверяются с помощью критериев значимости, представляющих неравенства. Построение критерия значимости так же, как и построение доверительного интервала требует знания закона распределения оценки, используемой для этой цели. Для построения критерия значимости весь диапазон изменения величины, относительно которой проверяется H 0, разбивается на две области: область допустимых значений (ОДЗ) и критическую область (КО). При этом в зависимости от вида альтернативной гипотезы следует использовать критическую область трех типов: правостороннюю для H 1 (рис.1), левостороннюю для H 2 (рис.2) и двустороннюю для H 3 (рис.3).

Рис. 1. Рис. 2. Рис.3.

 

При попадании проверяемой величины в ОДЗ принимается H 0, а при ее попадании в КО H 0 отвергается и принимается альтернативная гипотеза H 1. Области допустимых значений соответствует вероятность β, а критической области – вероятность α =1− β, называемая уровнем значимости критерия. Уровень значимости критерия α есть вероятность попадания в КО в случае, когда справедлива H 0 или, что то же самое, вероятность отвергнуть H 0, когда она верна, а β - вероятность принятия H 0 в случае ее справедливости. Уровень значимости принято выражать в процентах. Обычно принимают α= 5%.

Например, проверка гипотезы о равенстве математического ожидания гипотетическому значению по критерию Стьюдента проводится по соотношению

 

где t α - квантиль распределения Стьюдента для числа степеней свободы n −1 и уровня значимости критерия α при правосторонней критической области.

При невыполнении данного условия принимается альтернативная гипотеза H 1.

Проверка гипотезы о равенстве двух дисперсий проводится по критерию Фишера:

,

где f - квантиль распределения Фишера для степеней свободы n 1−1 и n 2−1 при уровне значимости α.

Практические рекомендации

Для получения решения используйте окно статистических функций в EXCEL.

2-й учебный вопрос. Непараметрические методы в анализе экономических процессов.

Задание 3.

Установить достоверность различий в предпочтениях потребителей по отношению к новому товару.

Ряд X – контрольная выборка (число сделок по традиционному товару ежедневно).

Ряд Y – опытная выборка (число сделок ежедневно по инновационному товару).

X: 6, 25, 25, 30, 38, 39, 44 (nx =7).

Y: 8,30, 32, 41, 41, 46, 68, 100 (ny =8).

Необходимо определить достоверность различий в уровне продаж (предпочтениях потребителей).

 

 

Сведения из теории

Чаще всего установить характер распределения показателя не удается, а, следовательно, и установить параметры распределения нельзя. В этом случае приходится прибегать к непараметрическим критериям как основному методу разрешения проблемы.

Q-критерий Розенбаума используют для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. В каждой из выборок должно быть не менее 11 данных. Если Q -критерий выявляет различия между выборками с уровнем значимости р = 0,01, то можно ограничиться только им и избежать трудностей применения других критериев.

Содержательная формулировка статистических гипотез будет следующей:

Н 0: Уровень признака в выборке 1 не превышает уровня признака в выборке 2.

Н 1: Уровень признака в выборке 1 превышает уровень признака в выборке 2.

Алгоритм:

1. Проверяют выполнимость ограничений и .

2. Упорядочивают значения отдельно в каждой выборке по степени возрастания анализируемого показателя. Принимают за выборку 1 ту, значения в которой предположительно выше.

3. Определяют самое высокое (максимальное) значение показателя в выборке 2 (в которой значения предположительно ниже) и подсчитывают количество значений показателя в выборке 1, которые выше максимального значения в выборке, обозначая полученную величину как S 1.

4. Определяют самое низкое (минимальное) значение показателя в выборке 1 и подсчитывают количество значений в выборке 2, которые ниже минимального значения выборки 1. Обозначают полученную величину как S 2.

5. Подсчитывают эмпирическое значение критерия по формуле Qэмп = S 1 + S 2 и с помощью таблицы определяют критические значения Qкр для данных n 1 и n 2. Если Qэмп при уровне значимости 0,05 превышает Qкр, то гипотеза Н о отвергается.

Сравнение двух независимых выборок (опытной и контрольной) с помощью критерия Колмогорова-Смирнова

Применение критерия Колмогорова-Смирнова основано на предположении, что если сравниваемые группы наблюдения представляют собой выборки из одной совокупности, то ранги отдельных вариант обеих групп при объединении в один ранжированный ряд должны передаваться.

Критерий основан на сопоставлении рядов накопленных частостей сравниваемых групп и нахождении наибольшей абсолютной разности между ними.

Алгоритм критерия состоит в следующем.

1. Объединяются в один ряд в возрастающем порядке все варианты сравниваемых выборок (групп).

2. Записывают частоты вариант для одной и другой групп.

3. Представляют частоты в накопленном виде (Sx и Sy).

4. Определяют накопленные частости, т.е. накопленные частоты делят на число наблюдений (Sx / nx и Sy / ny).

5. Вычисляют разности накопленных частостей групп x и y без учета знаков | Sx / nx - Sy / ny |.

6. Находят максимальную разность D.

7. Определяют критерий

.

8. Сравнивают полученное значение λ2 с граничным λ20,05 . Если найденная λ2 > λ20,05, различия признаются существенными, в противном случае принимается Н 0-гипотеза, т.е. различия признаются несущественными.

Практические рекомендации

Задачу решите методом Колмогорова-Смирнова.

Задание на самостоятельную работу:

Задание 2.1.

В ходе тестирования 20 кандидатов на должность секретаря установлено, что в среднем они тратили 7 ми­нут на набор одной страницы сложного текста на компьютере при выборочном стандартном отклонении S = 2 минуты. Считая, что время (X)набора текста имеет нормальный закон распределения:

а) Определите 95%-й доверительный интервал для математи­ческого ожидания тх.

б) Оцените количество претендентов на работу, которые набрали текст быстрее, чем за 5 минут.

в) Предполагалось, что среднее время набора страницы текста должно составить 5,5 минуты. Не противоречат ли полученные данные этой гипотезе?

Задание 2.2

Моделирование продолжительности инновационного проекта проведено двумя способами: методом PERT и методом Монте-Карло. При этом получены следующие значения выборочных дисперсий времени завершения проекта: s 12 = 28,4 дн. 2 (для метода Монте-Карло из трех модельных прогонов) и s 2 2 = 16,5 дн. 2 (для метода PERT c 13 работами на критическом пути). Оцените гипотезу об одинаковой адекватности моделей.

Задание 3.1.

Сравнивается эффективность четырех разных методик контроля качества продукции. Для этой цели избраны четыре разных метода измерения точностных характеристик. Эффективность методик оценивалась по сумме зафиксированных несоответствий в течение семи дней (см. табл. 4.4). Проверьте гипотезу об отсутствии влияния регулируемого фактора (метода измерения) на действенность системы контроля.

 

Таблица 4.4

Эмпирические данные о несоответствиях, выявленные различными методами контроля

Номер дня контроля Количество выявленных несоответствий
1 метод 2 метод 3 метод 4 метод
         
         
         
         
         
         
         

Указание. Для решения используйте χ2-критерий.

Задание 3.2.

В табл. 3. представлены данные об общей стоимости (в тыс. ден. ед.) туров, проданных за последний месяц сотрудниками туристического агентства — восемью женщинами и девятью мужчинами.

 

 

Таблица 3

Женщины 11 12 16 13 18 15 13 14 n 1 = 8

Мужчины 7 10 14 15 12 16 14 12 12 n 2 = 9

Создается впечатление, что женщинам лучше удается продавать туры, чем мужчинам.

Проверить это предположение количественно на 5%-ном уровне значимости.

 

Отчет по требованиям ГОСТа в печатном виде представлять на очередное практическое занятие (по занятию 2 – на третье, по занятию три – по вопросам 2 и 3 – на четвертое).

 

 



Поделиться:


Последнее изменение этой страницы: 2016-12-17; просмотров: 400; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.12.71.237 (0.055 с.)