Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Интервальная оценка математического ожидания нормального распределения при неизвестной дисперсии

Поиск

 

В том случае, когда исследуемый признак имеет нормальное распределение с неизвестным математическим ожиданием а и неизвестной дисперсией , невозможно воспользоваться результатами п. 40.1, в котором дисперсия предполагалась известной.

В данном случае поступают следующим образом. По данным выборки строят случайную величину Т:

,

которая имеет распределение Стьюдента с k = n – 1 степенями свободы; здесь – выборочная средняя; S – исправленное среднее квадратическое отклонение; n – объем выборки.

Плотность распределения Стьюдента

,

где .

Распределение Стьюдента определяется единственным параметром n – объемом выборки и не зависит от неизвестных параметров а и . является четной функцией от t, вероятность осуществления неравенства определяется так:

.

Заменив неравенство равносильным ему двойным неравенством, получим

.

Последнее равенство представляет собой соотношение для доверительного интервала , покрывающий неизвестный параметр а с надежностью . Здесь и s – выборочные значения признака.

 

Задача. Получено следующее распределение 100 рабочих цеха по выработке в отчетном году (в % к предыдущему году):

 

Выработка в отчетной году (в % к предыдущему году)            
Количество рабочих            

 

Предположим, что выработка на одного рабочего в отчетном году (в % к предыдущему) подчиняется нормальному закону распределения. Построить доверительный интервал надежности 0,95 для средней выработки на одного рабочего.

Решение. Можно показать, что выборочные характеристики данного распределения таковы: . С учетом того, что , получим соотношение

,

которое будет использоваться нами для решения поставленной задачи. Пользуясь таблицей значений по = 0,95 и n = 100,находим . Найдем границы доверительного интервала:

,

.

Таким образом, с надежностью 0,95 неизвестный параметр а заключен в доверительном интервале .

 

Контрольные вопросы

 

1. В чем состоит разница в понятиях: точечная оценка параметра и интервальная оценка параметра?

2. Какая из оценок является более точной: точечная или интервальная?

3. Что называют доверительной вероятностью?

4. Что называют точностью оценки?

5. Влияет ли выбор доверительной вероятности на: а) точечную оценку; б) интервальную оценку?

6. Как изменится доверительный интервал для параметра распределения, если увеличить доверительную вероятность?

7. Как строится доверительный интервал для оценки математического ожидания нормально распределенного признака, если: а) теоретическая дисперсия известна; б) теоретическая дисперсия неизвестна?

 

Контрольные задания

 

1. Для настройки технологической линии электролампового завода произведена случайная выборка в количестве 100 ламп из дневной выработки завода. Средняя продолжительность горения ламп в выборке составила 350 часов. Предполагая, что продолжительность горения лампочки является нормально распределенной случайной величиной со средним квадратическим отклонением 24 часа, с надежностью 0,95 найти доверительный интервал для средней продолжительности горения лампочки во всей дневной выработке завода.

2. Службой контроля проверен расход электроэнергии в течение месяца в 10 наудачу выбранных квартирах многоквартирного дома, в результате чего были получены следующие значения (кВт/ч): 125, 86, 104, 140, 90, 55, 125, 98, 64, 102. Предположим, что расход электроэнергии является нормально распределенной случайной величиной со средним квадратическим отклонением, равным 10 кВт/ч. С надежностью 0,95 необходимо построить доверительный интервал для оценки среднего расхода электроэнергии в доме.

3. Та же задача при условии, что среднее квадратическое отклонение расхода электроэнергии неизвестно.

 

Литература

1. Гмурман В.Е. Теория вероятностей и математическая статистика. – М.: Высшая

школа, 2002. – Гл. 16, п.п. 1 – 20.

  1. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. – М.: Высшая школа, 2002. – Гл. 10.

3. Вентцель Е.С. Теория вероятностей. – М.: Наука, 1999. – Гл. 14.

 

 

Статистические гипотезы

 

На разных стадиях экономико-статистического исследования часто возникает необходимость формулировки, а затем экспериментальной проверки некоторых предположений или гипотез. Например, при контроле качества продукции во многих ситуациях предполагается, что измеряемые величины нормально распределены вокруг их номинального значения или что применение нового прибора, устройства и т.д. существенно повышает производительность труда. Задача состоит в том, чтобы проверить, не противоречит ли высказанное предположение имеющимся результатам наблюдений.

Понятие «статистическая гипотеза» означает любое предположение о виде или свойствах распределения генеральной совокупности, из которой извлечена выборка. Такие предположения можно делать на основании теоретических соображений или других статистических исследований. Пусть, например, многократно измеряется некоторая физическая величина, точное значение а которой не известно и в процессе измерений не меняется. На результаты измерений влияют многие случайные факторы: точность настройки измерительного прибора, погрешность округления при считывании данных и т.п. Поэтому результат i -го измерения можно записать в виде , где - случайная погрешность измерения. Обычно считают, что общая ошибка складывается из большого числа ошибок, каждая из которых невелика и независима от одна от другой. На основании центральной предельной теоремы можно предположить, что случайные величины имеют нормальное распределение. Такое предположение является статистической гипотезой о виде распределения результатов измерения.

Статистическая гипотеза, являющаяся утверждением о параметрах генеральной совокупности называется параметрической. Гипотеза, содержащая утверждение обо всем распределении изучаемого признака называется непараметрической. Различают также простую и сложную гипотезы. Гипотеза называется простой, если она однозначно определяет распределение исследуемого признака; в противном случае гипотеза называется сложной. Например, простой параметрической гипотезой является утверждение о том, что изучаемый признак Х имеет стандартное нормальное распределение. Если же высказывается предположение, что наблюдаемый признак Х имеет нормальное распределение, не указывая при этом конкретное значение среднего и дисперсии или указывая значение только одного параметра, то это сложная гипотеза.

Процедура обоснования сопоставления высказанной статистической гипотезы с имеющимися в нашем распоряжении выборочными данными называется проверкой статистической гипотезы. Результат подобного сопоставления может быть либо отрицательным, либо неотрицательным. В первом случае данные наблюдения противоречат высказанной гипотезе, а потому от этой гипотезы следует отказаться, во втором – данные наблюдений не противоречат высказанной гипотезе, следовательно, ее можно принять в качестве одного из допустимых предположений. При этом неотрицательный результат проверки гипотезы не означает, что высказанное нами предположение является единственно верным, – просто оно не противоречит имеющимся выборочным данным. Однако таким же свойством наряду с проверяемой гипотезой могут обладать и другие гипотезы. Так что даже статистически проверенное предположение следует расценивать не как раз и навсегда установленный факт, а как достаточно правдоподобное, не противоречащее имеющимся данным утверждение.

Проверяемая гипотеза называется основной или нулевой и обозначается . Гипотеза, которая противопоставляется нулевой, называется альтернативной или конкурирующей и обозначается . В качестве конкурирующей часто выступает гипотеза, противоположная основной. Кроме того, альтернативных гипотез может быть несколько или бесконечно много.

Например, рассмотрим нулевую гипотезу : параметр принимает значение, равное , т.е. . В качестве альтернативной можно рассмотреть одну из следующих гипотез: а) : ; б) : ; в) : .

Проверка статистических гипотез на основании выборочных данных неизбежно связана с риском принятия ложного решения. При этом возможны два ошибочных решения:

· отклонение верной нулевой гипотезы – ошибка 1-го рода; вероятность ошибки 1-го рода принято обозначать , т.е. ; называют уровнем значимости;

· принятие неверной нулевой гипотезы – ошибка 2-го рода; вероятность ошибки 2-го рода принято обозначать , т.е. .

Возможные результаты статистической проверки представлены ниже в таблице:

 

Результаты проверки гипотезы Возможные состояния гипотезы
Гипотеза Н0 верна Гипотеза Н0 неверна
Гипотеза Н0 отвергается Ошибка 1-го рода Правильный вывод
Гипотеза Н0 принимается Правильный вывод Ошибка 2-го рода

 

Последствия указанных ошибок часто оказываются различными. Например, если основная гипотеза состоит в признании продукции предприятия качественной и допущена ошибка 1-го рода, то будет забракована годная продукция. Допустив ошибку 2-го рода, производитель отправляет потребителю брак. В данном случае последствия второй ошибки более серьезны с точки зрения имиджа фирмы и ее долгосрочных перспектив. Если основная гипотеза состоит в наличии некоторого заболевания у пациента, то ошибка 2-го рода приведет к неправильному заключению о необходимости лечения. В результате ошибки 1-го рода имеющееся заболевание не будет обнаружено, что может привести к летальному исходу.

Исключить ошибки первого и второго рода во многих случаях невозможно в силу ограниченности выборки. Поэтому стремятся минимизировать потери от этих ошибок. Одновременное уменьшение вероятностей данных ошибок при фиксированном объеме выборки невозможно, так как задачи их уменьшения являются конкурирующими, и снижение вероятности допустить одну из них влечет за собой увеличение вероятности допустить другую. В большинстве случаев единственный способ уменьшения вероятности ошибок состоит в увеличении объема выборки.

 

Критерии проверки гипотез

Для выбора между основной гипотезой Н0 и альтернативной Н1 необходимо действовать по какому-либо правилу. Статистически критерием или критерием называется случайная величина К, использующаяся для проверки статистической гипотезы.

Построение большинства критериев проверки основной гипотезы против альтернативной осуществляется следующим образом. Вначале пытаются найти функцию от выборочных данных (т.е. статистику), которая характеризовала бы отклонение выборочных данных от гипотетических значений исследуемого признака, соответствующих гипотезе Н0. При этом статистика К должна быть такой, чтобы ее распределение в случае справедливости Н0 можно было бы определить точно или приближенно. Такая статистика называется статистикой критерия.

После того, как критерий К выбран, множество всех его возможных значений оказывается разбитым на два непересекающихся подмножества. В одном из них содержатся те значения К, при которых нулевая гипотеза Н0 принимается, а во втором – те значения критерия К, при которых нулевая гипотеза Н0 отвергается. Первое подмножество называется областью принятия гипотезы, а второе – критической областью. Критическая область и область принятия гипотезы – интервалы, точки которые их разделяют, называются критическими точками. Различные типы критических областей представлены ниже в таблице, здесь же приведены требования, согласно которым определяются критические точки тех или иных критических областей. При этом важно помнить, что критическая точка определяется после того, как задана малая вероятность – уровень значимости ; обычно значение выбирают равным 0,10; 0,05; 0,01 и т.д.

 

 

  Односторонние критические области Двусторонняя критическая область
Левосторонняя Правосторонняя
    Определение Множество значений критерия К, удовлетворяющих неравенству , где Множество значений критерия К, удовлетворяющих неравенству , где Множество значений критерия К, удовлетворяющих совокупности неравенств и , где
    Иллюстрация        
 
 

 

 
Условие для определения kкр     , где ,

 

Схему проверки статистических гипотез можно описать следующим образом.

1. Выдвигается нулевая гипотеза Н0 и альтернативная гипотеза Н1;

2. Задается уровень значимости ;

3. Выбирается статистика критерия К;

4. Определяется распределение статистики критерия К при условии, что верна гипотеза Н0.

5. Исходя из распределения статистики К в условиях справедливости гипотезы Н0 и формулировки альтернативной гипотезы Н1 определяется критическая область методом, описанным в таблице выше;

6. По имеющимся данным наблюдений вычисляется значение Кнабл статистики критерия К;

7. Принимается статистическое решение:

· если выборочное значение Кнабл статистики критерия К принадлежит критической области, то нулевую гипотезу Н0 нужно отклонить как не согласующуюся с результатами наблюдений;

· если выборочное значение Кнабл статистики критерия К не принадлежит критической области, а значит принадлежит области принятия гипотезы, то нулевую гипотезу Н0 нужно принять, т.е. считать, что гипотеза Н0 не противоречит результатам наблюдений.

 

Контрольные вопросы

 

1. Сформулируйте определение понятия статистическая гипотеза.

2. Какие выводы делаются при проверке статистических гипотез?

3. Какую гипотезу называют: а) нулевой; б) конкурирующей; в) параметрической; г) простой; д) сложной?

4. Определите понятие ошибок 1-го рода и 2-города.

5. Можно ли одновременно уменьшить вероятности ошибок 1-го и 2-го рода?

6. Что называется статистическим критерием?

7. Что называется критической областью?

8. Что называется областью принятия гипотезы?

9. Дайте определение: а) правосторонней критической области; б) левосторонней критической области; в) двусторонней критической области.

10. Как определяются критические точки: а) правосторонней критической области; б) левосторонней критической области; в) двусторонней критической области?

11. В чем состоит схема проверки статистических гипотез?

 

Контрольные задания

 

1. Наблюдаемый объект может быть либо своим, либо объектом противника. Система обнаружения относит объект к одному из классов по результатам нескольких замеров определенных характеристик. Сформулируйте нулевую и альтернативную гипотезы, если в результате ошибки 1-го рода происходит пропуск цели. В чем состоит ошибка 2-го рода?

2. Если и , то какие ошибки и как часто будем совершать в результате статистической проверки гипотезы?

 

43.Критерий согласия Пирсона «Хи-квадрат» ( )

На практике часто возникают задачи, связанные с тем, что вид закона распределения исследуемого признака – гипотетический и подлежит проверке. Если проводить графическое сравнение полигона или гистограммы частот с кривой распределения, то можно получить представление, по крайней мере с качественной стороны, о большей или меньшей близости теоретического и эмпирического распределений.

Предположим, что выборка извлечена из генеральной совокупности с неизвестной теоретической функцией распределения , относительно которой имеются две непараметрические гипотезы: простая основная Н0: и сложная конкурирующая Н1: , где - известная функция распределения. Иными словами, мы хотим проверить, согласуются ли исходные данные с нашим гипотетическим предположением относительно теоретического закона распределения или нет. Поэтому критерий для проверки гипотез Н0 и Н1 называются критериями согласия.

Существуют различные критерии согласия, например, критерий согласия Пирсона , критерий согласия Колмогорова. Приведем один из наиболее часто используемых критериев согласия – критерий согласия Пирсона .

Предположим, что проверяется основная гипотеза Н0: исследуемый признак Х имеет распределение , против конкурирующей противоположной гипотезы при уровне значимости . Здесь - функция распределения исследуемого при з нака Х, известная с точностью до параметров . В силу взаимно однозначного соответствия между функцией распределения и рядом (плотностью) распределения нулевая гипотеза Н0 может быть сформулирована также в терминах ряда (плотности) распределения. Если основная гипотеза простая, т.е. гипотетическое распределение исследуемого признака основной гипотезой определяется однозначно, то количество параметров распределений, требуемых оценки по выборке, m = 0.

Проверка нулевой гипотезы Н0 против альтернативной при уровне значимости проводится по следующей схеме:

1. Исходя из выборочных данных, находят оценки неизвестных параметров распределения . Найденные оценки используются в дальнейшем вместо неизвестных параметров распределения.

2. Вся область изменения признака Х разбивается на k непересекающихся интервалов при i = 1, 2, …, k. Если признак Х принимает значения на всей вещественной оси, то полагаем и правый конец . Если признак Х принимает только положительные значения, то полагаем и правый конец . Подсчитываются далее величины - количество выборочных данных, попавших в i -тый интервал при i = 1, 2, …, k. Интервалы выбирают обычно таким образом, чтобы все были не меньше . Очевидно, − объем выборки.

 

3. Находятся теоретические вероятности того, что исследуемый признак Х примет какое–либо значение из промежутка :

, i = 1, 2, …, k.

Если исследуемый признак дискретный, то

,

где суммирование ведется по всем значениям индекса r, для которых , i = 1, 2, …, k.

Очевидно, должно выполняться равенство .

4. Вычисляется мера расхождения между теоретическим и эмпирическим распределением:

,

где - эмпирические частоты признака Х, - теоретические частоты, - вероятности, рассчитанные по предполагаемому теоретическому распределению.

10. Для выбранного уровня значимости по таблице распределения находят критическое значение при числе степеней свободы , где k – число выборочных групп, m - число параметров теоретического распределения, определяемого по опытным данным.

11. Производится сравнение вычисленного по выборке значения с табличным значением . Если значения < , то считается, что выборочные данные согласуются с нулевой гипотезой Н0. В противном случае нулевая гипотеза Н0 отвергается, она опровергается имеющимися данными в пользу альтернативной.

 

Задача. Получено следующее распределение 100 рабочих цеха по выработке в отчетном году (в % к предыдущему году):

 

Выработка в отчетной году (в % к предыдущему году)            
Количество рабочих            

 

С помощью критерия согласия Пирсона проверить гипотезу о том, что выработка на одного рабочего в отчетном году (в % к предыдущему) подчиняется нормальному закону распределения. Уровень значимости критерия принять равным 0,05.

Решение. Нулевая гипотеза Н0 состоит в том, что исследуемый признак Х – выработка на одного рабочего в отчетном году (в % к предыдущему) подчиняется нормальному закону распределения.

В качестве оценок двух неизвестных параметров а и будут фигурировать соответствующие выборочные характеристики: и . Можно показать, что . Исследуемый признак принимает значения на всей вещественной оси (в принципе, но не в реальности!). Поэтому интервалы разбиения таковы, что левый конец и правый конец .

Теоретические вероятности находятся по формуле

, i = 1, 2, …, k.

Необходимые для этих вычислений значения функции взяты из таблицы Приложения. Дальнейшие выкладки сведены ниже в таблицу. При этом объединены два последних интервала группировки ввиду их малочисленности.

 

№ п/п Интервал группировки Частота Функция Веро-ятность
    −∞ −0,5 0,053 5,3 0,092
    −1,62 −0,447 0,238 23,8 0,636
    −0,55 −0,209 0,404 40,4 0,524
    0,51 0,195 0,248 24,8 0,026
    1,57 0,442 0,057 5,7 0,11
  + ∞ 0,5
  1,00  

 

Вычисленное статистическое значение критерия . По количеству интервалов группировки k = 5, числу параметров нормального распределения найдем число степеней свободы 5 – 3 = 2. Для заданного уровня значимости критерия и числа степеней свободы, равного 2, находим . Так как , то нулевая гипотеза о нормальности распределения величины выработки рабочего согласуется с имеющимися данными.

 

Контрольные вопросы

 

9. Что называется критерием согласия?

10. Сформулируйте схему применения критерия согласия «хи-квадрат» Пирсона.

 

Контрольные задания

 

7. Автомат наполняет ампулы лекарственным раствором. Контрольная проверка по схеме собственно случайной бесповторной выборки сотни ампул дала следующее распределение в них лекарств:

 

Объем лекарств в ампуле, см3 Менее 1,9              
Число ампул            

 

Используя критерий согласия Пирсона «хи-квадрат» при уровне значимости , проверить гипотезу о том, что случайная величин Х – объем лекарства в ампуле распределена по нормальному закону.

8. В цехе с 10 станками ежедневно регистрировалось число вышедших из строя станков. Всего было произведено 200 наблюдений, результаты которых приведены ниже:

 

Число выбывших станков                      
Число зарегистрированных случаев                      

 

При уровне значимости проверить гипотезу о том, что число выбывших из строя станков имеет распределение Пуассона.

Литература

1. Гмурман В.Е. Теория вероятностей и математическая статистика. – М.: Высшая школа, 2002. – Гл. 19, п.п. 1 – 14, 23.

2. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. – М.: Высшая школа, 2002. – Гл. 13, п.п. 1 – 6, 16.

 

 



Поделиться:


Последнее изменение этой страницы: 2016-08-01; просмотров: 1259; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.14.249.104 (0.01 с.)