Доверительный интервал для оценки 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Доверительный интервал для оценки



C реднего квадратического отклонения

Пусть случайная величина Х  распределена в генеральной совокупности по нормальному закону. По данным выборки можно найти для нее  Требуется найти доверительный интервал, накрывающий неизвестное среднее квадратическое отклонение генеральной совокупности  c заданной надежностью γ.

       Пусть    или .

Преобразуем неравенство в скобках к виду, удобному для использования готовых таблиц. Неравенство   равносильно неравенству

                                                                         (7.9)

где  

Предполагая, что   перепишем (6.9) в виде

Умножая обе части неравенства на  и обозначая , получим

                                            .                               (7.10)  

Можно показать, что плотность распределения величины   имеет вид [1]

                                           

Поэтому вероятность осуществления неравенства (7.10) равна

где

Интеграл   табулирован. Вычислив по данным выборки  и зная   n  и  γ, можно по таблицам найти , а затем определить доверительный интервал   в котором с надежностью γ заключено неизвестное значение  (см. Приложение 4).

Замечание. Если  то неравенство (7.9) следует заменить неравенством . Можно показать, что в этом случае значения  могут быть найдены из уравнения

Пример.  В условиях примера (стр.106) найти доверительный интервал, накрывающий генеральное среднее квадратическое отклонение   с надеж­ностью γ= 0,95.

По данным выборки объема n =15 исправленное среднее квадратическое отклонение мм.  При  и   по таблице Приложения 4 найдем . Так как  то подставляя в (7.9) значения мм, , получим

 

УПРОЩЕННЫЕ МЕТОДЫ РАСЧЕТА

СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК ВЫБОРКИ

  8.1. Вариационный ряд с равноотстоящим вариантами.

                             Условные варианты

Непосредственное использование значений признака (вариант), произвольным образом выбранных из генеральной совокупности, приводит к существенным затруднениям при вычислении статистических характеристик выборки.

Упрощенные методы их расчета базируются на замене первоначальных вариант xi условными

Здесь С – так называемый “ложный нуль” (новое начало отсчета),  В качестве ложного нуля выбирают значение признака, имеющее наибольшую частоту. Оно обычно располагается примерно в середине вариационного ряда.

Рассмотрим сначала вариационный ряд с равноотстоящими вариантами. Это означает, что  для любого i =1,2... Тогда условные варианты будут целыми числами. Действительно, взяв в качестве С произвольную варианту xm, получим

 - целое число.

        Пример. Найти условные варианты статистического распределения выборки

Х 145,2 150,2 155,2 160,2 165,2
W 0,1 0,2 0,3 0,25 0,15

Принимаем  С = 155,2. Очевидно ∆ = 5. Условные варианты будут равны:       u2 = -1, u3 = 0,      u4 = 1, u5 = 2.

Проводить вычисления с ними, конечно проще, чем с первоначальными значениями признака  xi .

Эмпирические моменты

Аналогично числовым характеристикам (теоретическим моментам рас-пределения генеральной совокупности), применяемым в теории вероятностей, в статистике рассматривают эмпирические моменты выборочного распределения.

Обычным эмпирическим моментом порядка   k называется среднее значение к – ых степеней разностей (Х – С):

.

Здесь ni - частота варианты xi,  - объем выборки,   С – произвольное постоянное число (“ложный нуль”).

Начальным эмпирическим моментом порядка k называется обычный эмпирический момент k – го порядка при С = 0, то есть

 

Очевидно, что М0 = 1,   - выборочная средняя.

Центральным эмпирическим моментом порядка k называется обычный момент k – го порядка, если

                                                                        (8.1)

Первые четыре центральных момента выражаются через обычные моменты следующим образом:

,

.

Непосредственное вычисление центральных эмпирических моментов достаточно трудоемко. Для упрощения расчетов заменяют первоначальные варианты условными. Тогда приходят к так называемым условным эмпирическим моментам.

Условным эмпирическим моментом порядка k называется начальный эмпирический момент k - го порядка для условных вариант:

В частноcти,   

 поэтому                                           

.

Очевидно,                

Поэтому центральные моменты через условные будут выражаться по формулам:

                      

Использование полученных формул позволяет значительно упростить вычисление оценок генеральной средней и генеральной дисперсии.

8.3. Сведение первоначальных вариант к равноотстоящим.

Метод произведений

Как правило, значения признака (варианты), регистрируемые в опытах, не являются равноотстоящими. При этом условные варианты получаются не целыми числами. Для сведения первоначальных вариант к равноотстоящим применяется следующий прием:

Интервал, в котором заключены все наблюдавшиеся значения признака, делится на несколько равных частичных интервалов (желательно, чтобы в каждый частичный интервал попало не менее 10 первоначальных вариант); определяются середины частичных интервалов, которые и образуют последовательность равноотстоящих вариант; в качестве частоты каждой “новой” варианты принимается общее число первоначальных вариант, которые попали в соответствующий частичный интервал (с учетом замечания на стр. 98).  

При обработке опытных данных практически всегда приходится вычислять  и . Если объем выборки достаточно большой, то для сокращения вычислений обычно применяется метод произведений. Последовательность нахождения  и  этим методом рассмотрим на конкретном примере.

Пример. Из текущей продукции токарного автомата, обраба­ты­ваю­щего валики, сделана выборка объемом n =100 (см. таблицу 4). Требуется найти выборочную среднюю  и второй центральный момент m 2.

Разобьем весь интервал изменения значений признака (диаметра валика - Х) 15,20 – 15,60 мм  на 8 частичных интервалов: 15,20 – 15,25; 15,25-15,30; …,15,55-15,60. Приняв середины частичных интервалов в качестве новых вариант, получим вариационный ряд из равноотстоящих вариант:   частоты которых: …,   (см. таблицу 7).

                                                                                               Таблица 7

Интервалы ni ni ui
15,20-15,25 15,225 6 -4 -24 96 54
15,25-15,30 15,275 10 -3 -30 90 40
15,30-15,35 15,325 11 -2 -22 44 11
15,35-15,40 15,375 15 -1 -15 15 0
15,40-15,45 15,425 22,5 0 0 0 22,5
15,45-15,50 15,475 18,5 1 18,5 18,5 74
15,50-15,55 15,525 9 2 18 36 81
15,55-15,60 15,575 8 3 24 72 128
      -30,5 371,5 410,5

 

В четвертом столбце таблицы указаны условные варианты .

В качестве “ложного нуля” принята варианта

Очевидно, ∆ = 0,05. В 5-ом, 6-ом и 7-ом столбцах таблицы помещены величины   В нижней строке указаны суммы соответствующих столбцов.

        Контроль правильности вычислений производится следующим образом:

 или 410,5 = 371,5 + 2∙(-30,5) + 100; 410,5 ≡ 410,5.

По данным таблицы условные эмпирические моменты первого и второго порядков будут равны

                      

Окончательно получим

Непосредственный подсчет выборочной средней и второго центрального момента по первоначальным значениям признака из таблицы 4 с использованием формул (7.1), (8.1) приводит к следующим результатам:  

Как видно, замена первоначальных вариант равноотстоящими не приводит к существенным ошибкам, но при этом объем вычислений заметно сокращается.

 

 

КРИТЕРИИ СОГЛАСИЯ

Между статистическим распределением случайной величины, которое строится всегда по ограниченному числу опытов, и предполагаемым теоретическим распределением неизбежно некоторое расхождение. Оно порождается либо случайными причинами, обусловленными ограниченным числом наблюдений, либо может быть неслучайным и связано с тем, что принимаемая гипотеза о предполагаемом законе распределения случайной величины противоречит опытным данным.

Для оценки близости теоретического и эмпирического распределений и применяют критерии согласия. Они позволяют установить, является ли расхождение эмпирического и теоретического распределений несущественным (случайным) или значимым (неслучайным).

Идея их построения заключается в следующем. Чтобы принять (или отвергнуть) некоторую гипотезу Н о том, что случайная величина Х подчинена определенному закону распределения с функцией F (x), вводят в рассмотрение величину W, которая характеризует меру расхождения между теоретической F (x) и эмпирической F (x) функциями распределения. Очевидно, W - случайная величина, закон распределения которой зависит от закона распределения Х и числа опытов n.

Пусть в результате данной серии опытов установлено, что W приняла некоторое значение w. Предположим, что принятая гипотеза верна и найдем вероятность того, что расхождение W между эмпирическим и теоретическим распределениями за счет чисто случайных причин (связанных с недостаточным объемом опытных данных) не меньше, чем наблюдавшееся для данной серии опытов расхождение w, то есть, что Ww.

Если эта вероятность мала, то это значит, что причины расхождения неслучайны, и гипотеза о предполагаемом характере распределения случайной величины противоречит опытным данным, то есть ее надо отбросить, и наоборот.

Вопрос о том, как мала или велика должна быть указанная вероятность, решается не из математических, а из практических соображений с учетом конкретных условий задачи.

Обычно в качестве практически невозможных отклонений принимают такие, вероятность которых не превосходит 0,05 или 0,01 и т.п. Такую вероятность называют уровнем значимости.

Итак, если   (или 0,05 и т.п.), то выдвинутая гипотеза о теоретическом законе распределения противоречит опытным данным и должна быть отброшена и наоборот, если , то гипотезу Н можно принять для данного уровня значимости.

В зависимости от того, какая величина принимается в качестве меры W, различают те или иные критерии согласия. Ниже будут рассмотрены лишь два из них, наиболее часто применяемые.

9.1. Критерий  Пирсона

Допустим, что произведено n опытов над случайной величиной Х. Всю область изменения значений Х разобъем на S частичных интервалов или разрядов (в случае непрерывной величины) или групп, состоящих из отдельных значений дискретной величины. Подсчитаем эмпирические частоты ni тех значений xi, которые попали в   i -ый разряд (группу). Предположим теперь, что для Х принят некоторый закон распределения. Тогда можно найти вероятность попадания Х в каждый из S  разрядов:  Величины   называются теоретическими (выравнивающими) частотами.

Критерий  Пирсона служит для оценки степени различия между частотами эмпирического и теоретического распределений и вычисляется как сумма квадратов разностей между теоретическими и эмпирическими частотами, отнесенная к теоретическим частотам (по всем S  разрядам).

.

Очевидно, величина  является случайной и тем меньше, чем ближе  к .

Как известно, в теории вероятностей распределением  с k  степенями свободы называется распределение суммы квадратов k независимых случайных величин ,  каждая из которых подчинена нормированному нормальному закону. Плотность вероятностей этой величины имеет вид:

Кривые распределения   для различных значений k показаны на рисунке.

    Здесь  - гамма - функция, k - число степеней свободы, , где S – число разрядов (групп), на которые делится диапазон всех наблюдавшихся значений случайной величины, m – число параметров предполагаемого теоретического распределения (например, для нормального закона   m =2).

Распределение , как видно, характеризуется одним параметром k – чис­лом степеней свободы.

Можно показать, что закон распределения случайной величины W при­­бли­­­­жается к закону распределения  с S степенями свободы.

Для распределения  существуют специальные таблицы, в которых указана вероятность того, что случайная величина  примет значение, не меньше, чем вычисленное по данным опытов число . Можно также сравнить наблюдаемые значения критерия  с, так называемыми, критическими точками распределения  если  - нет оснований отвергать гипотезу, если  - принятую гипотезу отвергают (см. Приложение 5).

Пример.  Произведено 250 измерений с точностью до 1мк диаметра валиков, обработанных на токарном автомате. В таблице 8 приведены отклонения Х от номинального размера, разбитые на интервалы по 5 мк в каждом, и числа деталей , попадающих в указанные интервалы. Проверить статистическую гипотезу о нормальном распределении признака Х в генеральной совокупности, используя критерий   Пирсона.

                                                                                Таблица 8

Интервалы Δ, мк 0 - 5 5 – 10 10 –15 15 - 20 20 – 25
Среднее значение, мк 2,5 7,5 12,5 17,5 22,5
      15 75 100 50 10

1. По данным выборки методом произведений найдем оценки генеральной средней и генеральной дисперсии:

Теоретические частоты для предполагаемого нормального распределения определяются по формуле

где функция  табулирована (см.Приложение 1),    Вычисления сведем в таблицу 9.

                                                                

 

                                                                       Таблица 9

2,5 15 - 9,3 - 1,98 0,0562 15
7,5 75 - 4,3 - 0,92 0,2613 69,6
12,5 100 0,7 0,15 0,3945 105,1
17,5 50 5,7  1,22 0,1895 50,5
22,5 10 10,7  2,28 0,0297  7,9

 

Определяем меру расхождения  (см. таблицу 10).

                                                                                                  Таблица 10

15 15 0 0 0
75 69,6 5,4 29,16 0,42
100 105,1 - 5,1 26,01 0,25
50 50,5 0,5 0,25 0,01
10 7,9 2,1 4,41 0,56

 

При числе степеней свободы K = S – 3 = 2 и уровне значимости 0,05 по таблице Приложения 5 находим   Так как наблюдаемое значение критерия  меньше , гипотеза о соответствии данных наблюдений нормальному закону распределения признака в генеральной совокупности не опровергается.

Замечание. При применении критерия  Пирсона необходимо, чтобы как общее число значений признака n, так и числа наблюдений в отдельных разрядах   были  достаточно  велики. Практически необходимо, чтобы n > 50 – 60, а   Если какое-либо из   меньше установленного мини­мального значения, то один или несколько ближайших интервалов следует объединить. При этом соответственно уменьшится число степеней свободы k.

Критерий Колмогорова

В качестве меры расхождения между эмпирическим и теоретическим распределениями можно рассматривать максимум модуля разности между эмпирической и теоретической функциями распределения:

.

А.Н.Колмогоровым было показано, что независимо от вида функции F (x) при неограниченном возрастании n (а практически при n не менее нескольких десятков) интегральная функция распределения случайной величины  приближается к функции       

Обозначим конкретное значение , полученное в данной серии опытов, через   Тогда   Значения вероятности   табулированы и приводятся в литературе.

Пусть, например, уровень значимости равен 0,01. Тогда, если , то гипотеза о том, что Х имеет функцию распределения , не противоречит опытным данным, и наоборот.

Критерий Колмогорова может быть использован также для решения вопроса о том, принадлежат ли две выборки объемов   и  одной генеральной совокупности.

При этом находят величину 

где  - эмпирические функции распределения 1-ой и 2-ой выборок соответственно (i =1,2), а величина  определяется из выражения  и при   имеет асимптотической функцией распределения функцию  критерия Колмогорова.

Замечание. Достоинством критерия Колмогорова является его простота, а недостаток состоит в том, что его можно применять только, если предполагаемая теоретическая функция распределения F (x) полностью известна (то есть известен не только вид распределения, но и все входящие в него параметры).

Пример. Имеются две группы однородных деталей, изготовленных одним станком, по 60 штук в каждой. Результаты измерений длины Х после группировки данных приведены в таблице 11.

                                                                                 Таблица 11

Длина

деталей,

Мм

 

 

 

 

1-ая Группа 2-ая группа
72 1 - 0,0167 - 0,0167
72,1 2 2 0,050 0,0333 0,0167
72,2 4 8 0,1167 0,1667 0,05
72,3 11 10 0,3 0,3333 0,0333
72,4 12 16 0,5 0,6 0,1
72,5 16 18 0,7667 0,9 0,1333
72,6 8 4 0,9 0,9667 0,0667
72,7 6 2 1,0 1,0 0

Проверить с помощью критерия Колмогорова гипотезу о том, что обе выборки принадлежат одной генеральной совокупности.

       1. Эмпирические функции распределения  и   для каждой из групп строятся как нарастающие суммы относительных частот (см. таблицу 11).

        2. Максимум модуля разности между ними, как видно из таблицы 11, равен

         3. Определив , где  и, следовательно, , по таблице Приложения 6 для данного значения  найдем соответствующее значение вероятности   

Следовательно, при уровне значимости 0,01 гипотеза о том, что обе выборки принадлежат одной генеральной совокупности, не опровергается.

 

 



Поделиться:


Последнее изменение этой страницы: 2021-03-09; просмотров: 73; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.144.230.82 (0.07 с.)