Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Cреднего квадратического отклонения

Поиск

Пусть случайная величина Х распределена в генеральной совокупности по нормальному закону. По данным выборки можно найти для нее Требуется найти доверительный интервал, накрывающий неизвестное среднее квадратическое отклонение генеральной совокупности c заданной надежностью γ.

Пусть или .

Преобразуем неравенство в скобках к виду, удобному для использования готовых таблиц. Неравенство равносильно неравенству

(7.9)

где

Предполагая, что перепишем (6.9) в виде

Умножая обе части неравенства на и обозначая , получим

. (7.10)

Можно показать, что плотность распределения величины имеет вид [1]

Поэтому вероятность осуществления неравенства (7.10) равна

где

Интеграл табулирован. Вычислив по данным выборки и зная n и γ, можно по таблицам найти , а затем определить доверительный интервал в котором с надежностью γ заключено неизвестное значение (см. Приложение 4).

Замечание. Если то неравенство (7.9) следует заменить неравенством . Можно показать, что в этом случае значения могут быть найдены из уравнения

Пример. В условиях примера (стр.106) найти доверительный интервал, накрывающий генеральное среднее квадратическое отклонение с надеж­ностью γ= 0,95.

По данным выборки объема n =15 исправленное среднее квадратическое отклонение мм. При и по таблице Приложения 4 найдем . Так как то подставляя в (7.9) значения мм, , получим

 

УПРОЩЕННЫЕ МЕТОДЫ РАСЧЕТА

СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК ВЫБОРКИ

8.1. Вариационный ряд с равноотстоящим вариантами.

Условные варианты

Непосредственное использование значений признака (вариант), произвольным образом выбранных из генеральной совокупности, приводит к существенным затруднениям при вычислении статистических характеристик выборки.

Упрощенные методы их расчета базируются на замене первоначальных вариант xi условными

Здесь С – так называемый “ложный нуль” (новое начало отсчета), В качестве ложного нуля выбирают значение признака, имеющее наибольшую частоту. Оно обычно располагается примерно в середине вариационного ряда.

Рассмотрим сначала вариационный ряд с равноотстоящими вариантами. Это означает, что для любого i =1,2... Тогда условные варианты будут целыми числами. Действительно, взяв в качестве С произвольную варианту xm, получим

- целое число.

Пример. Найти условные варианты статистического распределения выборки

Х 145,2 150,2 155,2 160,2 165,2
W 0,1 0,2 0,3 0,25 0,15

Принимаем С = 155,2. Очевидно ∆ = 5. Условные варианты будут равны: u2 = -1, u3 = 0, u4 = 1, u5 = 2.

Проводить вычисления с ними, конечно проще, чем с первоначальными значениями признака xi .

Эмпирические моменты

Аналогично числовым характеристикам (теоретическим моментам рас-пределения генеральной совокупности), применяемым в теории вероятностей, в статистике рассматривают эмпирические моменты выборочного распределения.

Обычным эмпирическим моментом порядка k называется среднее значение к – ых степеней разностей (Х – С):

.

Здесь ni - частота варианты xi, - объем выборки, С – произвольное постоянное число (“ложный нуль”).

Начальным эмпирическим моментом порядка k называется обычный эмпирический момент k – го порядка при С = 0, то есть

Очевидно, что М0 = 1, - выборочная средняя.

Центральным эмпирическим моментом порядка k называется обычный момент k – го порядка, если

(8.1)

Первые четыре центральных момента выражаются через обычные моменты следующим образом:

,

.

Непосредственное вычисление центральных эмпирических моментов достаточно трудоемко. Для упрощения расчетов заменяют первоначальные варианты условными. Тогда приходят к так называемым условным эмпирическим моментам.

Условным эмпирическим моментом порядка k называется начальный эмпирический момент k - го порядка для условных вариант:

В частноcти, ,

поэтому

.

Очевидно,

Поэтому центральные моменты через условные будут выражаться по формулам:

Использование полученных формул позволяет значительно упростить вычисление оценок генеральной средней и генеральной дисперсии.

8.3. Сведение первоначальных вариант к равноотстоящим.

Метод произведений

Как правило, значения признака (варианты), регистрируемые в опытах, не являются равноотстоящими. При этом условные варианты получаются не целыми числами. Для сведения первоначальных вариант к равноотстоящим применяется следующий прием:

Интервал, в котором заключены все наблюдавшиеся значения признака, делится на несколько равных частичных интервалов (желательно, чтобы в каждый частичный интервал попало не менее 10 первоначальных вариант); определяются середины частичных интервалов, которые и образуют последовательность равноотстоящих вариант; в качестве частоты каждой “новой” варианты принимается общее число первоначальных вариант, которые попали в соответствующий частичный интервал (с учетом замечания на стр. 98).

При обработке опытных данных практически всегда приходится вычислять и . Если объем выборки достаточно большой, то для сокращения вычислений обычно применяется метод произведений. Последовательность нахождения и этим методом рассмотрим на конкретном примере.

Пример. Из текущей продукции токарного автомата, обраба­ты­ваю­щего валики, сделана выборка объемом n =100 (см. таблицу 4). Требуется найти выборочную среднюю и второй центральный момент m 2.

Разобьем весь интервал изменения значений признака (диаметра валика - Х) 15,20 – 15,60 мм на 8 частичных интервалов: 15,20 – 15,25; 15,25-15,30; …,15,55-15,60. Приняв середины частичных интервалов в качестве новых вариант, получим вариационный ряд из равноотстоящих вариант: частоты которых: …, (см. таблицу 7).

Таблица 7

Интервалы ni ni ui
15,20-15,25 15,225   -4 -24    
15,25-15,30 15,275   -3 -30    
15,30-15,35 15,325   -2 -22    
15,35-15,40 15,375   -1 -15    
15,40-15,45 15,425 22,5       22,5
15,45-15,50 15,475 18,5   18,5 18,5  
15,50-15,55 15,525          
15,55-15,60 15,575          
      -30,5 371,5 410,5

 

В четвертом столбце таблицы указаны условные варианты .

В качестве “ложного нуля” принята варианта

Очевидно, ∆ = 0,05. В 5-ом, 6-ом и 7-ом столбцах таблицы помещены величины В нижней строке указаны суммы соответствующих столбцов.

Контроль правильности вычислений производится следующим образом:

или 410,5 = 371,5 + 2∙(-30,5) + 100; 410,5 ≡ 410,5.

По данным таблицы условные эмпирические моменты первого и второго порядков будут равны

Окончательно получим

Непосредственный подсчет выборочной средней и второго центрального момента по первоначальным значениям признака из таблицы 4 с использованием формул (7.1), (8.1) приводит к следующим результатам:

Как видно, замена первоначальных вариант равноотстоящими не приводит к существенным ошибкам, но при этом объем вычислений заметно сокращается.

 

 

КРИТЕРИИ СОГЛАСИЯ

Между статистическим распределением случайной величины, которое строится всегда по ограниченному числу опытов, и предполагаемым теоретическим распределением неизбежно некоторое расхождение. Оно порождается либо случайными причинами, обусловленными ограниченным числом наблюдений, либо может быть неслучайным и связано с тем, что принимаемая гипотеза о предполагаемом законе распределения случайной величины противоречит опытным данным.

Для оценки близости теоретического и эмпирического распределений и применяют критерии согласия. Они позволяют установить, является ли расхождение эмпирического и теоретического распределений несущественным (случайным) или значимым (неслучайным).

Идея их построения заключается в следующем. Чтобы принять (или отвергнуть) некоторую гипотезу Н о том, что случайная величина Х подчинена определенному закону распределения с функцией F (x), вводят в рассмотрение величину W, которая характеризует меру расхождения между теоретической F (x) и эмпирической F (x) функциями распределения. Очевидно, W - случайная величина, закон распределения которой зависит от закона распределения Х и числа опытов n.

Пусть в результате данной серии опытов установлено, что W приняла некоторое значение w. Предположим, что принятая гипотеза верна и найдем вероятность того, что расхождение W между эмпирическим и теоретическим распределениями за счет чисто случайных причин (связанных с недостаточным объемом опытных данных) не меньше, чем наблюдавшееся для данной серии опытов расхождение w, то есть, что Ww.

Если эта вероятность мала, то это значит, что причины расхождения неслучайны, и гипотеза о предполагаемом характере распределения случайной величины противоречит опытным данным, то есть ее надо отбросить, и наоборот.

Вопрос о том, как мала или велика должна быть указанная вероятность, решается не из математических, а из практических соображений с учетом конкретных условий задачи.

Обычно в качестве практически невозможных отклонений принимают такие, вероятность которых не превосходит 0,05 или 0,01 и т.п. Такую вероятность называют уровнем значимости.

Итак, если (или 0,05 и т.п.), то выдвинутая гипотеза о теоретическом законе распределения противоречит опытным данным и должна быть отброшена и наоборот, если , то гипотезу Н можно принять для данного уровня значимости.

В зависимости от того, какая величина принимается в качестве меры W, различают те или иные критерии согласия. Ниже будут рассмотрены лишь два из них, наиболее часто применяемые.

9.1. Критерий Пирсона

Допустим, что произведено n опытов над случайной величиной Х. Всю область изменения значений Х разобъем на S частичных интервалов или разрядов (в случае непрерывной величины) или групп, состоящих из отдельных значений дискретной величины. Подсчитаем эмпирические частоты ni тех значений xi, которые попали в i -ый разряд (группу). Предположим теперь, что для Х принят некоторый закон распределения. Тогда можно найти вероятность попадания Х в каждый из S разрядов: Величины называются теоретическими (выравнивающими) частотами.

Критерий Пирсона служит для оценки степени различия между частотами эмпирического и теоретического распределений и вычисляется как сумма квадратов разностей между теоретическими и эмпирическими частотами, отнесенная к теоретическим частотам (по всем S разрядам).

.

Очевидно, величина является случайной и тем меньше, чем ближе к .

Как известно, в теории вероятностей распределением с k степенями свободы называется распределение суммы квадратов k независимых случайных величин , каждая из которых подчинена нормированному нормальному закону. Плотность вероятностей этой величины имеет вид:

Кривые распределения для различных значений k показаны на рисунке.

Здесь - гамма - функция, k - число степеней свободы, , где S – число разрядов (групп), на которые делится диапазон всех наблюдавшихся значений случайной величины, m – число параметров предполагаемого теоретического распределения (например, для нормального закона m =2).

Распределение , как видно, характеризуется одним параметром k – чис­лом степеней свободы.

Можно показать, что закон распределения случайной величины W при­­бли­­­­жается к закону распределения с S степенями свободы.

Для распределения существуют специальные таблицы, в которых указана вероятность того, что случайная величина примет значение, не меньше, чем вычисленное по данным опытов число . Можно также сравнить наблюдаемые значения критерия с, так называемыми, критическими точками распределения если - нет оснований отвергать гипотезу, если - принятую гипотезу отвергают (см. Приложение 5).

Пример. Произведено 250 измерений с точностью до 1мк диаметра валиков, обработанных на токарном автомате. В таблице 8 приведены отклонения Х от номинального размера, разбитые на интервалы по 5 мк в каждом, и числа деталей , попадающих в указанные интервалы. Проверить статистическую гипотезу о нормальном распределении признака Х в генеральной совокупности, используя критерий Пирсона.

Таблица 8

Интервалы Δ, мк 0 - 5 5 – 10 10 –15 15 - 20 20 – 25
Среднее значение, мк 2,5 7,5 12,5 17,5 22,5
         

1. По данным выборки методом произведений найдем оценки генеральной средней и генеральной дисперсии:

Теоретические частоты для предполагаемого нормального распределения определяются по формуле

где функция табулирована (см.Приложение 1), Вычисления сведем в таблицу 9.

 

 

Таблица 9

2,5   - 9,3 - 1,98 0,0562  
7,5   - 4,3 - 0,92 0,2613 69,6
12,5   0,7 0,15 0,3945 105,1
17,5   5,7 1,22 0,1895 50,5
22,5   10,7 2,28 0,0297 7,9

 

Определяем меру расхождения (см. таблицу 10).

Таблица 10

         
  69,6 5,4 29,16 0,42
  105,1 - 5,1 26,01 0,25
  50,5 0,5 0,25 0,01
  7,9 2,1 4,41 0,56

 

При числе степеней свободы K = S – 3 = 2 и уровне значимости 0,05 по таблице Приложения 5 находим Так как наблюдаемое значение критерия меньше , гипотеза о соответствии данных наблюдений нормальному закону распределения признака в генеральной совокупности не опровергается.

Замечание. При применении критерия Пирсона необходимо, чтобы как общее число значений признака n, так и числа наблюдений в отдельных разрядах были достаточно велики. Практически необходимо, чтобы n > 50 – 60, а Если какое-либо из меньше установленного мини­мального значения, то один или несколько ближайших интервалов следует объединить. При этом соответственно уменьшится число степеней свободы k.

Критерий Колмогорова

В качестве меры расхождения между эмпирическим и теоретическим распределениями можно рассматривать максимум модуля разности между эмпирической и теоретической функциями распределения:

.

А.Н.Колмогоровым было показано, что независимо от вида функции F(x) при неограниченном возрастании n (а практически при n не менее нескольких десятков) интегральная функция распределения случайной величины приближается к функции

Обозначим конкретное значение , полученное в данной серии опытов, через Тогда Значения вероятности табулированы и приводятся в литературе.

Пусть, например, уровень значимости равен 0,01. Тогда, если , то гипотеза о том, что Х имеет функцию распределения , не противоречит опытным данным, и наоборот.

Критерий Колмогорова может быть использован также для решения вопроса о том, принадлежат ли две выборки объемов и одной генеральной совокупности.

При этом находят величину

где - эмпирические функции распределения 1-ой и 2-ой выборок соответственно (i =1,2), а величина определяется из выражения и при имеет асимптотической функцией распределения функцию критерия Колмогорова.

Замечание. Достоинством критерия Колмогорова является его простота, а недостаток состоит в том, что его можно применять только, если предполагаемая теоретическая функция распределения F (x) полностью известна (то есть известен не только вид распределения, но и все входящие в него параметры).

Пример. Имеются две группы однородных деталей, изготовленных одним станком, по 60 штук в каждой. Результаты измерений длины Х после группировки данных приведены в таблице 11.

Таблица 11

Длина деталей, Мм        
1-ая Группа 2-ая группа
    - 0,0167 - 0,0167
72,1     0,050 0,0333 0,0167
72,2     0,1167 0,1667 0,05
72,3     0,3 0,3333 0,0333
72,4     0,5 0,6 0,1
72,5     0,7667 0,9 0,1333
72,6     0,9 0,9667 0,0667
72,7     1,0 1,0  

Проверить с помощью критерия Колмогорова гипотезу о том, что обе выборки принадлежат одной генеральной совокупности.

1. Эмпирические функции распределения и для каждой из групп строятся как нарастающие суммы относительных частот (см. таблицу 11).

2. Максимум модуля разности между ними, как видно из таблицы 11, равен

3. Определив , где и, следовательно, , по таблице Приложения 6 для данного значения найдем соответствующее значение вероятности

Следовательно, при уровне значимости 0,01 гипотеза о том, что обе выборки принадлежат одной генеральной совокупности, не опровергается.

 

 



Поделиться:


Последнее изменение этой страницы: 2016-08-26; просмотров: 534; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.226.187.194 (0.01 с.)