Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву

Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

Главная Избранные Случайная статья Познавательные Новые добавления Обратная связь FAQ

Доверительный интервал для оценки

⇐ ПредыдущаяСтр 17 из 20Следующая ⇒

C реднего квадратического отклонения

Пусть случайная величина Х распределена в генеральной совокупности по нормальному закону. По данным выборки можно найти для нее Требуется найти доверительный интервал, накрывающий неизвестное среднее квадратическое отклонение генеральной совокупности c заданной надежностью γ.

Пусть или .

Преобразуем неравенство в скобках к виду, удобному для использования готовых таблиц. Неравенство равносильно неравенству

(7.9)

где

Предполагая, что перепишем (6.9) в виде

Умножая обе части неравенства на и обозначая , получим

. (7.10)

Можно показать, что плотность распределения величины имеет вид [1]

Поэтому вероятность осуществления неравенства (7.10) равна

где

Интеграл табулирован. Вычислив по данным выборки и зная n и γ, можно по таблицам найти , а затем определить доверительный интервал в котором с надежностью γ заключено неизвестное значение (см. Приложение 4).

Замечание. Если то неравенство (7.9) следует заменить неравенством . Можно показать, что в этом случае значения могут быть найдены из уравнения

Пример. В условиях примера (стр.106) найти доверительный интервал, накрывающий генеральное среднее квадратическое отклонение с надежностью γ= 0,95.

По данным выборки объема n =15 исправленное среднее квадратическое отклонение мм. При и по таблице Приложения 4 найдем . Так как то подставляя в (7.9) значения мм, , получим

УПРОЩЕННЫЕ МЕТОДЫ РАСЧЕТА

СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК ВЫБОРКИ

8.1. Вариационный ряд с равноотстоящим вариантами.

Условные варианты

Непосредственное использование значений признака (вариант), произвольным образом выбранных из генеральной совокупности, приводит к существенным затруднениям при вычислении статистических характеристик выборки.

Упрощенные методы их расчета базируются на замене первоначальных вариант x_i условными

Здесь С – так называемый “ложный нуль” (новое начало отсчета), В качестве ложного нуля выбирают значение признака, имеющее наибольшую частоту. Оно обычно располагается примерно в середине вариационного ряда.

Рассмотрим сначала вариационный ряд с равноотстоящими вариантами. Это означает, что для любого i =1,2... Тогда условные варианты будут целыми числами. Действительно, взяв в качестве С произвольную варианту x_m, получим

- целое число.

Пример. Найти условные варианты статистического распределения выборки

Х	145,2	150,2	155,2	160,2	165,2
W	0,1	0,2	0,3	0,25	0,15

Принимаем С = 155,2. Очевидно ∆ = 5. Условные варианты будут равны: u₂= -1, u₃= 0, u₄ = 1, u₅ = 2.

Проводить вычисления с ними, конечно проще, чем с первоначальными значениями признака x_i _.

Эмпирические моменты

Аналогично числовым характеристикам (теоретическим моментам рас-пределения генеральной совокупности), применяемым в теории вероятностей, в статистике рассматривают эмпирические моменты выборочного распределения.

Обычным эмпирическим моментом порядка k называется среднее значение к – ых степеней разностей (Х – С):

Здесь n_i - частота варианты x_i, - объем выборки, С – произвольное постоянное число (“ложный нуль”).

Начальным эмпирическим моментом порядка k называется обычный эмпирический момент k – го порядка при С = 0, то есть

Очевидно, что М₀ = 1, - выборочная средняя.

Центральным эмпирическим моментом порядка k называется обычный момент k – го порядка, если

(8.1)

Первые четыре центральных момента выражаются через обычные моменты следующим образом:

Непосредственное вычисление центральных эмпирических моментов достаточно трудоемко. Для упрощения расчетов заменяют первоначальные варианты условными. Тогда приходят к так называемым условным эмпирическим моментам.

Условным эмпирическим моментом порядка k называется начальный эмпирический момент k - го порядка для условных вариант:

В частноcти, ,

поэтому

Очевидно,

Поэтому центральные моменты через условные будут выражаться по формулам:

Использование полученных формул позволяет значительно упростить вычисление оценок генеральной средней и генеральной дисперсии.

8.3. Сведение первоначальных вариант к равноотстоящим.

Метод произведений

Как правило, значения признака (варианты), регистрируемые в опытах, не являются равноотстоящими. При этом условные варианты получаются не целыми числами. Для сведения первоначальных вариант к равноотстоящим применяется следующий прием:

Интервал, в котором заключены все наблюдавшиеся значения признака, делится на несколько равных частичных интервалов (желательно, чтобы в каждый частичный интервал попало не менее 10 первоначальных вариант); определяются середины частичных интервалов, которые и образуют последовательность равноотстоящих вариант; в качестве частоты каждой “новой” варианты принимается общее число первоначальных вариант, которые попали в соответствующий частичный интервал (с учетом замечания на стр. 98).

При обработке опытных данных практически всегда приходится вычислять и . Если объем выборки достаточно большой, то для сокращения вычислений обычно применяется метод произведений. Последовательность нахождения и этим методом рассмотрим на конкретном примере.

Пример. Из текущей продукции токарного автомата, обрабатывающего валики, сделана выборка объемом n =100 (см. таблицу 4). Требуется найти выборочную среднюю и второй центральный момент m ₂.

Разобьем весь интервал изменения значений признака (диаметра валика - Х) 15,20 – 15,60 мм на 8 частичных интервалов: 15,20 – 15,25; 15,25-15,30; …,15,55-15,60. Приняв середины частичных интервалов в качестве новых вариант, получим вариационный ряд из равноотстоящих вариант: частоты которых: …, (см. таблицу 7).

Таблица 7

Интервалы		n_i		n_iu_i
15,20-15,25	15,225	6	-4	-24	96	54
15,25-15,30	15,275	10	-3	-30	90	40
15,30-15,35	15,325	11	-2	-22	44	11
15,35-15,40	15,375	15	-1	-15	15	0
15,40-15,45	15,425	22,5	0	0	0	22,5
15,45-15,50	15,475	18,5	1	18,5	18,5	74
15,50-15,55	15,525	9	2	18	36	81
15,55-15,60	15,575	8	3	24	72	128
				-30,5	371,5	410,5

В четвертом столбце таблицы указаны условные варианты .

В качестве “ложного нуля” принята варианта

Очевидно, ∆ = 0,05. В 5-ом, 6-ом и 7-ом столбцах таблицы помещены величины В нижней строке указаны суммы соответствующих столбцов.

Контроль правильности вычислений производится следующим образом:

или 410,5 = 371,5 + 2∙(-30,5) + 100; 410,5 ≡ 410,5.

По данным таблицы условные эмпирические моменты первого и второго порядков будут равны

Окончательно получим

Непосредственный подсчет выборочной средней и второго центрального момента по первоначальным значениям признака из таблицы 4 с использованием формул (7.1), (8.1) приводит к следующим результатам:

Как видно, замена первоначальных вариант равноотстоящими не приводит к существенным ошибкам, но при этом объем вычислений заметно сокращается.

КРИТЕРИИ СОГЛАСИЯ

Между статистическим распределением случайной величины, которое строится всегда по ограниченному числу опытов, и предполагаемым теоретическим распределением неизбежно некоторое расхождение. Оно порождается либо случайными причинами, обусловленными ограниченным числом наблюдений, либо может быть неслучайным и связано с тем, что принимаемая гипотеза о предполагаемом законе распределения случайной величины противоречит опытным данным.

Для оценки близости теоретического и эмпирического распределений и применяют критерии согласия. Они позволяют установить, является ли расхождение эмпирического и теоретического распределений несущественным (случайным) или значимым (неслучайным).

Идея их построения заключается в следующем. Чтобы принять (или отвергнуть) некоторую гипотезу Н о том, что случайная величина Х подчинена определенному закону распределения с функцией F (x), вводят в рассмотрение величину W, которая характеризует меру расхождения между теоретической F (x) и эмпирической F (x) функциями распределения. Очевидно, W - случайная величина, закон распределения которой зависит от закона распределения Х и числа опытов n.

Пусть в результате данной серии опытов установлено, что W приняла некоторое значение w. Предположим, что принятая гипотеза верна и найдем вероятность того, что расхождение W между эмпирическим и теоретическим распределениями за счет чисто случайных причин (связанных с недостаточным объемом опытных данных) не меньше, чем наблюдавшееся для данной серии опытов расхождение w, то есть, что W ≥ w.

Если эта вероятность мала, то это значит, что причины расхождения неслучайны, и гипотеза о предполагаемом характере распределения случайной величины противоречит опытным данным, то есть ее надо отбросить, и наоборот.

Вопрос о том, как мала или велика должна быть указанная вероятность, решается не из математических, а из практических соображений с учетом конкретных условий задачи.

Обычно в качестве практически невозможных отклонений принимают такие, вероятность которых не превосходит 0,05 или 0,01 и т.п. Такую вероятность называют уровнем значимости.

Итак, если (или 0,05 и т.п.), то выдвинутая гипотеза о теоретическом законе распределения противоречит опытным данным и должна быть отброшена и наоборот, если , то гипотезу Н можно принять для данного уровня значимости.

В зависимости от того, какая величина принимается в качестве меры W, различают те или иные критерии согласия. Ниже будут рассмотрены лишь два из них, наиболее часто применяемые.

9.1. Критерий Пирсона

Допустим, что произведено n опытов над случайной величиной Х. Всю область изменения значений Х разобъем на S частичных интервалов или разрядов (в случае непрерывной величины) или групп, состоящих из отдельных значений дискретной величины. Подсчитаем эмпирические частоты n_i тех значений x_i, которые попали в i -ый разряд (группу). Предположим теперь, что для Х принят некоторый закон распределения. Тогда можно найти вероятность попадания Х в каждый из S разрядов: Величины называются теоретическими (выравнивающими) частотами.

Критерий Пирсона служит для оценки степени различия между частотами эмпирического и теоретического распределений и вычисляется как сумма квадратов разностей между теоретическими и эмпирическими частотами, отнесенная к теоретическим частотам (по всем S разрядам).

Очевидно, величина является случайной и тем меньше, чем ближе к .

Как известно, в теории вероятностей распределением с k степенями свободы называется распределение суммы квадратов k независимых случайных величин , каждая из которых подчинена нормированному нормальному закону. Плотность вероятностей этой величины имеет вид:

Кривые распределения для различных значений k показаны на рисунке.

Здесь - гамма - функция, k - число степеней свободы, , где S – число разрядов (групп), на которые делится диапазон всех наблюдавшихся значений случайной величины, m – число параметров предполагаемого теоретического распределения (например, для нормального закона m =2).

Распределение , как видно, характеризуется одним параметром k – числом степеней свободы.

Можно показать, что закон распределения случайной величины W приближается к закону распределения с S степенями свободы.

Для распределения существуют специальные таблицы, в которых указана вероятность того, что случайная величина примет значение, не меньше, чем вычисленное по данным опытов число . Можно также сравнить наблюдаемые значения критерия с, так называемыми, критическими точками распределения если - нет оснований отвергать гипотезу, если - принятую гипотезу отвергают (см. Приложение 5).

Пример. Произведено 250 измерений с точностью до 1мк диаметра валиков, обработанных на токарном автомате. В таблице 8 приведены отклонения Х от номинального размера, разбитые на интервалы по 5 мк в каждом, и числа деталей , попадающих в указанные интервалы. Проверить статистическую гипотезу о нормальном распределении признака Х в генеральной совокупности, используя критерий Пирсона.

Таблица 8

Интервалы Δ, мк	0 - 5	5 – 10	10 –15	15 - 20	20 – 25
Среднее значение, мк	2,5	7,5	12,5	17,5	22,5
	15	75	100	50	10

1. По данным выборки методом произведений найдем оценки генеральной средней и генеральной дисперсии:

Теоретические частоты для предполагаемого нормального распределения определяются по формуле

где функция табулирована (см.Приложение 1), Вычисления сведем в таблицу 9.

Таблица 9


2,5	15	- 9,3	- 1,98	0,0562	15
7,5	75	- 4,3	- 0,92	0,2613	69,6
12,5	100	0,7	0,15	0,3945	105,1
17,5	50	5,7	1,22	0,1895	50,5
22,5	10	10,7	2,28	0,0297	7,9

Определяем меру расхождения (см. таблицу 10).

Таблица 10


15	15	0	0	0
75	69,6	5,4	29,16	0,42
100	105,1	- 5,1	26,01	0,25
50	50,5	0,5	0,25	0,01
10	7,9	2,1	4,41	0,56

При числе степеней свободы K = S – 3 = 2 и уровне значимости 0,05 по таблице Приложения 5 находим Так как наблюдаемое значение критерия меньше , гипотеза о соответствии данных наблюдений нормальному закону распределения признака в генеральной совокупности не опровергается.

Замечание. При применении критерия Пирсона необходимо, чтобы как общее число значений признака n, так и числа наблюдений в отдельных разрядах были достаточно велики. Практически необходимо, чтобы n > 50 – 60, а Если какое-либо из меньше установленного минимального значения, то один или несколько ближайших интервалов следует объединить. При этом соответственно уменьшится число степеней свободы k.

Критерий Колмогорова

В качестве меры расхождения между эмпирическим и теоретическим распределениями можно рассматривать максимум модуля разности между эмпирической и теоретической функциями распределения:

А.Н.Колмогоровым было показано, что независимо от вида функции F (x) при неограниченном возрастании n (а практически при n не менее нескольких десятков) интегральная функция распределения случайной величины приближается к функции

Обозначим конкретное значение , полученное в данной серии опытов, через Тогда Значения вероятности табулированы и приводятся в литературе.

Пусть, например, уровень значимости равен 0,01. Тогда, если , то гипотеза о том, что Х имеет функцию распределения , не противоречит опытным данным, и наоборот.

Критерий Колмогорова может быть использован также для решения вопроса о том, принадлежат ли две выборки объемов и одной генеральной совокупности.

При этом находят величину

где - эмпирические функции распределения 1-ой и 2-ой выборок соответственно (i =1,2), а величина определяется из выражения и при имеет асимптотической функцией распределения функцию критерия Колмогорова.

Замечание. Достоинством критерия Колмогорова является его простота, а недостаток состоит в том, что его можно применять только, если предполагаемая теоретическая функция распределения F (x) полностью известна (то есть известен не только вид распределения, но и все входящие в него параметры).

Пример. Имеются две группы однородных деталей, изготовленных одним станком, по 60 штук в каждой. Результаты измерений длины Х после группировки данных приведены в таблице 11.

Таблица 11

Длина деталей, Мм
Длина деталей, Мм	1-ая Группа	2-ая группа
72	1	-	0,0167	-	0,0167
72,1	2	2	0,050	0,0333	0,0167
72,2	4	8	0,1167	0,1667	0,05
72,3	11	10	0,3	0,3333	0,0333
72,4	12	16	0,5	0,6	0,1
72,5	16	18	0,7667	0,9	0,1333
72,6	8	4	0,9	0,9667	0,0667
72,7	6	2	1,0	1,0	0

Проверить с помощью критерия Колмогорова гипотезу о том, что обе выборки принадлежат одной генеральной совокупности.

1. Эмпирические функции распределения и для каждой из групп строятся как нарастающие суммы относительных частот (см. таблицу 11).

2. Максимум модуля разности между ними, как видно из таблицы 11, равен

3. Определив , где и, следовательно, , по таблице Приложения 6 для данного значения найдем соответствующее значение вероятности

Следовательно, при уровне значимости 0,01 гипотеза о том, что обе выборки принадлежат одной генеральной совокупности, не опровергается.

⇐ Предыдущая 11 12 13 14 15 161718 19 20 Следующая ⇒

Читайте также:

Где возникла философия и почему?

Относительная высота сжатой зоны бетона

Сущность проекции Гаусса-Крюгера и использование ее в геодезии

Тарифы на перевозку пассажиров

Последнее изменение этой страницы: 2021-03-09; просмотров: 73; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.144.230.82 (0.07 с.)