Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь
FAQ
Написать работу

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву

Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

Главная Избранные Случайная статья Познавательные Новые добавления Обратная связь FAQ Написать работу

Обработка результатов наблюдения

↑

⇐ ПредыдущаяСтр 7 из 8Следующая ⇒

Распределение Пуассона

В физике часто приходится встречаться с измерениями, результаты которых представляются в виде целых чисел. Через счетчик Гейгера за время измерения приходит целое – и обычно не очень большое – число частиц. Делящееся ядро распадается на целое число частей. Статистические закономерности, которые имеют место в этом случае, обладают некоторыми особенностями.

Рассмотрим счетчик, регистрирующий космические частицы. В то время как число отсчетов счетчика за любой промежуток времени является целым числом, интенсивность ν космического излучения (т. е. отнесенное к единице площади число отсчетов счетчика в секунду, усредненное за очень большой отрезок времени), вообще говоря, целым числом не выражается.

Найдем вероятность того, что при интенсивности ν счетчик за время измерения сработает n раз. Будем для простоты считать, что счетчик обладает единичной площадью,– окончательные формулы от этого предположения не зависят.

Поскольку мы приступаем к вычислению вероятностей, следует представить себе очень большое число совершенно одинаковых одновременно работающих счетчиков. Некоторая часть их сработает ровно n раз. Доля, составляемая этими счетчиками, по отношению к полному числу счетчиков и равна вероятности того, что через счетчик за время измерения пройдет n частиц.

Обозначим полное число счетчиков буквой N. Через них в секунду в среднем проходит N ν частиц, а за небольшое время dt пройдет N ν dt частиц. Если dt достаточно мало, то ни через один из счетчиков за это время не пройдет двух частиц, и наши счетчики можно разбить на два класса: те, через которые за dt прошла частица, и те, через которые не прошла. Последние составляют, конечно, огромное большинство. Число счетчиков, через которые прошла частица, равно, очевидно, числу сосчитанных частиц, т. е. приблизительно N ν dt, а их доля по отношению к полному числу счетчиков составляет N ν dt / N= ν dt.

Вероятность того, что за время dt через счетчик пройдет частица, равна, следовательно, ν dt. Это утверждение справедливо только в том случае, если dt очень мало.

Вычислим теперь вероятность P ₀(t) того, что за время t через счетчик не пройдет ни одной частицы. По определению число таких счетчиков в момент t составляет NP ₀(t), а в момент t + dt равно NP ₀(t + dt). Это число меньше, чем NP ₀(t), потому что за время dt их число убавится на NP ₀(t)ν dt. Поэтому

NP ₀(t + dt) = NP ₀(t) – NP ₀(t)ν dt,

или

P ₀(t + dt) – P ₀(t) = – P ₀(t)ν dt,

Деля это равенство на dt и переходя к пределу, получим:

dP ₀/ dt= –ν P ₀

Интегрируя, найдем:

P ₀(t) = – e^– ^ν ^t. (П.1)

При интегрировании было принято во внимание, что в начальный момент времени вероятность найти счетчик, не сработавший ни разу, равна, конечно, единице.

Вычислим теперь P_n (t + dt) – вероятность того, что за время: t + dt через счетчик пройдет ровно n частиц. Эти счетчики делятся на две группы. К первой принадлежат те, через которые все n частиц прошли за время t, а за время dt не прошло ни одной. Ко второй группе принадлежат счетчики, через которые за время t прошла n – 1 частица, а последняя частица прошла за время dt. Число первых счетчиков равно NP_n (t)(1 – ν dt), а число вторых составляет NP_n_– ₁(t)ν dt. (Каждое из этих выражений состоит из двух сомножителей. Первый из них определяет вероятность нужного числа срабатываний за время t, а второй – вероятность несрабатывания или срабатывания за время dt.) Имеем, следовательно:

NP_n (t + dt) = NP_n (t)(1 – ν dt) – NP_n_– ₁(t)ν dt.

Перенесем NP_n (t)(1 – ν dt) в левую часть равенства и разделит его на Ndt:

Последовательно применяя полученную рекуррентную формулу к n = 1, n = 2 и т. д., с помощью (П.1) найдем:

Заметим теперь, что ν t, которое мы обозначим через n ₀, равно среднему числу частиц, проходящих через счетчик за время t.

Наша формула примет вид

(П.2)

Эта формула является окончательной и носит название закона распределения Пуассона. Она определяет вероятность того, что при среднем числе срабатываний n ₀ (это число, вообще говоря, не является целым) произойдет именно n срабатываний (n – целое число).

Закон распределения Пуассона записан в такой форме, что из всех характеристик работы счетчика осталась только одна – его среднее число срабатываний за время измерения. Ни само время измерения, ни, тем более, площадь счетчика, которую мы вначале для простоты положили равной единице, в формулу не входят. Равным образом в формуле никак не отражено то обстоятельство, что мы рассматривали счетчик Гейгера, регистрирующий космическое излучение. С равным успехом эта формула применима к числу соединений на телефонной станции или к любой другой задаче, где число случаев является целым, а их появление в любой момент времени не зависит от числа случаев, произошедших ранее (независимые события).

Для иллюстрации на рис. 1 изображено распределение Пуассона для n ₀ = 2,6. Ни для какого n величина P_n не равна нулю. Она достигает максимума при n = 2. Вероятность найти n = 0 оказывается довольно велика. Достаточно велика также вероятность того, что счетчик срабатывает 3, 5 и даже 7 раз.

Рассмотрим некоторые свойства формулы (П.2). Вычислим, прежде всего, вероятность найти какое угодно значение n:

Этот результат является очевидным, потому что хоть какое-нибудь значение n, конечно, всегда будет найдено на опыте, так что мы вычисляли вероятность достоверного события.

Вычислим среднее значение n:

Полученный результат тоже можно было предсказать заранее, поскольку мы исходили из того, что среднее значение n равно n ₀.

Найдем теперь среднеквадратичное отклонение (стандартную ошибку) величины n. Для этого сначала вычислим дисперсию n (среднее значение квадрата отклонения):

Вычисление суммы в качестве полезного упражнения мы предоставляем читателям. Имеем, следовательно:

(П.3)

Этот результат мы уже использовали ранее без доказательства: стандартная погрешность, допускаемая при измерении числа отсчетов, равна корню квадратному из числа отсчетов.

Распределение Гаусса

Распределение Гаусса является предельным случаем распределения Пуассона и многих других законов распределения.

Рассмотрим распределение Пуассона при больших n ₀ и n. Дискретность распределения по n в этом случае теряет свое значение, так как n меняется практически непрерывно. Будем характеризовать отличие n от n ₀ с помощью ε, определенного соотношением

n = n ₀(1 + ε).

Подставляя формулу Стерлинга

в выражение (П.2), найдем:

откуда

. (П.4)

Вероятность P_n может быть обобщена на непрерывные величины. Чтобы это сделать, заметим, что n – n ₀ равно отклонению найденной на опыте величины n от среднего значения n ₀. Обозначим это отклонение через x:

x = n – n ₀.

Заменим n ₀ стандартным отклонением σ с помощью (П.3). Наконец, заметим, что P_n можно интерпретировать как вероятность того, что найденное на опыте значение n лежит в интервале между n – ½ и n + ½. Этому интервалу соответствует Δ x = 1. Произведя указанные замены и перейдя от обозначения P_n к обозначению P (x), получим:

. (П.5)

Распределение (П.5) носит название распределения Гаусса. P (x) определяет вероятность того, что величина x попадает в единичный интервал Δ x, окружающий точку х. Выбирая вместо единичного бесконечно малый интервал dx, найдем:

. (П.6)

Формула (П.6) определяет вероятность того, что для x будет найдено значение, заключенное между x –½ dx и x +½ dx. Величина P (x) называется плотностью вероятности. График функции P ₁(x), т. е. P (x) при σ = 1, изображен на рис. 2.

С помощью (П.6) нетрудно найти вероятность того, что для x будет найдено значение, лежащее между x ₁ и x ₂, где x ₁ и x ₂ – любые числа. Как нетрудно понять,

. (П.7)

Интеграл (П.7) в элементарных функциях не выражается. Он может быть вычислен с помощью таблиц интеграла вероятности erf(x):

. (П.8)

Нетрудно показать, что

. (П.9)

График функции erf(x) изображен на рис. 3. Функция erf(x) антисимметрична относительно точки x = 0, так что

erf(– x) = – erf(x). (П.10)

С помощью таблиц или графика erf(x) нетрудно найти вероятность того, что для искомой величины будет найдено значение, лежащее между –σ и σ, между –2σ и 2σ и между любыми другими значениями x:

Вероятность найти величину x в заданных пределах при увеличении ширины интервала быстро приближается к единице. Так.

и т. д. Из этого факта часто делается неверное утверждение о том, что погрешности, превосходящие 3σ, а тем более 4σ, практически никогда не встречаются. На самом деле они встречаются не так уж редко. Это происходит потому, что истинные распределения погрешностей очень разнообразны и никогда в точности не следуют закону Гаусса. Эти распределения обычно считают гауссовыми за неимением лучшего. В области малых отклонений от среднего закон распределения Гаусса по большей части неплохо оценивает вероятности различных встречающихся на практике отклонений, а в области больших отклонений описывает их плохо, и чем отклонения больше – тем хуже.

Метод наименьших квадратов

Метод наименьших квадратов позволяет находить по результатам эксперимента наилучшие значения параметров, входящих в формулы, вид которых считается известным. Пусть, например, исследуется растяжение тела. Обозначим значения приложенной к телу силы через y_i (i –номер опыта), а значения удлинений – через x_i. Считается известным, что сила, действующая на образец, и его удлинение связаны между собой законом Гука:

y = kx. (П.11)

Неизбежные погрешности опыта приводят к тому, что точки (x_i, y_i) не лежат на одной прямой. Метод наименьших квадратов позволяет найти наилучшее значение k аналитическим методом. В качестве такого значения в методе наименьших квадратов принимается значение, при котором величина

(П.12)

(σ _i – среднеквадратичная погрешность i -го измерения) имеет минимум. Иначе говоря, ищется значение k, при котором dφ/dk обращается в нуль. Имеем:

. (П.13)

Легко видеть, что мы пришли к линейному относительно k выражению, которое легко может быть решено. Приведем результат для случая, когда все σ _i равны друг другу. Из (П.13) следует в этом случае:

Разделив обе части этого уравнения на п, получим:

где угловые скобки, как обычно, обозначают средние значения. Из этого уравнения находим:

. (П.14)

Формула (П.14) определяет k с некоторой погрешностью, величина которой может быть оценена по разбросу экспериментальных данных. Вычисления дают:

. (П.15)

В формулу (П.15) следует подставлять значение k, полученное из (П.14).

Аналогичным образом могут быть получены формулы для случая, когда стандартные погрешности σ _i не равны друг другу, и формулы для определения параметров в формулах более сложных, чем (П.11). Формулы для определения параметров в формуле

y = a + bx. (П.16)

приведены выше.

Скажем несколько слов о случаях, когда зависимость y от x описывается более сложными формулами, например функцией произвольного вида:

у = f (x, а, b, с,...), (П.17)

где а, b, с,... – искомые параметры.

Если погрешности измерения величины y_i описываются законом Гаусса, то решение задачи находится путем отыскания минимума величины

, (П.18)

для чего приравниваются нулю частные производные dφ/da, dφ/db, dφ/dc и т. д. Легко видеть, что при этом возникает столько уравнений сколько имеется подлежащих определению величин а, b, с,... Эти уравнения в общем случае нелинейны и могут быть решены только численно.

Если погрешности в измерении y_i не описываются законом Гаусса, то задача становится еще более сложной и приводится к отысканию экстремума функций существенно более сложных, чем (П.18). Соответствующий метод носит название метода наибольшего правдоподобия. Мы этого случая рассматривать не будем.

В том случае, когда в формуле подбирается не один, а несколько параметров, решение приобретает новые важные черты. Погрешности параметров обычно оказываются связанными друг с другом: отклонения сразу по двум параметрам – при определенном соотношении между ними – могут оказаться более вероятными, чем отклонение только по одному параметру. При решении одномерной задачи указывают среднеквадратичную погрешность – погрешность, которая при гауссовом распределении превышается, как мы уже отмечали, приблизительно в одной трети случаев. В двумерной задаче нужно в плоскости искомых параметров проводить кривую, выделяющую соответствующую область. При гауссовых распределениях эта кривая является эллипсом. Как известно, величина и положение эллипса определяются не двумя, а тремя числами, например размерами его полуосей и углом их поворота. При измерениях, в которых следует определить два параметра, задание погрешностей требует поэтому, строго говоря, указания не двух, а трех чисел, которые образуют квадратную симметричную «матрицу ошибок».

Мы не будем более развивать эту тему и отошлем интересующихся к литературе.

§ 4. Критерии значимости. Метод χ².

Вернемся к опыту по исследованию упругих свойств металлического стержня. Пусть результаты опытов изображаются точками на рис. 4. Первый же взгляд на график убеждает нас в том, что зависимость удлинения от нагрузки является линейной или почти линейной. В самом деле, прямая, проведенная на рис. 4 сплошной линией, не противоречит экспериментальным данным. Им не противоречит, однако, и изогнутая штриховая линия. Более того, эта линия даже несколько лучше удовлетворяет экспериментальным данным, чем прямая. Мы хотели бы, однако, думать, что истинная связь удлинения и нагрузки все-таки является прямолинейной. Задача сводится к отысканию критерия, позволяющего судить о том, является ли представление искомой зависимости в виде прямой линии достаточно хорошим или экспериментальные данные заставляют отдать предпочтение криволинейной зависимости, например зависимости, изображенной штриховой линией.

Сформулированная сейчас задача в применении к закону Гука представляется несколько искусственной. В этом случае лучше всего попросту повторить опыт, уменьшив экспериментальные ошибки, и вопрос решится сам собой. Встречаются, однако, случаи, когда такое повторение опыта оказывается затруднительным или даже невозможным. Так бывает, например, при опытах с редкими частицами в космических лучах или на ускорителях, когда повторение опыта требует нескольких лет работы или попросту невозможно. Возможно, более полная интерпретация имеющихся данных становится в этом случае особенно существенной.

Общий вопрос, который возникает в таких случаях, сводится обычно к следующему. На графике, изображающем некоторую зависимость, точки легли не вполне регулярно. Следует ли придавать значение наблюденным отступлениям от гладкой кривой? Совместима ли с экспериментальными данными гипотеза о том, что искомая зависимость на самом деле является гладкой (или даже прямолинейной), или эти данные указывают на негладкий, аномальный ход кривой?

Исследование проблемы достоверности гипотез производится обычно с помощью критериев значимости. Одним из наиболее удобных критериев значимости является так называемый «критерий χ²»•

В предыдущем параграфе мы рассматривали метод наименьших квадратов, с помощью которого можно, например, провести через экспериментальные точки наилучшую прямую. Исследуем теперь вопрос о том, насколько данные, использованные для проведения этой прямой, согласуются с представлением о том, что рассматриваемая прямолинейная зависимость действительно имеет место. Единственной мерой, которая может быть использована для расчета, является, естественно, точность, с которой экспериментальные точки удовлетворяют предполагаемому закону. В методе χ² в качестве такой меры принимается сумма квадратов отклонений от предполагаемой зависимости:

. (П.19)

Отклонения экспериментальных точек от ожидаемых значений, как мы видим, выражаются в долях стандартной ошибки данного измерения. Найденное значение χ² должно быть сопоставлено с теорией. Это делается с помощью таблицы 1. В таблице для разного числа степеней свободы (числом степеней свободы в этом случае называется число измерений без одного, если гипотеза не содержит определяемых из опыта коэффициентов; число измерений без двух, если из опыта находится один коэффициент, например наклон прямой, и т. д.) приведены значения χ² для ряда чисел p. Для 10 степеней свободы находим из таблицы, что χ² = 2,6 для p = 99, χ² = 3,9 для p = 95, х² = 7,3 для p = 70, χ² = 23,2 для p = 1 и т. д. Это означает, что в том случае, если гипотеза справедлива, рассчитанное по (П.19) значение χ² с вероятностью 99% (p = 99) окажется больше 2,6, с вероятностью 95% (p = 95) больше. 3,9, с вероятностью 70%.больше 7,3, с вероятностью 1% больше 23,2 и т. д.

Пусть мы найдем в результате расчета по формуле (П.19) χ² = 3,5. Такое значение χ² должно наблюдаться больше чем в 95% случаев; отклонение наших данных от ожидаемой прямолинейной зависимости является в этом случае совершенно несущественным. Если бы мы нашли в результате расчета χ² = 18, сопоставление с таблицей показало бы нам, что такие отклонения следует ожидать только в 5% случаев. Существование прямолинейной зависимости и в этом случае нельзя считать исключенным, но должно быть поставлено под сомнение. Естественно в этом случае повторить опыт, чтобы получить более ясный результат. Если бы χ² оказалось равным 30 (вероятность получить на опыте такое значение ≈0,1%), можно было бы утверждать, что проверяемая гипотеза почти наверное является ошибочной.

При сравнении отклонений с таблицей обычно применяют следующую терминологию: если найденная из опыта величина χ² должна наблюдаться с вероятностью, заключенной между 1 и 5%, отклонения называются почти значимыми, если вероятность заключена между 0,1 и 1%,– значимыми и, наконец, если вероятность обнаружить найденное значение χ² оказывается меньше 0,1%, отклонения являются высокозначимыми. При вероятности больше 5% следует считать, что экспериментальные данные недостаточны для того, чтобы отвергнуть гипотезу.

На этом мы заканчиваем краткое изложение общих методов обработки результатов наблюдений. Более подробные сведения могут быть найдены в специальных книгах.

Таблица 1.

Распределение χ²

p – вероятность (в%) найти на опыте значение χ², большее, чем указано в таблице;

n – число степеней свободы системы.

p n														0,1
	0,3	0,4	0,7	1,1	1,6	2,2	3,4	4,9	6,0	7,8	9,5	11,7	13,3	18,5
	0,6	0,8	1,1	1,6	2,3	3,0	4,4	6,1	7,3	9,2	11,1	13,4	15,1	20,5
	0,9	1,1	1,6	2,2	3,1	3,8	5,3	7,2	8,6	10,6	12,6	15,0	16,8	22,5
	1,2	1,6	2,2	2,8	3,8	4,7	6,3	8,4	9,8	12,0	14,1	16,6	18,5	24,3
	1,6	2,0	2,7	3,5	4,6	5,5	7,3	9,5	11,0	13,4	15,5	18,2	20,1	26,1
	2,1	2,5	3,3	4,2	5,4	6,4	8,3	10,7	12,2	14,7	16,9	19,7	21,7	27,9
	2,6	3,1	3,9	4,9	6,2	7,3	9,3	11,8	13,4	16,0	18,3	21,2	23,2	29,6
	3,1	3,6	4,6	5,6	7,0	8,1	10,3	12,9	14,6	17,3	19,7	22,6	24,7	31,3
	3,6	4,2	5,2	6,3	7,8	9,0	11,3	14,0	15,8	18,5	21,0	24,1	26,2	32,9
	4,1	4,8	5,9	7,0	8,6	9,9	12,3	15,1	17,0	19,8	22,4	25,5	27,7	34,5
	4,7	5,4	6,6	7,8	9,5	10,8	13,3	16,2	18,1	21,1	23,7	26,9	29,1	36,1
	5,2	6,0	7,3	8,5	10,3	11,7	14,3	17,3	19,3	22,3	25,0	28,3	30,6	37,7
	5,8	6,6	8,0	9,3	11,1	12,6	15,3	18,4	20,5	23,5	26,3	29,6	32,0	39,2
	6,4	7,3	8,7	10,1	12,0	13,5	16,3	19,5	21,6	24,8	27,6	31,0	33,4	40,8
	7,0	7,9	9,4	10,9	12,9	14,4	17,3	20,6	22,8	26,0	28,9	32,3	34,8	42,3
	7,6	8,6	10,1	11,6	13,7	15,4	18,3	21,7	23,9	27,2	30,1	33,7	36,2	43,8
	8,3	9,2	10,8	12,4	14,6	16,3	19,3	22,8	25,0	28,4	31,4	35,0	37,6	45,3
	8,9	9,9	11,6	13,2	15,4	17,2	20,3	23,9	26,2	29,6	32,7	36,3	38,9	46,8
	9,5	10,6	12,3	14,0	16,3	18,1	21,3	24,9	27,3	30,8	33,9	37,7	40,3	48,3
	10,2	11,3	13,1	14,8	17,2	19,0	22,3	26,0	28,4	32,0	35,2	39,0	41,6	49,7
	10,9	12,0	13,8	15,7	18,1	19,9	23,3	27,1	29,6	33,2	36,4	40,3	43,0	51,2
	11,5	12,7	14,6	16,5	18,9	20,9	24,3	28,2	30,7	34,4	37,7	41,6	44,3	52,6
	12,2	13,4	15,4	17,3	19,8	21,8	25,3	29,2	31,8	35,6	38,9	42,9	45,6	54,0
	12,9	14,1	16,1	18,1	20,7	22,7	26,3	30,3	32,9	36,7	40,1	44,1	47,0	55,5
	13,6	14,8	16,9	18,9	21,6	23,6	27,3	31,4	34,0	37,9	41,3	45,4	48,3	56,9
	14,3	15,6	17,7	19,8	22,5	24,6	28,3	32,5	35,1	39,1	42,6	46,7	49,6	58,3
	15,0	16,3	18,5	20,6	23,4	25,5	29,3	33,5	36,2	40,3	43,8	48,0	50,9	59,7

⇐ Предыдущая 1 2 3 4 5 678 Следующая ⇒

Познавательные статьи:

Техника прыжка в длину с разбега

Тактические действия в защите

История Олимпийских игр

История развития права интеллектуальной собственности

Последнее изменение этой страницы: 2016-08-26; просмотров: 305; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.224.32.243 (0.009 с.)