Обработка результатов наблюдения 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Обработка результатов наблюдения



Распределение Пуассона

В физике часто приходится встречаться с измерениями, результаты которых представляются в виде целых чисел. Через счетчик Гейгера за время измерения приходит целое – и обычно не очень большое – число частиц. Делящееся ядро распадается на целое число частей. Статистические закономерности, которые имеют место в этом случае, обладают некоторыми особенностями.

Рассмотрим счетчик, регистрирующий космические частицы. В то время как число отсчетов счетчика за любой промежуток времени является целым числом, интенсивность ν космического излучения (т. е. отнесенное к единице площади число отсчетов счетчика в секунду, усредненное за очень большой отрезок времени), вообще говоря, целым числом не выражается.

Найдем вероятность того, что при интенсивности ν счетчик за время измерения сработает n раз. Будем для простоты считать, что счетчик обладает единичной площадью,– окончательные формулы от этого предположения не зависят.

Поскольку мы приступаем к вычислению вероятностей, следует представить себе очень большое число совершенно одинаковых одновременно работающих счетчиков. Некоторая часть их сработает ровно n раз. Доля, составляемая этими счетчиками, по отношению к полному числу счетчиков и равна вероятности того, что через счетчик за время измерения пройдет n частиц.

Обозначим полное число счетчиков буквой N. Через них в секунду в среднем проходит N ν частиц, а за небольшое время dt пройдет N ν dt частиц. Если dt достаточно мало, то ни через один из счетчиков за это время не пройдет двух частиц, и наши счетчики можно разбить на два класса: те, через которые за dt прошла частица, и те, через которые не прошла. Последние составляют, конечно, огромное большинство. Число счетчиков, через которые прошла частица, равно, очевидно, числу сосчитанных частиц, т. е. приблизительно N ν dt, а их доля по отношению к полному числу счетчиков составляет N ν dt / N= ν dt.

Вероятность того, что за время dt через счетчик пройдет ча­стица, равна, следовательно, ν dt. Это утверждение справедливо только в том случае, если dt очень мало.

Вычислим теперь вероятность P 0(t) того, что за время t через счетчик не пройдет ни одной частицы. По определению число та­ких счетчиков в момент t составляет NP 0(t), а в момент t + dt равно NP 0(t + dt). Это число меньше, чем NP 0(t), потому что за время dt их число убавится на NP 0(tdt. Поэтому

NP 0(t + dt) = NP 0(t) – NP 0(tdt,

или

P 0(t + dt) – P 0(t) = – P 0(tdt,

Деля это равенство на dt и переходя к пределу, получим:

dP 0/ dt= –ν P 0

Интегрируя, найдем:

P 0(t) = – e ν t. (П.1)

При интегрировании было принято во внимание, что в начальный момент времени вероятность найти счетчик, не сработавший ни разу, равна, конечно, единице.

Вычислим теперь Pn (t + dt) – вероятность того, что за время: t + dt через счетчик пройдет ровно n частиц. Эти счетчики делятся на две группы. К первой принадлежат те, через которые все n частиц прошли за время t, а за время dt не прошло ни одной. Ко второй группе принадлежат счетчики, через которые за время t прошла n – 1 частица, а последняя частица прошла за время dt. Число первых счетчиков равно NPn (t)(1 – ν dt), а число вторых составляет NPn 1(tdt. (Каждое из этих выражений состоит из двух сомножителей. Первый из них определяет вероятность нужного числа срабатываний за время t, а второй – вероятность несрабатывания или срабатывания за время dt.) Имеем, следовательно:

NPn (t + dt) = NPn (t)(1 – ν dt) – NPn 1(tdt.

Перенесем NPn (t)(1 – ν dt) в левую часть равенства и разделит его на Ndt:

Последовательно применяя полученную рекуррентную формулу к n = 1, n = 2 и т. д., с помощью (П.1) найдем:

.

Заметим теперь, что ν t, которое мы обозначим через n 0, равно среднему числу частиц, проходящих через счетчик за время t.

Наша формула примет вид

(П.2)

Эта формула является окончательной и носит название закона распределения Пуассона. Она определяет вероятность того, что при среднем числе срабатываний n 0 (это число, вообще говоря, не является целым) произойдет именно n срабатываний (n – целое число).

Закон распределения Пуассона записан в такой форме, что из всех характеристик работы счетчика осталась только одна – его среднее число срабатываний за время измерения. Ни само время измерения, ни, тем более, площадь счетчика, которую мы вначале для простоты положили равной единице, в формулу не входят. Равным образом в формуле никак не отражено то обстоятельство, что мы рассматривали счетчик Гейгера, регистрирующий космическое излучение. С равным успехом эта формула применима к числу соединений на телефонной станции или к любой другой задаче, где число случаев является целым, а их появление в любой момент времени не зависит от числа случаев, произошедших ранее (независимые события).

Для иллюстрации на рис. 1 изображено распределение Пуассона для n 0 = 2,6. Ни для какого n величина Pn не равна нулю. Она достигает максимума при n = 2. Вероятность найти n = 0 оказывается довольно велика. Достаточно велика также вероятность того, что счетчик срабатывает 3, 5 и даже 7 раз.

Рассмотрим некоторые свойства формулы (П.2). Вычислим, прежде всего, вероятность найти какое угодно значение n:

.

Этот результат является очевидным, потому что хоть какое-нибудь значение n, конечно, всегда будет найдено на опыте, так что мы вычисляли вероятность достоверного события.

Вычислим среднее значение n:

.

Полученный результат тоже можно было предсказать заранее, поскольку мы исходили из того, что среднее значение n равно n 0.

Найдем теперь среднеквадратичное отклонение (стандартную ошибку) величины n. Для этого сначала вычислим дисперсию n (среднее значение квадрата отклонения):

.

Вычисление суммы в качестве полезного упражнения мы предоставляем читателям. Имеем, следовательно:

(П.3)

Этот результат мы уже использовали ранее без доказательства: стандартная погрешность, допускаемая при измерении числа отсчетов, равна корню квадратному из числа отсчетов.

Распределение Гаусса

Распределение Гаусса является предельным случаем распределения Пуассона и многих других законов распределения.

Рассмотрим распределение Пуассона при больших n 0 и n. Дискретность распределения по n в этом случае теряет свое значение, так как n меняется практически непрерывно. Будем характеризовать отличие n от n 0 с помощью ε, определенного соотношением

n = n 0(1 + ε).

Подставляя формулу Стерлинга

в выражение (П.2), найдем:

,

откуда

. (П.4)

Вероятность Pn может быть обобщена на непрерывные величины. Чтобы это сделать, заметим, что nn 0 равно отклонению найденной на опыте величины n от среднего значения n 0. Обозначим это отклонение через x:

x = nn 0.

Заменим n 0 стандартным отклонением σ с помощью (П.3). Наконец, заметим, что Pn можно интерпретировать как вероятность того, что найденное на опыте значение n лежит в интервале между n – ½ и n + ½. Этому интервалу соответствует Δ x = 1. Произведя указанные замены и перейдя от обозначения Pn к обозначению P (x), получим:

. (П.5)

Распределение (П.5) носит название распределения Гаусса. P (x) определяет вероятность того, что величина x попадает в единичный интервал Δ x, окружающий точку х. Выбирая вместо единичного бесконечно малый интервал dx, найдем:

. (П.6)


Формула (П.6) определяет вероятность того, что для x будет найдено значение, заключенное между x –½ dx и xdx. Величина P (x) называется плотностью вероятности. График функции P 1(x), т. е. P (x) при σ = 1, изображен на рис. 2.

С помощью (П.6) нетрудно найти вероятность того, что для x будет найдено значение, лежащее между x 1 и x 2, где x 1 и x 2 – любые числа. Как нетрудно понять,

. (П.7)

Интеграл (П.7) в элементарных функциях не выражается. Он может быть вычислен с помощью таблиц интеграла вероятности erf(x):

. (П.8)

Нетрудно показать, что

. (П.9)

График функции erf(x) изображен на рис. 3. Функция erf(x) антисимметрична относительно точки x = 0, так что

erf(– x) = – erf(x). (П.10)

С помощью таблиц или графика erf(x) нетрудно найти вероятность того, что для искомой величины будет найдено значение, лежащее между –σ и σ, между –2σ и 2σ и между любыми другими значениями x:

.

Вероятность найти величину x в заданных пределах при увеличении ширины интервала быстро приближается к единице. Так.

,

и т. д. Из этого факта часто делается неверное утверждение о том, что погрешности, превосходящие 3σ, а тем более 4σ, практически никогда не встречаются. На самом деле они встречаются не так уж редко. Это происходит потому, что истинные распределения погрешностей очень разнообразны и никогда в точности не следуют закону Гаусса. Эти распределения обычно считают гауссовыми за неимением лучшего. В области малых отклонений от среднего закон распределения Гаусса по большей части неплохо оценивает вероятности различных встречающихся на практике отклонений, а в области больших отклонений описывает их плохо, и чем отклонения больше – тем хуже.

Метод наименьших квадратов

Метод наименьших квадратов позволяет находить по результатам эксперимента наилучшие значения параметров, входящих в формулы, вид которых считается известным. Пусть, например, исследуется растяжение тела. Обозначим значения приложенной к телу силы через yi (i –номер опыта), а значения удлинений – через xi. Считается известным, что сила, действующая на образец, и его удлинение связаны между собой законом Гука:

y = kx. (П.11)

Неизбежные погрешности опыта приводят к тому, что точки (xi, yi) не лежат на одной прямой. Метод наименьших квадратов позволяет найти наилучшее значение k аналитическим методом. В качестве такого значения в методе наименьших квадратов принимается значение, при котором величина

(П.12)

i – среднеквадратичная погрешность i -го измерения) имеет минимум. Иначе говоря, ищется значение k, при котором dφ/dk обращается в нуль. Имеем:

. (П.13)

Легко видеть, что мы пришли к линейному относительно k выражению, которое легко может быть решено. Приведем результат для случая, когда все σ i равны друг другу. Из (П.13) следует в этом случае:

.

Разделив обе части этого уравнения на п, получим:

,

где угловые скобки, как обычно, обозначают средние значения. Из этого уравнения находим:

. (П.14)

Формула (П.14) определяет k с некоторой погрешностью, величина которой может быть оценена по разбросу экспериментальных данных. Вычисления дают:

. (П.15)

В формулу (П.15) следует подставлять значение k, полученное из (П.14).

Аналогичным образом могут быть получены формулы для случая, когда стандартные погрешности σ i не равны друг другу, и формулы для определения параметров в формулах более сложных, чем (П.11). Формулы для определения параметров в формуле

y = a + bx. (П.16)

приведены выше.

Скажем несколько слов о случаях, когда зависимость y от x описывается более сложными формулами, например функцией произвольного вида:

у = f (x, а, b, с,...), (П.17)

где а, b, с,... – искомые параметры.

Если погрешности измерения величины yi описываются законом Гаусса, то решение задачи находится путем отыскания минимума величины

, (П.18)

для чего приравниваются нулю частные производные dφ/da, dφ/db, dφ/dc и т. д. Легко видеть, что при этом возникает столько уравнений сколько имеется подлежащих определению величин а, b, с,... Эти уравнения в общем случае нелинейны и могут быть решены только численно.

Если погрешности в измерении yi не описываются законом Гаусса, то задача становится еще более сложной и приводится к отысканию экстремума функций существенно более сложных, чем (П.18). Соответствующий метод носит название метода наибольшего правдоподобия. Мы этого случая рассматривать не будем.

В том случае, когда в формуле подбирается не один, а несколько параметров, решение приобретает новые важные черты. Погрешности параметров обычно оказываются связанными друг с другом: отклонения сразу по двум параметрам – при определенном соотношении между ними – могут оказаться более вероятными, чем отклонение только по одному параметру. При решении одномерной задачи указывают среднеквадратичную погрешность – погрешность, которая при гауссовом распределении превышается, как мы уже отмечали, приблизительно в одной трети случаев. В двумерной задаче нужно в плоскости искомых параметров проводить кривую, выделяющую соответствующую область. При гауссовых распределениях эта кривая является эллипсом. Как известно, величина и положение эллипса определяются не двумя, а тремя числами, например размерами его полуосей и углом их поворота. При измерениях, в которых следует определить два параметра, задание погрешностей требует поэтому, строго говоря, указания не двух, а трех чисел, которые образуют квадратную симметричную «матрицу ошибок».

Мы не будем более развивать эту тему и отошлем интересующихся к литературе.

§ 4. Критерии значимости. Метод χ2.

Вернемся к опыту по исследованию упругих свойств металлического стержня. Пусть результаты опытов изображаются точками на рис. 4. Первый же взгляд на график убеждает нас в том, что зависимость удлинения от нагрузки является линейной или почти линейной. В самом деле, прямая, проведенная на рис. 4 сплошной линией, не противоречит экспериментальным данным. Им не противоречит, однако, и изогнутая штриховая линия. Более того, эта линия даже несколько лучше удовлетворяет экспериментальным данным, чем прямая. Мы хотели бы, однако, думать, что истинная связь удлинения и нагрузки все-таки является прямолинейной. Задача сводится к отысканию критерия, позволяющего судить о том, является ли представление искомой зависимости в виде прямой линии достаточно хорошим или экспериментальные данные заставляют отдать предпочтение криволинейной зависимости, например зависимости, изображенной штриховой линией.

Сформулированная сейчас задача в применении к закону Гука представляется несколько искусственной. В этом случае лучше всего попросту повторить опыт, уменьшив экспериментальные ошибки, и вопрос решится сам собой. Встречаются, однако, случаи, когда такое повторение опыта оказывается затруднительным или даже невозможным. Так бывает, например, при опытах с редкими частицами в космических лучах или на ускорителях, когда повторение опыта требует нескольких лет работы или попросту невозможно. Возможно, более полная интерпретация имеющихся данных становится в этом случае особенно существенной.

Общий вопрос, который возникает в таких случаях, сводится обычно к следующему. На графике, изображающем некоторую зависимость, точки легли не вполне регулярно. Следует ли придавать значение наблюденным отступлениям от гладкой кривой? Совместима ли с экспериментальными данными гипотеза о том, что искомая зависимость на самом деле является гладкой (или даже прямолинейной), или эти данные указывают на негладкий, аномальный ход кривой?

Исследование проблемы достоверности гипотез производится обычно с помощью критериев значимости. Одним из наиболее удобных критериев значимости является так называемый «критерий χ2»•

В предыдущем параграфе мы рассматривали метод наименьших квадратов, с помощью которого можно, например, провести через экспериментальные точки наилучшую прямую. Исследуем теперь вопрос о том, насколько данные, использованные для проведения этой прямой, согласуются с представлением о том, что рассматриваемая прямолинейная зависимость действительно имеет место. Единственной мерой, которая может быть использована для расчета, является, естественно, точность, с которой экспериментальные точки удовлетворяют предполагаемому закону. В методе χ2 в качестве такой меры принимается сумма квадратов отклонений от предполагаемой зависимости:

. (П.19)

Отклонения экспериментальных точек от ожидаемых значений, как мы видим, выражаются в долях стандартной ошибки данного измерения. Найденное значение χ2 должно быть сопоставлено с теорией. Это делается с помощью таблицы 1. В таблице для разного числа степеней свободы (числом степеней свободы в этом случае называется число измерений без одного, если гипотеза не содержит определяемых из опыта коэффициентов; число измерений без двух, если из опыта находится один коэффициент, например наклон прямой, и т. д.) приведены значения χ2 для ряда чисел p. Для 10 степеней свободы находим из таблицы, что χ2 = 2,6 для p = 99, χ2 = 3,9 для p = 95, х2 = 7,3 для p = 70, χ2 = 23,2 для p = 1 и т. д. Это означает, что в том случае, если гипотеза справедлива, рассчитанное по (П.19) значение χ2 с вероятностью 99% (p = 99) окажется больше 2,6, с вероятностью 95% (p = 95) больше. 3,9, с вероятностью 70%.больше 7,3, с вероятностью 1% больше 23,2 и т. д.

Пусть мы найдем в результате расчета по формуле (П.19) χ2 = 3,5. Такое значение χ2 должно наблюдаться больше чем в 95% случаев; отклонение наших данных от ожидаемой прямолинейной зависимости является в этом случае совершенно несущественным. Если бы мы нашли в результате расчета χ2 = 18, сопоставление с таблицей показало бы нам, что такие отклонения следует ожидать только в 5% случаев. Существование прямолинейной зависимости и в этом случае нельзя считать исключенным, но должно быть поставлено под сомнение. Естественно в этом случае повторить опыт, чтобы получить более ясный результат. Если бы χ2 оказалось равным 30 (вероятность получить на опыте такое значение ≈0,1%), можно было бы утверждать, что проверяемая гипотеза почти наверное является ошибочной.

При сравнении отклонений с таблицей обычно применяют следующую терминологию: если найденная из опыта величина χ2 должна наблюдаться с вероятностью, заключенной между 1 и 5%, отклонения называются почти значимыми, если вероятность заключена между 0,1 и 1%,– значимыми и, наконец, если вероятность обнаружить найденное значение χ2 оказывается меньше 0,1%, отклонения являются высокозначимыми. При вероятности больше 5% следует считать, что экспериментальные данные недостаточны для того, чтобы отвергнуть гипотезу.

На этом мы заканчиваем краткое изложение общих методов обработки результатов наблюдений. Более подробные сведения могут быть найдены в специальных книгах.


Таблица 1.

Распределение χ2

p – вероятность (в%) найти на опыте значение χ2, большее, чем указано в таблице;

n – число степеней свободы системы.



Поделиться:


Последнее изменение этой страницы: 2016-08-26; просмотров: 245; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 34.229.151.93 (0.056 с.)