Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Обработка результатов наблюдения

Поиск

Распределение Пуассона

В физике часто приходится встречаться с измерениями, результаты которых представляются в виде целых чисел. Через счетчик Гейгера за время измерения приходит целое – и обычно не очень большое – число частиц. Делящееся ядро распадается на целое число частей. Статистические закономерности, которые имеют место в этом случае, обладают некоторыми особенностями.

Рассмотрим счетчик, регистрирующий космические частицы. В то время как число отсчетов счетчика за любой промежуток времени является целым числом, интенсивность ν космического излучения (т. е. отнесенное к единице площади число отсчетов счетчика в секунду, усредненное за очень большой отрезок времени), вообще говоря, целым числом не выражается.

Найдем вероятность того, что при интенсивности ν счетчик за время измерения сработает n раз. Будем для простоты считать, что счетчик обладает единичной площадью,– окончательные формулы от этого предположения не зависят.

Поскольку мы приступаем к вычислению вероятностей, следует представить себе очень большое число совершенно одинаковых одновременно работающих счетчиков. Некоторая часть их сработает ровно n раз. Доля, составляемая этими счетчиками, по отношению к полному числу счетчиков и равна вероятности того, что через счетчик за время измерения пройдет n частиц.

Обозначим полное число счетчиков буквой N. Через них в секунду в среднем проходит N ν частиц, а за небольшое время dt пройдет N ν dt частиц. Если dt достаточно мало, то ни через один из счетчиков за это время не пройдет двух частиц, и наши счетчики можно разбить на два класса: те, через которые за dt прошла частица, и те, через которые не прошла. Последние составляют, конечно, огромное большинство. Число счетчиков, через которые прошла частица, равно, очевидно, числу сосчитанных частиц, т. е. приблизительно N ν dt, а их доля по отношению к полному числу счетчиков составляет N ν dt / N= ν dt.

Вероятность того, что за время dt через счетчик пройдет ча­стица, равна, следовательно, ν dt. Это утверждение справедливо только в том случае, если dt очень мало.

Вычислим теперь вероятность P 0(t) того, что за время t через счетчик не пройдет ни одной частицы. По определению число та­ких счетчиков в момент t составляет NP 0(t), а в момент t + dt равно NP 0(t + dt). Это число меньше, чем NP 0(t), потому что за время dt их число убавится на NP 0(tdt. Поэтому

NP 0(t + dt) = NP 0(t) – NP 0(tdt,

или

P 0(t + dt) – P 0(t) = – P 0(tdt,

Деля это равенство на dt и переходя к пределу, получим:

dP 0/ dt= –ν P 0

Интегрируя, найдем:

P 0(t) = – e ν t. (П.1)

При интегрировании было принято во внимание, что в начальный момент времени вероятность найти счетчик, не сработавший ни разу, равна, конечно, единице.

Вычислим теперь Pn (t + dt) – вероятность того, что за время: t + dt через счетчик пройдет ровно n частиц. Эти счетчики делятся на две группы. К первой принадлежат те, через которые все n частиц прошли за время t, а за время dt не прошло ни одной. Ко второй группе принадлежат счетчики, через которые за время t прошла n – 1 частица, а последняя частица прошла за время dt. Число первых счетчиков равно NPn (t)(1 – ν dt), а число вторых составляет NPn 1(tdt. (Каждое из этих выражений состоит из двух сомножителей. Первый из них определяет вероятность нужного числа срабатываний за время t, а второй – вероятность несрабатывания или срабатывания за время dt.) Имеем, следовательно:

NPn (t + dt) = NPn (t)(1 – ν dt) – NPn 1(tdt.

Перенесем NPn (t)(1 – ν dt) в левую часть равенства и разделит его на Ndt:

Последовательно применяя полученную рекуррентную формулу к n = 1, n = 2 и т. д., с помощью (П.1) найдем:

.

Заметим теперь, что ν t, которое мы обозначим через n 0, равно среднему числу частиц, проходящих через счетчик за время t.

Наша формула примет вид

(П.2)

Эта формула является окончательной и носит название закона распределения Пуассона. Она определяет вероятность того, что при среднем числе срабатываний n 0 (это число, вообще говоря, не является целым) произойдет именно n срабатываний (n – целое число).

Закон распределения Пуассона записан в такой форме, что из всех характеристик работы счетчика осталась только одна – его среднее число срабатываний за время измерения. Ни само время измерения, ни, тем более, площадь счетчика, которую мы вначале для простоты положили равной единице, в формулу не входят. Равным образом в формуле никак не отражено то обстоятельство, что мы рассматривали счетчик Гейгера, регистрирующий космическое излучение. С равным успехом эта формула применима к числу соединений на телефонной станции или к любой другой задаче, где число случаев является целым, а их появление в любой момент времени не зависит от числа случаев, произошедших ранее (независимые события).

Для иллюстрации на рис. 1 изображено распределение Пуассона для n 0 = 2,6. Ни для какого n величина Pn не равна нулю. Она достигает максимума при n = 2. Вероятность найти n = 0 оказывается довольно велика. Достаточно велика также вероятность того, что счетчик срабатывает 3, 5 и даже 7 раз.

Рассмотрим некоторые свойства формулы (П.2). Вычислим, прежде всего, вероятность найти какое угодно значение n:

.

Этот результат является очевидным, потому что хоть какое-нибудь значение n, конечно, всегда будет найдено на опыте, так что мы вычисляли вероятность достоверного события.

Вычислим среднее значение n:

.

Полученный результат тоже можно было предсказать заранее, поскольку мы исходили из того, что среднее значение n равно n 0.

Найдем теперь среднеквадратичное отклонение (стандартную ошибку) величины n. Для этого сначала вычислим дисперсию n (среднее значение квадрата отклонения):

.

Вычисление суммы в качестве полезного упражнения мы предоставляем читателям. Имеем, следовательно:

(П.3)

Этот результат мы уже использовали ранее без доказательства: стандартная погрешность, допускаемая при измерении числа отсчетов, равна корню квадратному из числа отсчетов.

Распределение Гаусса

Распределение Гаусса является предельным случаем распределения Пуассона и многих других законов распределения.

Рассмотрим распределение Пуассона при больших n 0 и n. Дискретность распределения по n в этом случае теряет свое значение, так как n меняется практически непрерывно. Будем характеризовать отличие n от n 0 с помощью ε, определенного соотношением

n = n 0(1 + ε).

Подставляя формулу Стерлинга

в выражение (П.2), найдем:

,

откуда

. (П.4)

Вероятность Pn может быть обобщена на непрерывные величины. Чтобы это сделать, заметим, что nn 0 равно отклонению найденной на опыте величины n от среднего значения n 0. Обозначим это отклонение через x:

x = nn 0.

Заменим n 0 стандартным отклонением σ с помощью (П.3). Наконец, заметим, что Pn можно интерпретировать как вероятность того, что найденное на опыте значение n лежит в интервале между n – ½ и n + ½. Этому интервалу соответствует Δ x = 1. Произведя указанные замены и перейдя от обозначения Pn к обозначению P (x), получим:

. (П.5)

Распределение (П.5) носит название распределения Гаусса. P (x) определяет вероятность того, что величина x попадает в единичный интервал Δ x, окружающий точку х. Выбирая вместо единичного бесконечно малый интервал dx, найдем:

. (П.6)


Формула (П.6) определяет вероятность того, что для x будет найдено значение, заключенное между x –½ dx и xdx. Величина P (x) называется плотностью вероятности. График функции P 1(x), т. е. P (x) при σ = 1, изображен на рис. 2.

С помощью (П.6) нетрудно найти вероятность того, что для x будет найдено значение, лежащее между x 1 и x 2, где x 1 и x 2 – любые числа. Как нетрудно понять,

. (П.7)

Интеграл (П.7) в элементарных функциях не выражается. Он может быть вычислен с помощью таблиц интеграла вероятности erf(x):

. (П.8)

Нетрудно показать, что

. (П.9)

График функции erf(x) изображен на рис. 3. Функция erf(x) антисимметрична относительно точки x = 0, так что

erf(– x) = – erf(x). (П.10)

С помощью таблиц или графика erf(x) нетрудно найти вероятность того, что для искомой величины будет найдено значение, лежащее между –σ и σ, между –2σ и 2σ и между любыми другими значениями x:

.

Вероятность найти величину x в заданных пределах при увеличении ширины интервала быстро приближается к единице. Так.

,

и т. д. Из этого факта часто делается неверное утверждение о том, что погрешности, превосходящие 3σ, а тем более 4σ, практически никогда не встречаются. На самом деле они встречаются не так уж редко. Это происходит потому, что истинные распределения погрешностей очень разнообразны и никогда в точности не следуют закону Гаусса. Эти распределения обычно считают гауссовыми за неимением лучшего. В области малых отклонений от среднего закон распределения Гаусса по большей части неплохо оценивает вероятности различных встречающихся на практике отклонений, а в области больших отклонений описывает их плохо, и чем отклонения больше – тем хуже.

Метод наименьших квадратов

Метод наименьших квадратов позволяет находить по результатам эксперимента наилучшие значения параметров, входящих в формулы, вид которых считается известным. Пусть, например, исследуется растяжение тела. Обозначим значения приложенной к телу силы через yi (i –номер опыта), а значения удлинений – через xi. Считается известным, что сила, действующая на образец, и его удлинение связаны между собой законом Гука:

y = kx. (П.11)

Неизбежные погрешности опыта приводят к тому, что точки (xi, yi) не лежат на одной прямой. Метод наименьших квадратов позволяет найти наилучшее значение k аналитическим методом. В качестве такого значения в методе наименьших квадратов принимается значение, при котором величина

(П.12)

i – среднеквадратичная погрешность i -го измерения) имеет минимум. Иначе говоря, ищется значение k, при котором dφ/dk обращается в нуль. Имеем:

. (П.13)

Легко видеть, что мы пришли к линейному относительно k выражению, которое легко может быть решено. Приведем результат для случая, когда все σ i равны друг другу. Из (П.13) следует в этом случае:

.

Разделив обе части этого уравнения на п, получим:

,

где угловые скобки, как обычно, обозначают средние значения. Из этого уравнения находим:

. (П.14)

Формула (П.14) определяет k с некоторой погрешностью, величина которой может быть оценена по разбросу экспериментальных данных. Вычисления дают:

. (П.15)

В формулу (П.15) следует подставлять значение k, полученное из (П.14).

Аналогичным образом могут быть получены формулы для случая, когда стандартные погрешности σ i не равны друг другу, и формулы для определения параметров в формулах более сложных, чем (П.11). Формулы для определения параметров в формуле

y = a + bx. (П.16)

приведены выше.

Скажем несколько слов о случаях, когда зависимость y от x описывается более сложными формулами, например функцией произвольного вида:

у = f (x, а, b, с,...), (П.17)

где а, b, с,... – искомые параметры.

Если погрешности измерения величины yi описываются законом Гаусса, то решение задачи находится путем отыскания минимума величины

, (П.18)

для чего приравниваются нулю частные производные dφ/da, dφ/db, dφ/dc и т. д. Легко видеть, что при этом возникает столько уравнений сколько имеется подлежащих определению величин а, b, с,... Эти уравнения в общем случае нелинейны и могут быть решены только численно.

Если погрешности в измерении yi не описываются законом Гаусса, то задача становится еще более сложной и приводится к отысканию экстремума функций существенно более сложных, чем (П.18). Соответствующий метод носит название метода наибольшего правдоподобия. Мы этого случая рассматривать не будем.

В том случае, когда в формуле подбирается не один, а несколько параметров, решение приобретает новые важные черты. Погрешности параметров обычно оказываются связанными друг с другом: отклонения сразу по двум параметрам – при определенном соотношении между ними – могут оказаться более вероятными, чем отклонение только по одному параметру. При решении одномерной задачи указывают среднеквадратичную погрешность – погрешность, которая при гауссовом распределении превышается, как мы уже отмечали, приблизительно в одной трети случаев. В двумерной задаче нужно в плоскости искомых параметров проводить кривую, выделяющую соответствующую область. При гауссовых распределениях эта кривая является эллипсом. Как известно, величина и положение эллипса определяются не двумя, а тремя числами, например размерами его полуосей и углом их поворота. При измерениях, в которых следует определить два параметра, задание погрешностей требует поэтому, строго говоря, указания не двух, а трех чисел, которые образуют квадратную симметричную «матрицу ошибок».

Мы не будем более развивать эту тему и отошлем интересующихся к литературе.

§ 4. Критерии значимости. Метод χ2.

Вернемся к опыту по исследованию упругих свойств металлического стержня. Пусть результаты опытов изображаются точками на рис. 4. Первый же взгляд на график убеждает нас в том, что зависимость удлинения от нагрузки является линейной или почти линейной. В самом деле, прямая, проведенная на рис. 4 сплошной линией, не противоречит экспериментальным данным. Им не противоречит, однако, и изогнутая штриховая линия. Более того, эта линия даже несколько лучше удовлетворяет экспериментальным данным, чем прямая. Мы хотели бы, однако, думать, что истинная связь удлинения и нагрузки все-таки является прямолинейной. Задача сводится к отысканию критерия, позволяющего судить о том, является ли представление искомой зависимости в виде прямой линии достаточно хорошим или экспериментальные данные заставляют отдать предпочтение криволинейной зависимости, например зависимости, изображенной штриховой линией.

Сформулированная сейчас задача в применении к закону Гука представляется несколько искусственной. В этом случае лучше всего попросту повторить опыт, уменьшив экспериментальные ошибки, и вопрос решится сам собой. Встречаются, однако, случаи, когда такое повторение опыта оказывается затруднительным или даже невозможным. Так бывает, например, при опытах с редкими частицами в космических лучах или на ускорителях, когда повторение опыта требует нескольких лет работы или попросту невозможно. Возможно, более полная интерпретация имеющихся данных становится в этом случае особенно существенной.

Общий вопрос, который возникает в таких случаях, сводится обычно к следующему. На графике, изображающем некоторую зависимость, точки легли не вполне регулярно. Следует ли придавать значение наблюденным отступлениям от гладкой кривой? Совместима ли с экспериментальными данными гипотеза о том, что искомая зависимость на самом деле является гладкой (или даже прямолинейной), или эти данные указывают на негладкий, аномальный ход кривой?

Исследование проблемы достоверности гипотез производится обычно с помощью критериев значимости. Одним из наиболее удобных критериев значимости является так называемый «критерий χ2»•

В предыдущем параграфе мы рассматривали метод наименьших квадратов, с помощью которого можно, например, провести через экспериментальные точки наилучшую прямую. Исследуем теперь вопрос о том, насколько данные, использованные для проведения этой прямой, согласуются с представлением о том, что рассматриваемая прямолинейная зависимость действительно имеет место. Единственной мерой, которая может быть использована для расчета, является, естественно, точность, с которой экспериментальные точки удовлетворяют предполагаемому закону. В методе χ2 в качестве такой меры принимается сумма квадратов отклонений от предполагаемой зависимости:

. (П.19)

Отклонения экспериментальных точек от ожидаемых значений, как мы видим, выражаются в долях стандартной ошибки данного измерения. Найденное значение χ2 должно быть сопоставлено с теорией. Это делается с помощью таблицы 1. В таблице для разного числа степеней свободы (числом степеней свободы в этом случае называется число измерений без одного, если гипотеза не содержит определяемых из опыта коэффициентов; число измерений без двух, если из опыта находится один коэффициент, например наклон прямой, и т. д.) приведены значения χ2 для ряда чисел p. Для 10 степеней свободы находим из таблицы, что χ2 = 2,6 для p = 99, χ2 = 3,9 для p = 95, х2 = 7,3 для p = 70, χ2 = 23,2 для p = 1 и т. д. Это означает, что в том случае, если гипотеза справедлива, рассчитанное по (П.19) значение χ2 с вероятностью 99% (p = 99) окажется больше 2,6, с вероятностью 95% (p = 95) больше. 3,9, с вероятностью 70%.больше 7,3, с вероятностью 1% больше 23,2 и т. д.

Пусть мы найдем в результате расчета по формуле (П.19) χ2 = 3,5. Такое значение χ2 должно наблюдаться больше чем в 95% случаев; отклонение наших данных от ожидаемой прямолинейной зависимости является в этом случае совершенно несущественным. Если бы мы нашли в результате расчета χ2 = 18, сопоставление с таблицей показало бы нам, что такие отклонения следует ожидать только в 5% случаев. Существование прямолинейной зависимости и в этом случае нельзя считать исключенным, но должно быть поставлено под сомнение. Естественно в этом случае повторить опыт, чтобы получить более ясный результат. Если бы χ2 оказалось равным 30 (вероятность получить на опыте такое значение ≈0,1%), можно было бы утверждать, что проверяемая гипотеза почти наверное является ошибочной.

При сравнении отклонений с таблицей обычно применяют следующую терминологию: если найденная из опыта величина χ2 должна наблюдаться с вероятностью, заключенной между 1 и 5%, отклонения называются почти значимыми, если вероятность заключена между 0,1 и 1%,– значимыми и, наконец, если вероятность обнаружить найденное значение χ2 оказывается меньше 0,1%, отклонения являются высокозначимыми. При вероятности больше 5% следует считать, что экспериментальные данные недостаточны для того, чтобы отвергнуть гипотезу.

На этом мы заканчиваем краткое изложение общих методов обработки результатов наблюдений. Более подробные сведения могут быть найдены в специальных книгах.


Таблица 1.

Распределение χ2

p – вероятность (в%) найти на опыте значение χ2, большее, чем указано в таблице;

n – число степеней свободы системы.

p n                           0,1
  0,3 0,4 0,7 1,1 1,6 2,2 3,4 4,9 6,0 7,8 9,5 11,7 13,3 18,5
  0,6 0,8 1,1 1,6 2,3 3,0 4,4 6,1 7,3 9,2 11,1 13,4 15,1 20,5
  0,9 1,1 1,6 2,2 3,1 3,8 5,3 7,2 8,6 10,6 12,6 15,0 16,8 22,5
  1,2 1,6 2,2 2,8 3,8 4,7 6,3 8,4 9,8 12,0 14,1 16,6 18,5 24,3
  1,6 2,0 2,7 3,5 4,6 5,5 7,3 9,5 11,0 13,4 15,5 18,2 20,1 26,1
  2,1 2,5 3,3 4,2 5,4 6,4 8,3 10,7 12,2 14,7 16,9 19,7 21,7 27,9
  2,6 3,1 3,9 4,9 6,2 7,3 9,3 11,8 13,4 16,0 18,3 21,2 23,2 29,6
  3,1 3,6 4,6 5,6 7,0 8,1 10,3 12,9 14,6 17,3 19,7 22,6 24,7 31,3
  3,6 4,2 5,2 6,3 7,8 9,0 11,3 14,0 15,8 18,5 21,0 24,1 26,2 32,9
  4,1 4,8 5,9 7,0 8,6 9,9 12,3 15,1 17,0 19,8 22,4 25,5 27,7 34,5
  4,7 5,4 6,6 7,8 9,5 10,8 13,3 16,2 18,1 21,1 23,7 26,9 29,1 36,1
  5,2 6,0 7,3 8,5 10,3 11,7 14,3 17,3 19,3 22,3 25,0 28,3 30,6 37,7
  5,8 6,6 8,0 9,3 11,1 12,6 15,3 18,4 20,5 23,5 26,3 29,6 32,0 39,2
  6,4 7,3 8,7 10,1 12,0 13,5 16,3 19,5 21,6 24,8 27,6 31,0 33,4 40,8
  7,0 7,9 9,4 10,9 12,9 14,4 17,3 20,6 22,8 26,0 28,9 32,3 34,8 42,3
  7,6 8,6 10,1 11,6 13,7 15,4 18,3 21,7 23,9 27,2 30,1 33,7 36,2 43,8
  8,3 9,2 10,8 12,4 14,6 16,3 19,3 22,8 25,0 28,4 31,4 35,0 37,6 45,3
  8,9 9,9 11,6 13,2 15,4 17,2 20,3 23,9 26,2 29,6 32,7 36,3 38,9 46,8
  9,5 10,6 12,3 14,0 16,3 18,1 21,3 24,9 27,3 30,8 33,9 37,7 40,3 48,3
  10,2 11,3 13,1 14,8 17,2 19,0 22,3 26,0 28,4 32,0 35,2 39,0 41,6 49,7
  10,9 12,0 13,8 15,7 18,1 19,9 23,3 27,1 29,6 33,2 36,4 40,3 43,0 51,2
  11,5 12,7 14,6 16,5 18,9 20,9 24,3 28,2 30,7 34,4 37,7 41,6 44,3 52,6
  12,2 13,4 15,4 17,3 19,8 21,8 25,3 29,2 31,8 35,6 38,9 42,9 45,6 54,0
  12,9 14,1 16,1 18,1 20,7 22,7 26,3 30,3 32,9 36,7 40,1 44,1 47,0 55,5
  13,6 14,8 16,9 18,9 21,6 23,6 27,3 31,4 34,0 37,9 41,3 45,4 48,3 56,9
  14,3 15,6 17,7 19,8 22,5 24,6 28,3 32,5 35,1 39,1 42,6 46,7 49,6 58,3
  15,0 16,3 18,5 20,6 23,4 25,5 29,3 33,5 36,2 40,3 43,8 48,0 50,9 59,7



Поделиться:


Последнее изменение этой страницы: 2016-08-26; просмотров: 305; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.224.32.243 (0.009 с.)