Статистические оценки результатов наблюдений 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Статистические оценки результатов наблюдений



Множество значений случайной величины, полученных в результате эксперимента или наблюдений над объектом исследования, представляет собой статистическую совокупность. Статистическая совокупность, содержащая в себе все возможные значения случайной величины, называется генеральной статистической совокупностью. Совокупность, включающая некоторую часть элементов генеральной совокупности, называется выборочной статистической совокупностью. По результатам экспериментов практически всегда сталкиваются именно с выборочной статистической совокупностью. В дальнейшем будем называть ее выборкой, а число опытов (наблюдений) п, содержащееся в выборке, – объемом.

При повторении опытов в одинаковых условиях обычно обнаруживается закономерность в частоте появления тех или иных результатов. Некоторые значения случайной величины появляются значительно чаще других, при этом они группируются относительно некоторого значения – центра Му. Для описания этого явления используется вероятностный подход. Пусть р  – вероятность того, что случайная величина, являющаяся результатом эксперимента, примет значение у , i = 1, 2,..., n. Если значения р  известны для всех возможных значений у  из генеральной совокупности, то величину Му можно найти
по формуле

                                                  (2.1)

Величину Му называют математическим ожиданием или генеральным средним случайной величины. Однако только математическое ожидание не может отобразить все характерные черты статистической совокупности. Исследователю, кроме того, необходимо знать изменчивость (вариацию) наблюдаемой характеристики объекта.

Рассеивание случайной величины относительно математического ожидания характеризуется величиной, называемой дисперсией. Обычно она обозначается через . Для генеральной совокупности дисперсия определяется по формуле

                                                                            (2.2)

Дисперсию  часто называют генеральной дисперсией. Квадратный корень из дисперсии называется средним квадратическим отклонением случайной величины или стандартом . Как и дисперсия, среднее квадратическое отклонение является характеристикой рассеивания значений случайной величины относительно математического ожидания.

Формулы (2.1) и (2.2) справедливы для дискретных случайных величин. Для непрерывных случайных величин математическое ожидание и дисперсия выражаются через соответствующие интегралы.

Поскольку экспериментатор имеет дело не с генеральной совокупностью, а с выборкой, необходимы формулы, позволяющие приближенно оценить математическое ожидание Му и дисперсию
на основе опытных данных. Пусть по результатам однородной серии опытов получена выборка . Наилучшей оценкой для математи-ческого ожидания Му является среднее арифметическое («среднее»)

                                                                               (2.3)

Найденное значение  называют также выборочным средним в отличие от генерального среднего Му. Оценкой дисперсии  случайной величины является выборочная или эмпирическая дисперсия

                                                  (2.4)

Числитель данной формулы представляет собой сумму квадратов отклонений значений случайной величины от среднего значения ,
а знаменатель для выборочной дисперсии называется числом степеней свободы, связанным с этой дисперсией, и обозначается :

                                                                                             (2.5)

Формулу (2.4) можно преобразовать к виду, более удобному для вычислений:

                                                                        (2.6)

Величина

                                                                 (2.7)

является оценкой среднего квадратичного отклонения о выборки. Ее также называют выборочным стандартом.

Часто для оценки изменчивости (вариации) случайных величин используют коэффициент вариации v (%):

                                                                            (2.8)

Коэффициент вариации характеризует не абсолютное, а относитель-ное рассеивание случайной величины относительно среднего.

Важное значение в статистике имеют также следующие статисти-ческие показатели:

средняя квадратичная  ошибка  среднего  значения

                                                                                          (2.9)

показатель точности среднего значения, %:  

                                                                   (2.10)

ошибка среднего квадратичного  отклонения

                                        .

Статистическая совокупность может иногда содержать сотни и даже тысячи наблюдений. При этом анализ экспериментального материала,
в частности отыскание оценок математического ожидания и дисперсии
по формулам (2.3) и (2.6), является весьма трудоемкой задачей.

Для вычисления выборочного среднего  и выборочной дисперсии  в подобных случаях прибегают к группированию данных. При этом
весь диапазон значений случайной величины от  до  разбивается
на интервалы. Для ориентировочного определения числа интервалов k можно воспользоваться формулой

                                   k = 1 + 3,21 g (n),                                      (2.11)

где n – объем выборки. Значение k, найденное по этой формуле, округляется до ближайшего целого. Чаще всего используются интервалы равной длины. В этом случае длина (h) каждого интервала

.

Далее определяются границы интервалов. Так, первый интервал лежит в пределах , где ; второй интервал – в пределах  где  и т. д. Для каждого i- гоинтервала вычисляется его середина  по формуле

,

где i = 1, 2,… k.

Затем подсчитывается число наблюдений, попавших в каждый интервал. Обозначим его через m , i = 1, 2,…, k.

Предварительно договариваются, к какому интервалу приписывать значение случайной величины, попавшее на границу интервала.
Можно, например, условиться, что значение случайной величины, попавшее на границу у , всегда относится к i + 1-му интервалу. Сумма
всех величин m  равна объему выборки:

Тогда выборочное среднее  и выборочная дисперсия  определяются соответственно по формулам:

                                                        (2.12)

                                                              (2.13)

При использовании формул (2.12) и (2.13) для получения оценок математического ожидания и дисперсии можно и не определять числовых значений элементов выборки. Достаточно знать, в какой интервал попадет каждое значение случайной величины.

Данные записывают в виде статистического ряда (табл. 2.1).
В последнем столбце таблицы приведены значения относительной частоты, равной отношению числа наблюдений, попавших в данный интервал,к объему   выборки:  

.

 

Таблица 2.1. Статистический ряд

№ интервала Граница интервала Середина интервала Число наблюдений в интервале Относительная частота
1
1 2 3 4 5
2
. . . . .
. . . . .
i
. . . . .
. . . . .
k

 

График, построенный по данным статистического ряда, называют гистограммой. При построении гистограммы по оси абсцисс отклады-
вают значения границ интервалов и на каждом из них, как на осно-
вании, строят прямоугольник, площадь которого равна относительной частоте, соответствующей данному интервалу. Высота каждого прямо-угольника равна относительной частоте, деленной на длину интер-
вала.

Пусть, например, в результате измерения шероховатости поверхно-сти деталей получено n = 140 значений высот неровностей разруше-
ния на поверхности детали (мкм), приведенных в табл. 2.2.

 

 

Таблица 2.2 Высоты неровностей разрушения

Высота микронеровностей на поверхности детали, у (мкм)

760 940 1 110 766 615 502 708 618 560 552 960 1 210
760 1 010 850 790 535 517 629 618 428 560 1 260 825
460 454 847 795 500 720 605 535 485 860 613 825
460 685 844 892 740 730 725 510 652 864 1 070 860
430 910 942 1 120 758 619 775 734 675 560 412 952
651 950 1 236 835 785 623 780 741 602 565 1 160 1 264
668 910 545 830 802 510 880 717 610 495 452 660
602 554 852 900 1 034 702 1 117 740 523 456 552 950
605 558 860 910 1 146 800 1 180 710 503 680 684 960
545 428 902 1 210 801 767 816 752 730 692 570 960
521 660 910 626 845 862 844 890 710 630 560 960
750 675 910 560 842 1 074 1 060 452        

 

Из табл. 2.2 видно, что высота микронеровностей у изменяется
в диапазоне от 400 до 1 300 мкм. Разобьем этот диапазон на интервалы длиной по 100 мкм.Получится всего девять интервалов, границы которых приведены во втором столбце табл. 2.3 (формула 2.11) дает близкое
к принятому значение числа интервалов . Результаты подсчета значений   и относительных частот   приведены в четвертом
и пятом столбцах таблицы.

 

Таблица 2.3 Статистические интервалы

 

№ интервала Граница интервала Середина интервала Число наблюдений в интервале Относительная частота
1 400–500 450 13 0,093
2 500–600 550 22 0,157
3 600–700 650 25 0,179
4 700–800 750 26 0,186
5 800–900 850 23 0,164
6 900–1 000 950 15 0,107
7 1 000–1 100 1 050  5 0,036
8 1 100–1 200 1 150  6 0,04
9 1 200–1 300 1 250  5 0,036

 

Изображенная на рис. 2.1 гистограмма соответствует статистическому ряду, приведенному в табл. 2.3. Поскольку сумма всех относительных частот составляет единицу, то площадь гистограммы также равна единице. С увеличением числа опытов  значение каждой частоты становится все ближе к соответствующей вероятности . Это утверждение, выражающее требование статистической устойчивости частот, является важнейшей предпосылкой применения статистических методов.

Если одновременно с увеличением числа опытов n увеличивать
и количество интервалов, то ломаная, ограничивающая гистограмму сверху, приближается к некоторой кривой, называемой кривой рас-пределения или кривой плотности вероятности. Она является графиком соотношения между значениями данной случайной величины и их вероятностями. В теории вероятностей это соотношение называется статистическим распределением.

Для случайных величин, имеющих разную природу, статистические распределения могут быть различными. Известны, например, распре-деления Пуассона, Пирсона, биноминальное и многие другие. Среди них существует распределение, называемое нормальным (или гауссовским), которое применяется наиболее часто и играет важную роль в теории вероятностей и математической статистике.


Основанием для этого служит центральная предельная теорема теории вероятностей, согласно которой сумма достаточно большого числа произвольно распределенных случайных величин распределена приблизительно по нормальному закону и тем точнее, чем больше слагаемых в ней содержится. При этом предполагается, что среди рассматриваемых случайных величин нет такой, влияние которой на сумму существенно превалирует над другими. Таким условиям, как правило, удовлетворяет измеряемая величина в однородной серии опытов, подверженная влиянию большого числа случайных факторов. Поэтому распределение случайной величины обычно считается нормальным. Кривая плотности нормального распределения изображена на рис. 2.2.

 

Рис. 2.1. Гистограмма распределения     Рис. 2.2. Кривая плотности

                                                         нормальногораспределения

                                                                                           

Далее будем исходить из предположения, что результаты наблюдений свободны от систематических ошибок, а случайные ошибки (а значит,
и результаты наблюдений) подчинены нормальному закону распределения.



Поделиться:


Последнее изменение этой страницы: 2021-03-09; просмотров: 155; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.145.111.125 (0.019 с.)