Статистическая обработка одномерных количественных данных. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Статистическая обработка одномерных количественных данных.



 

Выборка из генеральной совокупности

Статистика - любая функция выборки случайной величины  или , где  - выборочные значения из некоторой генеральной совокупности значений.

Например, среднее арифметическое значение

                     

или среднеквадратическое отклонение (оценка стандартного отклонения или стандарт).

 

Статистики являются функциями случайных величин – выборочных значений и, поэтому их распределение может быть описано некоторым законом распределения. Например, в соответствии с центральными предельными теоремами ТВ, среднее значение случайной величины, распределенной по любому закону, будет близко к нормальному, если для вычисления среднего используется более 15-20 значений.

 

Аналоги числовых характеристик случайных величин – одномерные статистики:

  1. Характеристики уровня – в качестве оценки математического ожидания наиболее часто используется среднее значение (1)

                                                           (2)

В качестве робастной оценки (устойчивой к «ураганным» выбросам) – медиана – значение, которое делит выборку пополам

.                                 (3)

 

  1. Характеристики разброса случайной величины – наиболее часто используется выборочный стандарт (СКО).

В качестве робастной оценки разброса используется медианное отклонение

.                  (4)

 

Гистограмма – аналог плотности вероятностей. Гистограмма характеризует распределение числа объектов, попавших в интервалы. Для определения числа интервалов можно использовать различные правила (формула Стреджесса и пр.). Самое простое – число интервалов оценивать как корень квадратный из объема выборки. Объем выборки для построения гистограмм должен быть не менее 40-50 объектов.

 

Из гистограммы можно получить экспериментальный аналог плотности вероятностей и, наоборот, зная плотность вероятности (плотность) можно получить теоретическую гистограмму.

Зная число объектов ni, попавших в i -й интервал длиной Δx, а также объем выборки N, для этого интервала оцениваем вероятность попадания pi = ni/N, а затем значение экспериментальной плотности di = pi/ Δx.

Для определения теоретического значения числа объектов ΔNi, попавших в i -й интервал, необходимо найти вероятность попадания в этот интервал Δ Pi по принятой модели плотности распределения f(x):

, где - центр i-го интервала, а затем вычислить ΔNi = Δ PiN.

В Mathcad – для построения гистограмм можно использовать функции hist и histogram.  

 

Непараметрические статистики: медиана, медианное отклонение, вариационный ряд, ранги значений и их вычисление.

.                  (4)

 

Проверка гипотезы о законе распределения по критерию χ2

Гистограмма – распределение вероятностей попадания в интервалы значений случайной величины. Гистограмма м.б. теоретическая – ее вычисляют, опираясь на модель распределения и эмпирическая, полученная в результате обработки опытных данных.

Для построения эмпирической гистограммы необходимо определить число интервалов. Самое простое правило – число интервалов оценивать как корень квадратный из объема выборки. Объем выборки для построения гистограмм должен быть не менее 40-50 объектов.

Теоретическую гистограмму можно рассчитать, зная параметры распределения, например, нормальное распределение …

Критерий  позволяет количественно оценить сходство эмпирического распределения с теоретическим.

 

имеет - распределение с числом степеней свободы .



Поделиться:


Последнее изменение этой страницы: 2021-07-18; просмотров: 77; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.135.247.188 (0.005 с.)