Подбор функции распределения 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Подбор функции распределения



При анализе исходных данных достаточно часто встает вопрос: описываются ли полученные данные нормальным законом распределения. В тех случаях, если данные распределяются по какому-либо иному закону, нельзя проводить сравнение по достаточно популярным критериям Стьюдента или подсчет корреляции по методу Пирсона. В пакете STATISTICA можно не только определить, соответствуют ли ваши данные нормальному закону распределения, но и в противном случае описать их каким-либо другим законом.

Проверить соответствие полученных данных нормальному закону распределения можно двумя способами. Первый из них — с помощью построения графиков на нормальной вероятностной бумаге, второй — с помощью критериев согласия. Первый способ оценки соответствия распределения нормальному закону называется "глазомерный", т. к. позволяет провести лишь наглядное сравнение. Не углубляясь подробно в теорию построения графиков на нормальной вероятностной бумаге, следует отметить, что на плоскости в двухмерной системе координат проводится прямая линия, построенная путем математического расчета, рядом с которой откладываются значения полученных экспериментальных вариантов. Если все полученные экспериментальные данные располагаются на указанной прямой, либо в непосредственной близи от нее, то распределение описывается нормальным законом. В тех случаях, когда расположение экспериментальных данных не совпадает с линией кривой, расположение отличается от нормального (рис. 9).

В отличие от "глазомерного" способа, расчет критериев согласия более точно позволяет сопоставить полученные данные с каким-либо законом распределения. В тех случаях, когда ваши данные являются целыми числами (дискретными величинами), их сопоставление нужно проводить по критериям х2. Если же данные являются дробными числами (непрерывными величинами), их нужно сопоставлять каким-либо законам распределения по критериям Колмогорова—Смирнова.

Рассчитать критерии Колмогорова—Смирнова для нормального распределения можно в модуле Basic Statistics and Tables. Для этого в аналогичном диалоговом окне, либо из меню Analysis стартовой панели выбрать команду Descriptive Statistics. Открывается уже знакомое вам окно Descriptive Statistics, где в разделе Distribution нужно установить флажок в строке K-S and Lilliefors test for normality. После этого необходимо нажать либо кнопку Frequency tables, либо Histograms. Выполнение указанной последовательности действий приведет к появлению таблицы частот (или гистограммы), где в верхней части указано значение коэффициента Колмогорова—Смирнова. В частности, приведенная надпись "K-S d = 0,17349, р < 0,05" означает, что коэффициент d Колмогорова—Смирнова равен 0,17349, а ваши данные описываются нормальным законом (р < 0,05).


Рис. 9. Проверка соответствия нормальному закону распределения

Однако примечательно еще и то, что в пакете STATISTICA можно сопоставить данные не только с нормальным, но и с некоторыми другими законами распределения. Чтобы выполнить указанное сопоставление, сначала необходимо вызвать переключатель модулей (если вы проводили какой-то анализ, нужно из меню Analysis выбрать команду Other Statistics). В появившемся переключателе модулей можно выделить с помощью курсора мыши название статистического модуля Nonparametrics/Distrib (Непараметрическое распределение) и нажать кнопку Switch To. После этого в диалоговом окне Nonparametric Statistics нужно установить флажок в строке Distribution fitting, a затем выделить с помощью указателя мыши название нужного вам распределения и нажать кнопку ОК. Следует отметить, что, если ваши данные являются дискретными величинами, выбор распределений нужно проводить в разделе Discrete Distributions, но если же они являются непрерывными величинами — то в разделе Continuous Distributions. После того как вы выбрали закон распределения, с которым сопоставляете свои данные, открывается новое окно Fitting Discrete Distributions (или Fitting Continuous Distributions). В этом окне нужно указать название столбца переменных (кнопка Variable), установить в одной из трех строк раздела Kolmogorov-Smirnov test флажок, а также можно изменить вид функции распределения, с которой проводится сопоставление (в строке Distribution). В строке Number of categories нужно указать число интервалов, на которое будет разделен диапазон ваших значений, а в строках Lower limit и Upper Omit — соответственно минимальные и максимальные значения диапазона. После проведения соответствующих настроек нажать кнопку ОК. Появляется таблица, в верхней части которой в виде надписей "Kolmogorov-Smirnov d = 0,4218675, р < 0,01" и "Chi-Square: 104,4773, df = 7, р = 0,0000000" указаны значения коэффициентов Колмогорова—Смирнова и X2, а также их достоверность.
Несмотря на то, что критерии Колмогорова—Смирнова и Х2 достаточно четко позволяют ответить на вопрос о том, каким законом описываются полученные данные, их недостатком является то, что при малых значениях выборки достоверность оценки снижается. Поэтому рекомендуется при малом числе наблюдений для оценки достоверности использовать оба способа: "глазомерный" и оценку по критериям согласия.



Поделиться:


Последнее изменение этой страницы: 2016-08-12; просмотров: 198; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.222.120.133 (0.006 с.)