Пошаговый дискриминантный анализ 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Пошаговый дискриминантный анализ



Применением дискриминантного анализа является включение в исследование многих переменных с целью определения тех из них, которые наилучшим образом разделяют совокупности между собой. Например, исследователь в области образования, интересующийся предсказанием выбора, который сделают выпускники средней школы относительно своего дальнейшего образования, произведет с целью получения наиболее точных прогнозов регистрацию возможно большего количества параметров обучающихся, например, мотивацию, академическую успеваемость и т.д.

Модель. Другими словами, вы хотите построить "модель", позволяющую лучше всего предсказать, к какой совокупности будет принадлежать тот или иной образец. В следующем рассуждении термин "в модели" будет использоваться для того, чтобы обозначать переменные, используемые в предсказании принадлежности к совокупности; о неиспользуемых для этого переменных будем говорить, что они "вне модели".

Пошаговый анализ с включением. В пошаговом анализе дискриминантных функций модель дискриминации строится по шагам. Точнее, на каждом шаге просматриваются все переменные и находится та из них, которая вносит наибольший вклад в различие между совокупностями. Эта переменная должна быть включена в модель на данном шаге, и происходит переход к следующему шагу.

Пошаговый анализ с исключением. Можно также двигаться в обратном направлении, в этом случае все переменные будут сначала включены в модель, а затем на каждом шаге будут устраняться переменные, вносящие малый вклад в предсказания. Тогда в качестве результата успешного анализа можно сохранить только "важные" переменные в модели, то есть те переменные, чей вклад в дискриминацию больше остальных.

F для включения, F для исключения. Эта пошаговая процедура "руководствуется" соответствующим значением F для включения и соответствующим значением F для исключения. Значение F статистики для переменной указывает на ее статистическую значимость при дискриминации между совокупностями, то есть, она является мерой вклада переменной в предсказание членства в совокупности. Если вы знакомы с пошаговой процедурой множественной регрессии, то вы можете интерпретировать значение F для включения/исключения в том же самом смысле, что и в пошаговой регрессии.

Расчет на случай. Пошаговый дискриминантный анализ основан на использовании статистического уровня значимости. Поэтому по своей природе пошаговые процедуры рассчитывают на случай, так как они "тщательно перебирают" переменные, которые должны быть включены в модель для получения максимальной дискриминации. При использовании пошагового метода исследователь должен осознавать, что используемый при этом уровень значимости не отражает истинного значения альфа, то есть, вероятности ошибочного отклонения гипотезы H0 (нулевой гипотезы, заключающейся в том, что между совокупностями нет различия).

Задача интерпретации связана с определением числа и значимости канонических дискриминантных функций и с выяснением их значений для объяснения различий между классами.

Каноническая дискриминантная функция является линейной комбинацией дискриминантных переменных. Ее уравнение, называемое дискриминантным, имеет следующий вид:

Fkm = U0+U1X1km+U2X2km+ … +UpXikm

где Fkm – значение канонической дискриминантной функции для m-го объекта в группе K; Xikm – значение дискриминантной переменной Xi для m-го объекта в группе K; Ui – коэффициенты, обеспечивающие выполнение требуемых условий.

Коэффициенты для Fkm подбираются таким образом, чтобы ее средние значения для различных классов как можно больше отличались друг от друга.

STATGRAF рассчитывает стандартизированные и нестандартизованные коэффициенты канонической дискриминантной функции. Разница между ними заключается в следующем: нестандартизованные коэффициенты – в отличие от стандартизованных – рассчитываются на основании матрицы, содержащей исходные значения наблюдений, которые не приведены к стандартной форме.

Нестандартизованные коэффициенты канонической дискриминантной функции необходимы для определения положения наблюдений (объектов) в дискриминантом пространстве (табл. 4.1).

Значение дискриминантной функции измеряется в единицах стандартного отклонения, то есть значение F для данного учителя представляет число стандартных отклонений точки от главного центроида или, другими словами, положение точки на оси, где нулевая точка - главный центроид.

Центроид - это воображаемая точка, координаты которой есть среднее значение переменных в данной группе. Главный центроид – это точка пространства, в которой все дискриминантные переменные принимают средние (по всем наблюдениям) значения. Другими словами, это центральное положение всех точек, представляющих наблюдения. При графическом изображении дискриминантных функций в главном центроиде помещается начало координат, так как в этом случае рассматриваемые группы и объекты соотносятся с центром системы.

Число канонических дискриминантных функций не может быть больше числа групп минус 1. Значит при наличии двух групп возможна только одна функция. В таком случае точки, соответствующие объектам, располагаются вдоль некоторой прямой.

По значению канонической дискриминатной функции, вычисленной для конкретного человека, можно сделать заключение о том, насколько типично положение данного человека среди участников группы. Возможность эта появляется потому, что дискриминантные значения выражены в единицах стандартного отклонения, то есть имеют единый масштаб.

Стандартизованные коэффициенты показывают вклад переменной в значение функции. Их полезно применять для выявления тех переменных, которые значат больше других для характеристики изучаемой области реальности. Абсолютная величина коэффициента анализируется в стандартной форме: чем она больше, тем больше вклад этой переменной.

 



Поделиться:


Последнее изменение этой страницы: 2017-02-05; просмотров: 494; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 52.14.150.55 (0.007 с.)