ТОП 10:

Значимость и внутренняя согласованность факторов



Значимость фактора оценивается его вкладом в общую дисперсию или ковариацию после вращения. Вклады фактора в общую дисперсию до и после вращения отличаются друг от друга, поскольку в процессе вращения происходит перераспределение дисперсий среди факторов. Простота установления вкладов факторов в общую дисперсию зависит от того, какое вращение было использовано — ортогональное или косоугольное.

После ортогонального вращения значимость фактора определяется по величине его сумм квадратов факторных нагрузок из матрицы факторного отображения А после вращения. Сумма квадратов факторных нагрузок, деленная на количество переменных, как раз и равна вкладу фактора в общую дисперсию. Если же сумму квадратов факторных нагрузок какого-то фактора разделить на сумму квадратов факторных нагрузок по всем факторам (что равно сумме общностей), то получается вклад фактора в общую ковариацию (эти расчеты приведены в табл. 4 в качестве примера).

Вклад фактора в общую дисперсию есть величина дисперсии исходных переменных, сжато (более экономно) выраженная фактором. (Вклад в общую дисперсию каждой переменной равен 1.) Доля дисперсии, объясняемой фактором, вычисляется как отношение дисперсии фактора к дисперсии переменных. Доля ковариации, объясняемой фактором, указывает на относительную значимость фактора по отношению к общей ковариации, определяющейся всеми факторами. Доля ковариации — это отношение дисперсии фактора к дисперсии всего решения. Дисперсия решения составляет только часть дисперсии исходных переменных.

При косоугольном вращении вклады факторов в общую дисперсию и ковариацию могут быть получены описанными выше методами из матрицы факторного отображения А до вращения, однако они являются очень грубым приближением вкладов факторов в общие дисперсию и ковариацию после вращения. Из-за того, что факторы коррелируют, разброс, соответствующий наложениям, делится между факторами и трудно однозначно отнести ту или иную дисперсию к тому или иному фактору. После косоугольного вращения величина суммы квадратов факторных нагрузок по фактору также является лишь грубым приближением его значимости (факторы с большими суммами более значимы), однако в этом случае нельзя определить доли объясняемых каждым фактором дисперсий и ковариации.

Внутренняя согласованность решения — степень однозначности, с которой факторные оси заданы в пространстве переменных, — определяется квадратичными множественными корреляциями (КМК) значений факторов, предсказанных на основе значений наблюдаемых переменных. Высокие КМК (скажем, 0.70 и выше) означают, что наблюдаемые переменные действительно детерминируют реальную дисперсию факторных значений. В случае низких КМК факторы слабо определяются наблюдаемыми переменными. Отрицательные КМК получаются, когда в модели оставлено слишком много факторов.

Программа BMDP распечатывает КМК как главную диагональ матрицы ковариации факторных значений. SPSS распечатывает их как главную диагональ ковариационной матрицы для регрессионной оценки факторных значений. В SAS КМК распечатываются вместе с коэффициентами значений факторов при помощи опции SCORE.

Интерпретация факторов

Чтобы интерпретировать фактор, исследователь пытается найти глубинное измерение, объединяющее группу переменных, имеющих по нему высокие нагрузки. Как при ортогональном, так и при косоугольном вращении нагрузки содержатся в матрице нагрузок А, однако значения нагрузок для каждого из вращений различны. После ортогонального вращения величины в нагрузочной матрице представляют корреляции между переменными и факторами. Исследователь выбирает какой-то критерий определения значимости корреляций, собирает вместе переменные с нагрузками, превышающими установленный критерий, и пытается определить некий базисный признак (характеристику, концепт), их объединяющий.

После косоугольного вращения процесс аналогичен, однако интерпретация значений в матрице факторного отображения более сложна. Нагрузка представляет собой уже не корреляцию, а меру специфичной (индивидуальной) взаимосвязи между переменной и фактором (именно этой переменной именно с этим фактором без учета наложений). Поскольку факторы считаются коррелирующими, корреляции между переменными и факторами, приведенные в структурной матрице S, подвержены влиянию наложений факторов. Переменная может коррелировать с одним фактором через корреляцию с другим фактором, а не непосредственно. В значениях, стоящих в матрице факторного отображения, та часть дисперсии, которая получается из-за наложения факторов, отсутствует, однако это искажает принятую модель.

Фактически интерпретация матрицы факторного отображения, а не структурной, проводится по чисто практической причине: матрица факторного отображения проще и разница между высокими и низкими нагрузками в ней более очевидна.

Чем больше нагрузка, тем с большей уверенностью можно считать, что переменная определяет фактор. Комри и Ли (Comrey, Lee, 1992) предполагают, что нагрузки, превышающие 0.71 (объясняет 50% дисперсии), — превосходные, 0.63 (40% дисперсии) — очень хорошие, 0.55 (30%) — хорошие, 0.45 (20%) — удовлетворительные и 0.32 (объясняет 10% дисперсии) — слабые. Однако нагрузки, получающиеся в результате факторно-аналитической обработки, существенным образом зависят от того, каким способом была получена исходная матрица данных. Если обрабатывается матрица, заполненная одним испытуемым, проводящим многомерное шкалирование каких-либо объектов по каким-либо шкалам, то факторные нагрузки по значимым для того или иного фактора шкалам получаются существенно более высокими, чем в случае обработки матрицы, составленной как совокупность ответов различных испытуемых на единый список вопросов, когда каждый испытуемый (респондент) представляется одной строкой в общей матрице данных. Так, по первому (наиболее значимому) фактору, имеющему шкалы с самыми высокими нагрузками, граница отсечения величины нагрузок для интерпретации (т.е. значение, начиная с которого переменные, имеющие большую факторную нагрузку, включаются в группу для интерпретации), как правило, не ниже 0.75, а по второму считается приемлемым значение 0.5.

Вообще право выбора этой границы предоставляется исследователю и сам выбор напрямую связан с имеющимся у него опытом. Иногда в нагрузках факторов наблюдается некоторый пробел и его можно использовать в качестве границы отсечения.

Следует обратить внимание на то, что однородность выборки (например, все испытуемые имеют по переменным примерно одинаковые показатели, тогда как в целом по популяции диапазон показателей по тем же переменным гораздо шире) существенно влияет на величины факторных нагрузок. Поэтому если у вас есть какие-то соображения об однородности имеющейся выборки, то стоит понизить границу отсечения (и интерпретировать более низкие нагрузки). Таким образом, если выборка дает сходные значения по наблюдаемым переменным, для интерпретации факторов используется нижняя граница отсечения.

Процедура наименования фактора (присвоения ему названия или какого-то ярлыка) — процесс, требующий одновременно и творчества я научной обоснованности. Так, Руммель (Rummel, 1970) приводит многочисленные полезные советы по интерпретации и наименованию факторов. Лучшей интерпретации факторов способствует распечатка матрицы отсортированных (упорядоченных по степени убывания по каждому фактору) факторных нагрузок, где переменные сгруппированы по признаку их корреляции с определенными факторами. Процедура сортировки нагрузок предусмотрена во всех упомянутых программах. (По умолчанию в BMDP4M, REODER в SAS; SORT в SPSS и SYSTAT; сортировка в STADIA).

При интерпретации следует также учитывать вычисляемость, практическую значимость и сложность факторов. Удалось ли получить значимо близкое факторное решение через какой-то промежуток времени и/или на другой выборке? Имеет ли оно научную значимость и новизну с точки зрения понимания проблемы исследования? Каково место факторов в иерархии «объяснений» природы явлений? Достаточно ли они сложны (не примитивны), чтобы вызвать интерес ученых, и не слишком ли они сложны (трудно понимаемы и объяснимы) для интерпретации?

Факторные значения

Факторные значения, являющиеся оценками показателей испытуемого по каждому из факторов (как если бы они замерялись непосредственно), можно отнести к наиболее полезным с практической точки зрения результатам методов главных компонент и факторного анализа.

Поскольку обычно факторов меньше, чем наблюдаемых переменных, и значения факторов почти не коррелируют (если факторы ортогональны), последние могут быть очень полезны в других аналитических процедурах. Например, коллинеарные корреляционные матрицы (т.е. вырожденные, чей ранг меньше количества строк или столбцов) при помощи метода главных компонент могут быть сведены к ортогональным компонентам. Или же можно применить факторный анализ и сократить количество зависимых переменных, а потом в качестве зависимых переменных для MANOVA использовать существенно меньшее количество факторов. Другой вариант — сократить большое количество независимых переменных до нескольких факторов и использовать их с целью прогнозирования зависимых переменных во множественной регрессии или принадлежности к группе в дискриминантном анализе. Небольшой набор устойчивых и хорошо интерпретируемых факторов расширяет возможности последующих аналитических процедур.

Процедуры оценки факторных значений расположены в диапазоне от «простейших» (но чаще всего адекватных) до «утонченных». Комри и Ли (Comrey, Lee, 1992) описывают несколько довольно простых процедур оценки значений факторов. Наиболее простая из них — суммирование для каждого фактора значений по переменным, имеющим высокие нагрузки по этому фактору. Если показатели по переменным сначала стандартизируются или переменные имеют приблизительно равные стандартные отклонения для начальных данных, то решение этой проблемы становится менее сложным. Для многих исследовательских целей вполне допустима такая быстрая и приблизительная оценка факторных значений. Однако переменные с большими стандартными отклонениями более значимо влияют на значения факторов, полученных при помощи этой процедуры.

Существует несколько статистических подходов к оценке факторных значений. Метод, описанный выше (в частности уравнения 16 и 17), представляет собой регрессионный подход к оценке факторных значений. Распределение значений по каждому фактору имеет нулевое среднее и единичное стандартное отклонение (после метода главных компонент) или же равное КМК между факторами и переменными (после факторного анализа). Однако этот регрессионный метод, равно как и другие, усиливает значение случайных взаимосвязей между переменными таким образом, что оценки факторных значений оказываются смещенными. Даже если факторы ортогональны, между их значениями часто наблюдается взаимосвязь. Регрессионный метод оценки факторных значений включен во все пакеты программ. Все они распечатывают компонентные/факторные значения и создают специальные файлы для дальнейшего анализа.

В SPSS реализовано еще два дополнительных метода для оценки факторных значений. Факторные значения, полученные методом Бартлетта, не смещены (т.е. систематически не бывают слишком близки или слишком далеки от «истинных» факторных значений). Они имеют те же средние и стандартные отклонения, как и при регрессионном методе, однако могут все же коррелировать между собой.

Подход Андерсона—Рубина (см.: Gorsuch, 1983) связан с вычислением факторных значений, не коррелирующих между собой даже при наличии корреляции самих факторов. Факторные значения имеют нулевое среднее и единичное стандартное отклонение. В случаях, когда нет специальных ограничений, лучше применять регрессионный подход, потому что он более доступен и удобен для понимания.

Следует отметить, что факторные значения, вычисляемые всеми описанными выше методами, нормально распределены с нулевым средним. Однако бывает необходимо рассмотреть выборку ответов респондентов или оценок объектов по первичным переменным как часть общей выборки, относительно которой строится гипотетическое предположение о нулевом среднем, и оценить именно смещение факторных значений по сравнению с нулем. В этом случае в уравнении (17), где значения факторов равны произведению стандартизированных значений по переменным и матрицы коэффициентов значений факторов, следует заменить матрицу Z, на матрицу нестандартизированных первичных данных D.

Другой вариант получения ненормализованных и нестандартизированных факторных значений — это умножение матрицы первичных данных D на матрицу факторных нагрузок А (Митина, 1994).







Последнее изменение этой страницы: 2016-04-08; Нарушение авторского права страницы

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 54.160.19.155 (0.007 с.)