ТОП 10:

Общности, дисперсия и ковариация



Выполнив поворот и получив матрицу факторных нагрузок после поворота, можно проанализировать серию других показателей (см. табл. 4). Общность переменной — это дисперсия, рассчитанная с помощью факторных нагрузок. Это квадратичная множественная корреляция переменной, предсказанная факторной моделью. Общность вычисляется как сумма квадратов факторных нагрузок (СКН) для переменной по всем факторам. В табл. 4 общность для стоимости путевки равна (-0,086)2+(0,981)2=0,970, т.е. 97% дисперсии стоимости путевки объясняется факторами 1 и 2.

Доля дисперсии фактора по всем переменным — это СКН по фактору, деленная на количество переменных (в случае ортогонального вращения)[7]. Для первого фактора доля дисперсии равна:

 

[(-0,086)2+ (-0,071)2+ (0,994)2 + (0,997)2] /4 = 1,994/4 = 0,50,

 

т.е. первый фактор объясняет 50% дисперсии переменных. Второй фактор объясняет 48% дисперсии переменных и (в силу ортогональности вращения) два фактора в сумме объясняют 98% дисперсии переменных.

Доля дисперсии решения, объясняемая фактором, — доля ковариации — это СКН для фактора, деленная на гумму общностей (сумму СКН по переменным). Первый фактор объясняет 51% дисперсии решения (1,994/3,915); второй — 49% (1,919/3,915); два фактора вместе объясняют всю ковариацию.

Таблица 4

Связь между факторными нагрузками, общностями, СКН, дисперсией и ковариацией ортогональных факторов после поворота

  Фактор 1 Фактор 2 Общности (h2)
Стоимость путевки -0,086 0,981 ∑а2=0,970
Уровень комфорта -0,071 -0,977 ∑а2=0,960
Температура воздуха 0,994 0,026 ∑а2=0,989
Температура йоды 0,997 -0,040 ∑а2=0,996
СНК ∑а2= 1,994 ∑а2=1,919 3,915
Доля      
дисперсии 0,50 0,48 0,98
Доля ковариации 0,51 0,49 1,00

 

Воспроизведенную корреляционную матрицу можно вычислить при помощи уравнения:

Заметим, что воспроизведенная матрица взаимосвязей все-таки отличается от исходной. Разница между исходной и воспроизведенной матрицами называется остаточной матрицей взаимосвязей:

 

R ост = R-R (15)

 

т.е. остаточная матрица взаимосвязей — это разность между исходной (наблюдаемой, измеренной) и воспроизведенной матрицами взаимосвязей.

При хорошем факторном решении числа в остаточной матрице взаимосвязей должны быть очень малы в силу незначительности различии между исходной и воспроизведенной матрицами взаимосвязей.

Факторные значения

После вычисления матрицы факторных нагрузок можно вычислить значения факторов для каждого наблюдения (испытуемого). Приведем наиболее распространенный способ вычисления факторных значений. Сначала вычисляются коэффициенты регрессии, позволяющие на основе значений переменных для каждого респондента оценить для него значения факторов. Пусть R-1 — матрица, обратная матрице взаимосвязей, а А — матрица факторных нагрузок, тогда матрица коэффициентов факторных значений В вычисляется по формуле:

B= R-1 A, (16)

т.е. коэффициенты для определения факторных значений являются результатом умножения матрицы, обратной матрице взаимосвязей, на матрицу факторных нагрузок.

В нашем примере[8]:

Для определения факторных значений респондентов по первому фактору все их значения по переменным стандартизируются, а затем суммируются с учетом весов (веса равны соответствующим числам из матрицы В). Например, суммируются весовые коэффициенты для стоимости путевки (0,082), для комфортабельности комплекса (0,054), для температуры воздуха (0,190) и для температуры воды (0,822). В матричной форме это выглядит так:

 

F=ZB, (17)

 

т.е. значения факторов равны произведению стандартизированных значений по переменным и матрицы коэффициентов значений факторов.

В нашем примере:

Первый респондент по первому фактору получил стандартизированное значение 1.12, а по второму он получил —1.16. Таким образом, этот респондент имеет очень высокие положительные значения по униполярному «климатическому» фактору, а очень высокое отрицательное значение по «экономическому» фактору свидетельствует о том, что для него комфортность отдыха существенно важнее, чем его низкая стоимость. Второй респондент имеет высокое значение по «климатическому» фактору (но все-таки меньшее, чем у первого респондента) и высокое положительное значение по «экономическому» фактору. Следовательно, у него соображения экономии существенно превалируют над соображениями комфорта. Третьего респондента климатические условия не волнуют, но, выбирая место отдыха, он будет в первую очередь ориентироваться на его дешевизну. И т.д. Среднее стандартизированных течений всех испытуемых по каждому фактору равно нулю.

Также можно воспроизвести значения по переменным, исходя из значений факторов. Для этого используется следующее уравнение:

 

Z=FA’, (18)

 

т.е. матрица воспроизведенных стандартизированных значений по переменным вычисляется как произведение матрицы значений факторов и транспонированной матрицы факторных нагрузок.

Первый респондент (первая строка в матрице Z) теоретически (прогнозируемо) должен иметь стандартизированное значение -1.23 по стоимости путевки, 1.05 по комфортабельности комплекса, 1.08 по температуре воздуха и 1.16 по температуре воды. Если в ходе факторного анализа действительно удалось уловить существующие взаимосвязи между переменными и их структуру, то расчетные величины в этой и вычисляемой матрицах взаимосвязей близки к наблюдаемым (полученным экспериментально) величинам.

В качестве упражнения рекомендуем выписать все эти формулы для получения расчетных значений по переменным. Например, для первого респондента:

 

-1,23 =-,086 (1,12)+ ,981 (-1,16)

1,05 = -,072 (1,12)- ,978 (-1,16)

1,08 = ,994 (1,12)+,027 (-1,16)

1,16 = ,997 (1,12)- ,040 (-1,16),

 

Или в алгебраической форме:

 

Z стоимости путевки=а11F1 + а12F2

Z комфортабельности комплекса=а21F1+а22F2

Z температуры воздуха=а31F1 + а32F2

Z температуры воды = а41F1 + а42F2

 

Таким образом, в ходе исследования принимается гипотеза о том, что общая латентная структура факторов характеризует всех испытуемых, однако каждый из них имеет различные показатели (факторные значения) по каждому из факторов. Каждый конкретный показатель испытуемого по наблюдаемой переменной вычисляется как линейная комбинация показателей (факторных значений) испытуемого по базисным факторам.

Косоугольное вращение

При использовании косоугольного (коррелированного) вращения большинство показателей ортогонального вращения сохраняется, но к ним добавляются еще и новые (список дополнительных матриц, используемых только для косоугольного вращения, см. в табл. 1).

При косоугольном вращении для выделения факторной структуры вместо матрицы факторных нагрузок используется матрица факторного отображения. Квадраты значений в матрице факторного отображения представляют собой характерный вклад каждого фактора в дисперсию каждой переменной, исключая часть дисперсии, возникающей как следствие корреляции факторов между собой. Для нашего примера матрица факторного отображения после косоугольного вращения имеет вид:

Характерный вклад первого фактора в переменную стоимость путевки равен (—.079)2, в переменную комфортабельность комплекса (-.078)а, в переменную температура воздуха (.994)2 и в переменную температура воды (.997)2.

Коэффициенты факторных значений вычисляются аналогично:

Применяя уравнение (17), получаем значения факторов:

Определив значения факторов, можно посчитать корреляции между факторами. Для этого применяется уравнение:

 

Ф=(1/N-1)F’F, (19)

 

т.е. один из способов вычисления корреляций между факторами состоит в делении произведения матрицы стандартизированных значений факторов и транспонированной ей на количество наблюдений минус один.

Факторная корреляционная матрица является стандартной частью компьютерной распечатки после выполнения косоугольного вращения. Например:

Взаимосвязь между первым и вторым факторами очень мала (-.01), т.е. в рассматриваемом примере факторы практически никак не связаны.

При косоугольном вращении матрица взаимосвязей между переменными и факторами называется структурной матрицей. Она включает как характерную взаимосвязь между переменной и фактором (из матрицы факторного отображения), так и взаимосвязь между переменной и дисперсией, полученной за счет наложения факторов друг на друга. Структурную матрицу можно получить из уравнения:

 

S=AФ, (20)

 

т.е. структурная матрица — это произведение матрицы факторного отображения и матрицы корреляции факторов.

Переменные стоимость путевки, комфортабельность комплекса, температура воздуха, температура воды имеют коэффициенты корреляции с первым фактором: -.069, -.088, .994 и .997; со вторым: .982, -.977, .023 и -.043.

Дискутируется вопрос, следует ли интерпретировать матрицу факторного отображения или структурную матрицу после косоугольного вращения. Преимущество структурной матрицы заключается в том, что ее легче понять. Однако взаимосвязи переменных и факторов сильно зависят от любых наложений факторов друг на друга. По мере увеличения взаимосвязей между факторами становится все сложнее определить, какая же из переменных относится к тому или иному фактору. С другой стороны, матрица факторного отображения содержит величины, представляющие характерные вклады каждого фактора в дисперсии переменных. Смешанная дисперсия не учитывается, но здесь проще выделить переменные, описывающие фактор. Однако если факторы высоко коррелирует друг с другом, то может оказаться, что к ним нельзя отнести ни одну из переменных, поскольку после того, как будут исключены наложения факторов, практически не останется ни одной характерной дисперсии.

Как правило, исследователи интерпретируют и включают в свои отчеты матрицу факторного отображения, а не структурную. Однако заинтересованный читатель, зная матрицу корреляций факторов Ф, а также одну из двух матриц — факторного отображения или структурную, всегда может вычислить другую используя уравнение (20).

После косоугольного вращения матрица R получается следующим образом:

 

R=SA’ (21)

 

т.е. воспроизведенная матрица взаимосвязей — это произведение структурной матрицы и транспонированной матрицы факторного отображения. Воспроизведенная матрица взаимосвязей позволяет вычислить остаточную матрицу взаимосвязей с помощью уравнения (15) и оценить адекватность результатов факторного анализа.

2.1.6. Компьютерный анализ простейшего примера

Результаты факторно-аналитической обработки данных рассматриваемого нами простейшего примера в программах STADIA и SPSS см. в табл. 5 и 6.

Таблица 5

Результаты факторно-аналитической обработки данных учебного примера в программе STADIA

ФАКТОРНЫЙ АНАЛИЗ.

Переменная Среднее Ст.отклон.
xl 14.7
х2 49.8 12.5
хЗ 49.8 13.2
х4 14.9

 

Корреляционная матрица

xl х2 хЗ х4
х2 -0.952    
хЗ -0.055 -0.091  
х4 -0.129 -0.036 0.99

Число значимых коэффициентов=2 (66%)

 

Собственные значения и процент объясняемой дисперсии факторов

Фактор:
Собств.зн. 2.02 1.94          
Дисперс.% 50.4 48.5          
Накоплен. % 50.4 98.9          

 

Переменная <— Собственные вектора (коэффициенты поворота факторных осей) —>

xl 0.348 -0.617
х2 -0.246 0.665
хЗ -0.63 -0.317
х4 -0.649 -0.275

 

Исходные данные в координатах факторов

N
-2.17 0.833          
-0.723 -1.71          
0.94 -0.655          
0.836 1.89          
1.12 -0.358          

 

Переменная <—Факторные нагрузки до вращения

xl 0.493 -0.86 0.131 0.0162
х2 -0.35 0.927 0.133 0.0131
хЗ -0.894 -0.442 0.0517 -0.0461
х4 -0.922 -0.383 -0.0306 0.0484

 

Вращение: варимакс, число факторов=2

Переменная Общность Специфичность
xl 0.983 0.0174
х2 0.982 0.018
хЗ 0.995 0.00479
х4 0.997 0.00328

 

Объекты в координатах факторов

N
-87.5 23.4          
-83.6 -16.3          
-56.2 -13.0          
-43.1 18.8          
-52.2 -11.0          

 

Переменная <—Факторные нагрузки после вращения—>

xl 0.0866 -0.988
х2 0.0721 0.988
хЗ -0.997 -0.0254
х4 -0.998 0.0396

 

Таблица 6

Результаты факторно-аналитической обработки данных учебного примера в программе SPSS

Factor Analysis

Communalities

  Initial Extraction
X1 ,961 ,970
X2 ,953 ,960
X3 ,990 ,989
X4 ,991 ,996

Extraction Method: Principal Axis Factoring,

 

Total Variance Explained

Factor   Initial Eigenvalues Extraction Stms of Squared LmoVigs Rotation Sums of Squared Loadros
  Total %of Variance Comulative % Total %of Variance Comulative % Total % of variance Corrulative %
2,016 50,408 50,408 2,005 50,118 50,118 49,866 49,866
1,942 48,538 9U945 1,909 47,733 97,852 1,919 47,966 97,852
,038 ,945 99,891            
,004 ,109 100,000            

Extraction Method Principal Axis Factoring,

 

Factor Matrix

  Factor
 
X1 -,400 ,900
X2 ,251 -,947
X3 ,932 ,348
X4 ,956 ,286

Extraction Method: Principal Axis Factoring,

a. 2 factors extracted, 4 iterations required,

Rotated Factor Matrix

  Factor
 
X1 -8,59E-02 -,981
X2 -7,10E-02 ,977
X3 ,994 -2,59E-02
X4 ,997 4,028E-02

Extraction Method: Principal Axis Factoring,

Rotation Method: Varimax with Kaiser Normalization,

a, Rotation converged in 3 iterations,

Factor Transformation Matrix

Factor
1 2 ,946 ,325 ,325 -,946

Extraction Method: Principal Axis Factoring,

Rotation Method: Varimax with Kaiser Normalization,

Factor Score Coefficient Matrix

  Factor
 
X1 ,108 -,585
X2 ,078 ,420
X3 ,159 ,019
X4 ,856 -,040

Extraction Method: Principal Axis Factoring,

Rotation Method: Varimax with Kaiser Normalization,

 

Factor Scores Method: Regression,







Последнее изменение этой страницы: 2016-04-08; Нарушение авторского права страницы

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 35.172.233.215 (0.017 с.)