Анализ данных в социологическом исследовании 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Анализ данных в социологическом исследовании



Анализ данных в социологическом исследовании

 

Учебно-методическое пособие

 

 

Красноярск       

ИПК СФУ

2008

 

ББК 60.506

 

Составитель П.А. Стариков

 

Анализ данных в социологических исследованиях: учеб.-метод. пособие / [сост. П.А. Стариков]; Сибирский федеральный университет. - Красноярск:  ИПК СФУ, 2008. – 86 с.

 

 

В учебно-методическом пособии дается описание  процедур анализа данных с помощью пакета статистических программ Statistica 7.0. Изложение материала структурировано по методу case-stady и представляет собой подробное обсуждение процесса анализа данных результатов анкетного опроса (интерес студентов к развитию своей творческой компетентности).

Предназначено для студентов высших учебных заведений.

 

 

Печатается по решению редакционно-издательского совета Института естественных и гуманитарных наук СФУ

 

 

© Сибирский федеральный университет, 2008

© Стариков П.А., 2008


Содержание

 

 

Введение ……………………………………………………….…………………4

1.    Кодирование переменных. Подготовка 

данных к анализу ………………………………………………..……....….…..10

2.   Описательная статистика  (Descriptive statistics) ………..……….…….…18

3.  Сравнение средних значений. Однофакторный

 дисперсионный анализ ………………………………………..…………….…30

4.   Таблицы сопряженности. Корреляционный анализ ……..………….….42

5. Факторный анализ …………………………………………….………...…57

6. Кластерный анализ ……………………………………………….….….…71

Список рекомендуемой литературы …………………………………….…….85

 

 


Введение

 

 

В учебно-методическом пособии основное внимание  уделено двум аспектам:

- умению использовать для анализа  данных современные пакеты статистических программ, в частности, программу Statistica 7.0 (считается, что на сегодняшний день  программные продукты компании Statsoft наиболее эффективны, удобны, предоставляют пользователю удобные интерфейсы и богатые графические возможности);

 - и, что не менее важно, умению осмысливать, рефлексировать полученные статистические результаты, формировать целостное представление об изучаемом социальном явлении.

Для того чтобы успешно  решить поставленные  задачи,  в качестве основного метода обучения был выбран метод case-stady.  В учебно-методическом пособии представлено  подробное изложение процесса анализа данных результатов одного из анкетных опросов. При этом мы предполагаем, что  студенты уже знакомы  с основными методами математической статистики, которые изложены во множестве учебных пособий. В частности, довольно подробное описание техник и статистических методов можно найти в учебнике «Статистика» (портал Statsof).

Тема рассматриваемого  в  пособии анкетного опроса – отношение к творчеству,  как представляется,   актуальна и интересна для большинства студентов. Сегодня способность к творческой деятельности становится своеобразным индикатором успешности человека, развитости его внутреннего мира. Ричард Флорида определяет появление креативного класса как наиболее значимую социо-культурную трансформацию современного общества. Тема творчества связана с такими актуальными проблемами личности и общества, как ресурсы развития человеческих способностей, смысл созидательной деятельности, бессознательное, свобода и спонтанность, системное мышление и интегративность, мировоззрение и место творческой личности в обществе, возможность и необходимость формирования навыков творчества.  

Как видим, проблематика указанной темы достаточно сложна. Результаты анкетированного опроса позволят выявить общую картину отношения современной студенческой молодежи к творчеству, творческой компетентности, некоторые закономерности, наметить новые гипотезы и перспективные области для изучения по названной тематике. В целом эффективный анализ данных позволяет замкнуть исследовательский цикл: предварительные гипотезы – исследование – анализ результатов – целостный образ изучаемого явления – новые гипотезы.

 Данные, на основании которых строится case-stady, были получены в ходе анкетного опроса, который проводился в марте–апреле 2007 года среди студентов Сибирского федерального университета по выборке 294 человека. Выборка формировалась групповым методом. Для опроса использовалась анкета, приведенная ниже.

А Н К Е Т А

Нам очень важно узнать Ваше мнение.

Благодарим Вас за то, что согласились заполнить нашу анкету.

 

1. Насколько Вы согласны с некоторыми утверждениями о творчестве, творческих способностях, творческих людях …….

 

  Пол-ностью согласен Частично согласен Затруд-няюсь Частично не согласен Полнос-тью не согласен
1. Каждый человек либо талантлив, либо нет 5 4 3 2 1
2. Существуют эффективные методики развития творческого потенциала личности 5 4 3 2 1
3. Способность к творчеству помогает человеку добиться успеха в жизни 5 4 3 2 1
4. Считаться творческим человеком – это престижно 5 4 3 2 1
5. Творчество не имеет смысла, поскольку мир и человек конечны 5 4 3 2 1
6. Творчество – это источник подлинного удовольствия 5 4 3 2 1
7. Творческие люди формируют элиту общества 5 4 3 2 1
8. Творческому человеку трудно без помощи пробиться в обществе 5 4 3 2 1
9. На современном рынке труда востребованы творческие люди 5 4 3 2 1

 

2.  Какие техники творчества Вам знакомы? (отметьте подходящие варианты)

 

1) мозговой штурм

2) инверсия

3) техники ТРИЗа

4) инкубация

5) латеральное мышление

6) использование метафор

7) мозговые карты (Brain-mind)

8) вхождение в особые состояния сознания

9) другое ________________________________________

          (укажите Ваш вариант ответа)

 

2. Считаете ли Вы себя творческим человеком?

 

Нет -1  2  3  4 5 6  7 – В значительной степени

 

4. Какие характеристики, по Вашему мнению, будут присущи Вашей жизни через 10 лет?

 

Характеристики Обяза-тельно Возмож-но Мало-вероятно
Активные занятия спортом 3 2 1
Материальный достаток 3 2 1
Вера в Бога 3 2 1
Престиж, восхищение окружающих 3 2 1
Хорошие возможности для отдыха, развлечений 3 2 1
Хорошая семья 3 2 1
Руководящая должность 3 2 1
Интересная, творческая работа 3 2 1
Культурный досуг 3 2 1
Жизнь ради людей 3 2 1
Духовное развитие, нравственное самосовершенствование 3 2 1

5. Если бы Вам предложили пройти тренинг по современным технологиям творчества в рамках платного дополнительного университетского образования, то с какой степенью вероятности Вы бы согласились участвовать в нем?

Определенно бы согласились - 100 %, 75 %, 50 %, 25 %, 0 % - наверняка бы отказались

6. Какие сомнения относительного предложенного тренинга у Вас возникают?

  Пол-ностью согласен Час-тично согласен Затруд-няюсь отве-тить Час-тично не согласен Пол-ностью не согла-сен
1. От таких тренингов нет никакой пользы 5 4 3 2 1
2. Творческие способности нельзя развить быстро 5 4 3 2 1
3. Есть страх перед оценкой другими Ваших способностей 5 4 3 2 1
4. Есть риск подвергнуться манипулятивным техникам и попасть в зависимость 5 4 3 2 1

 

7. Какие бы факторы положительно повлияли бы на Ваше решение пройти тренинг?

 

А) положительные отзывы студентов, уже прошедших обучение  

Б) наличие оригинальных рекламных сообщений

В) положительные отзывы в университетской газете

Г) наличие учебного пособия по тренингу, научных публикаций

 

 

8. Насколько по Вашей самооценке развиты в Вас эти способности и компетентности? (отметьте по 7- балльной шкале, где «1» - совершенно нет компетентности, «7» - на уровне мастерства) Насколько развитие этих способностей и компетентности представляет интерес для Вас? («1» совершенно нет интереса, «7» - очень заинтересует)
1. Умение интегрировать сознание и бессознательные процессы 1 2 3 4 5 6 7 1 2 3 4 5 6 7
2. Чувство внутренней свободы 1 2 3 4 5 6 7 1 2 3 4 5 6 7
3. Умение импровизировать 1 2 3 4 5 6 7 1 2 3 4 5 6 7
4. Умение генерировать оригинальные идеи 1 2 3 4 5 6 7 1 2 3 4 5 6 7
5. Развитие интуиции 1 2 3 4 5 6 7 1 2 3 4 5 6 7
6. Умение посмотреть на мир с иной точки зрения 1 2 3 4 5 6 7 1 2 3 4 5 6 7
7. Умение входить в особые состояния сознания 1 2 3 4 5 6 7 1 2 3 4 5 6 7
8. Умение путешествовать в мирах воображения 1 2 3 4 5 6 7 1 2 3 4 5 6 7
9. Умение видеть уникальность мира, людей 1 2 3 4 5 6 7 1 2 3 4 5 6 7
10. Знание техник творчества 1 2 3 4 5 6 7 1 2 3 4 5 6 7
11. Знание психологических закономерностей творчества 1 2 3 4 5 6 7 1 2 3 4 5 6 7
12. Знание философских, религиозных концепций творчества  1 2 3 4 5 6 7 1 2 3 4 5 6 7

 

9. Связан ли у Вас творческий процесс с негативными переживаниями (внутренним напряжением, страхами, отрицательными эмоциями)?

Нет – 1 2 3 4 5 6 7 – В значительной степени

 

10. Если бы Вы с друзьями обсуждали темы, сопряженные с творчеством, то Вы  бы

1 – больше слушали других,     2 – попытались убедить их в своей правоте

 

11. В какой степени творчество у Вас ассоциируется со следующими характеристиками:

(отметить по 7 – балльной шкале, где «0» – не ассоциируется, «7» –характеристика абсолютно подходит)

 

 

1) вдохновение   14) риск, неопределенность  
2) сверхсознание   15) уважение к себе/ жизни  
3) ощущение незримой поддержки мира, Бога   16) престиж  
4) обилие энергии   17) успешность  
5) экстатические переживания   18) элитарность  
6) интуиция   19) искусство общения  
7) удовольствие   20) занятия наукой  
8) муки творчества, душевный дискомфорт   21) предпринимательство  
9) неуверенность, страх перед критикой   22) духовность  
10) целостный взгляд на мир   23) интересные люди  
11) импровизация, спонтан-ность   24) добро  
12) саморегуляция   25) душевность  
13) сотворчество   26) свобода, независимость  

 

Пол мужской  /  женский
Курс  
Факультет  
Обучение на платной основе / на бюджетной

12.

 

13. Ваше материальное положение  

 

А) живу обеспеченно, могу покупать дорогие вещи

Б) на дорогие вещи приходится копить

В) средств хватает только на самое необходимое

Г) средств не хватает даже на самое необходимое

 

Кодирование переменных. Подготовка данных к анализу

Для лучшего усвоения материала желательно самостоятельно проделывать все этапы анализа. Откройте файл данных «Творчество.sta», щелкнув по нему два раза левой кнопкой мыши. Перед вами появится диалоговое окно системы Statistica 7.0 с уже набранной электронной таблицей данных, которая в данной системе называется Spreadsheet (рис.1.1).

 

 

Рис.1.1. Электронная таблица данных «Творчество»

 

На рис. 1.1 вы можете видеть основные компоненты системы STATISTICA: пользовательское меню, электронная таблица (на сине-голубой ленте указываются характеристики таблицы данных: 100v – 100 переменных, 294c – 294 случаев или анкет, которые были внесены в таблицу). Каждая строка представляет собой один случай, каждый столбец – одну переменную.

Давайте рассмотрим подробнее процесс формирования  таблицы данных. Прежде всего, в меню «File»  выбирается команда «New». Появляется следующее диалоговое окно (рис.1.2).

 

 

Рис. 1.2. Диалоговое окно создания новой электронной таблицы данных

 

Здесь задаются предполагаемое количество переменных и случаев (например, 100 и 100). В результате появляется новая таблица данных, которой следует дать название (например, «Творчество1») и определить ее место в какой-либо папке, использовав команду «Save as» (рис.1.3).

 

 

Рис. 1.3. Новая электронная таблица данных

 

 

Следующим шагом  задаются переменные для анализа данных анкетного опроса. При этом нужно определиться  со способом кодирования переменных. Понятие «кодирование» означает перевод ответов респондентов в числовые форматы, удобные для анализа данных. При создании таблицы данных «Творчество» был использован такой принцип кодирования переменных. Ответ на определенный вопрос из анкеты определялся как одна переменная. Например, степень согласия с суждением «Каждый человек является либо талантливым, либо нет» кодировалась как переменная V1_1. (Значение этой переменной меняется от 1 до 5 соответственно с выбранным респондентом вариантом ответа). Степень согласия респондента со следующим суждением «Существуют эффективные методики развития творческого потенциала личности» кодировалась как значение переменной V1_2.

Научимся создавать в таблице данных новые переменные. Чтобы задать переменную V1_1 в электронной таблице, следует дважды щелкнуть левой клавишей мыши на ячейке «Var1», при этом появится диалоговое окно (рис.  1.4).

 

 

Рис.1.4. Диалоговое окно задания переменной

 

В данном окне можно задать имя переменной (назовем создаваемую переменную именем «V1_1»), ее тип (Double), формат отображения в таблице (General). Дополнительно можно задать длинное имя (talant) или формулу расчета этой переменной на основе уже существующих переменных. Поставленный по умолчанию тип переменной «Double» позволяет иметь дело и с численными, и с текстовыми переменными.

Если щелкнуть по кнопке «Values/Stats», то появится окно, в котором будут отмечены основные характеристики распределения данных этой переменной: имя (V1_1), длинное имя (talant), возможные значения переменной (1 2 3 4 5), число случаев (N = 294), среднее значение переменной (mean = 2,87), стандартное отклонение  (SD = 1,38). Использование этой функции удобно для контроля введенных данных.

Предположим, когда вводились данные из седьмой и восьмой анкет, была допущена ошибка. Смоделируйте ошибку, вбив в 7 и 8 строку неправильные данные (например, цифру 12 и 25), затем щелкните два раза по ячейке V1_1, щелкните по кнопке «Values/Stats» и вы увидите появление новых категорий (12 25), выходящих за пределы выбранной вами системы кодирования (1 2 3 4 5).              

         

 

Рис.1.5. Таблица данных с неправильно введенными значениями

 

 Восстановите правильную таблицу данных, введя значение «4» в седьмую строку и «2» в восьмую строку. Степень согласия «седьмого» респондента с суждением «Каждый человек  либо талантлив, либо нет» соответствовала 4 (частично согласен), «восьмого» респондента – 2 (частично не согласен).

 Нажатие кнопки «All Specs» позволяет вам просматривать все переменные сразу.                               

Аналогичным образом задаются  переменные V1_3…V1_9.

Далее необходимо кодировать ответы респондентов на следующий вопрос:

Какие техники творчества Вам знакомы? (отметьте подходящие варианты)

1) мозговой штурм

2) инверсия

3) техники ТРИЗа      

4) инкубация

5) латеральное мышление

6) использование метафор

7) мозговые карты (Brain-mind)

8) вхождение в особые состояния сознания

9) другое___________________________.

Ответы на такие вопросы  лучше кодировать набором дихотомических переменных (переменными, принимающими только два значения: 0 и 1 в данной таблице). Таким образом, имеем восемь дихотомических переменных, названных в таблице именами V2_1 … V2_8. Каждая переменная принимает значение 1, если респондент выбирает соответствующий вариант ответа, 0 – если выбор варианта отсутствует. Например, второй в нашей таблице респондент (вторая строка) выбрал, отвечая на вопрос о знакомстве с техниками творчества, следующие варианты ответов: мозговой штурм, техники ТРИЗа, использование метафор, мозговые карты, вхождение в особые состояния сознания (рис. 1.6).

 

 

Рис. 1.6. Фрагмент таблицы данных

 

Для кодирования выбора варианта «другое» было бы целесообразно ввести дополнительную текстовую переменную V2_9. В таблице данных она не создана, потому что, отвечая на этот вопрос, как правило,  респонденты не давали дополнительных пояснений.

Аналогично были заданы все другие переменные. Ответы на вопрос

«Считаете ли Вы себя творческим человеком?» с предложенной шкалой «Нет – 1  2  3  4 5 6  7 – В значительной степени» кодировались переменной V3.

Ответы респондентов на вопрос «Какие характеристики, по Вашему мнению, будут присущи Вашей жизни через 10 лет?» кодировались с помощью переменных V4_1 … V4_11.

Ответы на вопрос «Если бы Вам предложили пройти тренинг по современным технологиям творчества в рамках платного дополнительного университетского образования, то с какой степенью вероятности Вы бы согласились участвовать в нем?» со шкалой «Определенно бы согласились – 100%, 75%, 50%, 25%, 0% – наверняка бы отказались» кодировались с помощью переменной V5.

Соответственно ответы на шестой вопрос кодировались с помощью переменных V6_1 … V6_4 (виды сомнений), на седьмой – V7_1 … V7_4 (положительно влияющие факторы), на восьмой – V8_A1 … V8_A12 (самооценка развитости способностей и компетентности), V8_B1 … V8_B12 (уровень интереса), девятый – V9 (внутреннее напряжение), десятый – V10 (индикатор компетентности), одиннадцатый – V11_1 … V11_26 (ассоциации).

Ответы на двенадцатый вопрос кодировались с помощью переменных V12_1 … V12_4. Установленный по умолчанию тип переменной «Double» определяет численные значения текстовых переменных. Если дважды щелкнуть по ячейке с названием переменной, затем по кнопке «Text Labels», то в появившемся окне можно увидеть соответствие текстового значения и численного. Числа, расположенные в колонке «Numeric» (рис. 1.7), используются при статистических расчетах.

Рис. 1.7. Диалоговое окно Text Label Editor переменной V12_3 (факультет)

 

Кодировка ответов на 13-й вопрос «Ваше материальное положение» с помощью дихотомических переменных V13_1 … V13_4 не является  удачной. Целесообразно было бы объединить эти переменные в одну переменную V13. При этом переменная V13 отражала бы порядковую шкалу, измеряющую с помощью четырех градаций уровень материального положения респондента. Для дальнейшего анализа данных  это будет иметь значение.

Чтобы исправить ошибку кодировщика,  создадим новую переменную V13 в пустующем пока столбце Var99. Для этого откроем диалоговое окно задания переменной  и наберем формулу расчета новой переменной =v95+2*v96+3*v97+4*v98 (рис.1.8). Форма записи переменных в уравнении (например, v95) указывает не на имя переменной, а  на ее номер в списке переменных, что удобно при написании формул. Нажмите «OK», затем в появившемся диалоговом окне подтвердите свое желание пересчитать переменную. В 99-м столбце возникнут новые значения. Вы можете убедиться в  правильности пересчета, сопоставляя  значения переменной V13 с соответствующими значениями переменных V13_1 … V13_4. 

 

 

Рис. 1.8. Диалоговое окно переменной V13 с заданной формулой расчета

 

Другая возможность численно задать новую переменную – воспользоваться меню Date, в котором следует выбрать команду Recode. При этом поле переменной, которую нужно перекодировать, выделяют щелчком левой клавиши мыши. В появившемся диалоговом окне  определяются условия расчета переменной.

 

 

 

Рис.1.9. Диалоговое окно для перекодировки переменной v100

 

На рис. 1.9 каждое значение переменной v13 определяется соответствующими условиями: если v13_4=1, то ей присваивается значение 4; если v13_3=1, то – 3; если v13_2=1, то – 2; если v13_1=1, то – 1.

Для того чтобы добавить переменные в электронную таблицу данных, используют команду «Add variables» в меню «Insert». Удаляются лишние переменные в меню «Edit» командой «Delete».

Для того чтобы добавить дополнительные случаи при вводе данных используют команду «Add cases» в меню «Insert». Попробуйте заполнить анкету и ввести свои данные во вновь созданную вами строку 295.

 

 

 

Рис.1.11. Диалоговое окно для добавления в таблицу данных новых случаев

 

Значимый аспект подготовки электронной таблицы данных – работа с пропущенными (missing) значениями. Пропущенные значения –  довольно распространенный случай, когда респонденты оставляют некоторые места анкет незаполненными. При последующем анализе данных необходимо выбрать один из трех возможных способов обработки пропущенных значений.

Первый способ заключается в том, чтобы при анализе выбраковать строку с пропущенными данными. При этом, используя конкретные статистические методы, в правом нижнем углу диалоговых окон отмечаем выбор «Casewise».

 

 

Рис. 1.12. Правый нижний угол диалогового окна  

 

Чаще всего используется другой выбор работы с пропущенными значениями – «Pairwise», что позволяет использовать данные для анализа в более полном объеме.

Третий способ заключается в замене пропущенных значений (пустых ячеек в таблице данных) средними значениями по данным переменным. Для этого выберите в меню «Data» функцию «Replace missing data».

 

 

Факторный анализ

 

При анализе данных исследователи могут использовать факторный анализ для двух основных целей. Во-первых, метод факторного анализа позволяет выявлять группировки тесно связанных между собой переменных и таким образом в социологическом исследовании дает возможность увидеть более глубокие, зачастую бессознательные ориентации и ожидания людей, в общем – некоторые латентные, скрытые факторы.

Во-вторых, факторный анализ позволяет корректно уменьшить количество переменных. Это процедура полезна для использования новых, полученных с помощью факторного анализа переменных в кластерном, регрессионном, дискриминантном анализе и  других видах анализа данных. При уменьшении числа переменных факторный анализ помогает сохранить как можно больше информации и сделать так, чтобы новые переменные имели смысл и с ними было легко работать.

Например, ранее мы установили сильную корреляционную связь между группой переменных «интерес к знанию техник творчества», «интерес к знанию психологических закономерностей творчества», «интерес к знанию философских, религиозных концепций творчества» (переменные V8_B9, V8_B10, V8_B11, соответственно). Эти три переменные можно заменить одной новой латентной переменной, которая  и называется фактором. Идеология факторного анализа – свести изучаемые переменные к ограниченному количеству независимых друг от друга факторов.

Процедура факторного анализа состоит из четырех основных стадий:

1. Вычисление корреляционной матрицы для всех переменных, участвующих в анализе.

2. Извлечение факторов, определение количества факторов, адекватно описывающих поведение исходных переменных.

3. Вращение факторов для создания упрощенной структуры их взаимосвязей с переменными.

4. Интерпретация факторов.

Далее можно ввести в таблицу данных новые переменные, соответствующие вновь найденным факторам, и использовать их в других статистических методах.

Для того чтобы провести факторный анализ, необходимо в меню «Statistics» выбрать опцию «Multivariate Exploratory Technics» и среди других методов – «Factor Analysis» (рис. 5.1).

 

 

Рис. 5.1. Меню выбора метода анализа данных

 

 

После того как вы активировали среди других методов факторный анализ, появляется диалоговое окно Factor Analysis  (рис. 5.2).

 

 

Рис. 5.2. Диалоговое окно Factor Analysis

 

Далее следует определить переменные для анализа, нажав кнопку «Variables». Для проведения факторного анализа предпочтительнее брать группы достаточно однородных, однопорядковых переменных. Например, мы можем выбрать группу переменных, характеризующих интерес студентов к составляющим творческой компетентности.

Итак, возьмем для факторного анализа переменные V11_1 – V11_26 (ассоциации с творчеством). Ранее мы установили общие для всех студентов ассоциации с творчеством: вдохновение; обилие энергии; удовольствие; импровизация и спонтанность; интересные люди; добро; душевность; свобода и независимость. Использование факторного анализа позволит нам из исходных двадцати шести переменных получить ограниченное количество независимых друг от друга факторов. Значение этих факторов  может быть понято как некие скрытые для прямого измерения смыслы, ассоциирующиеся с творчеством.

Установленная по умолчанию опция «Raw Data» означает, что для факторного анализа будут использованы реальные данные. На их основе  программа рассчитает корреляционную матрицу, которая и будет использована далее в факторном анализе. После этого нужно нажать «ОК».

В появившемся диалоговом окне прежде всего следует обратить внимание на количество проанализированных случаев. Если имеется большое количество удаленных строк, то необходимо проделать процедуру сначала, заменив установку «Casewize» (см. рис. 5.2) на «Pairwise» или «Mean substitution» (вместо пропущенных данных использовать средние по переменной значения).

 

 

Рис. 5.3. Диалоговое окно Define Method of Factor Analysis при нажатой кнопке «Advanced»

 

Далее исследователь определяется с выбором метода факторного анализа (рис. 5.3). Выделяют две большие группы подходов к проведению факторного анализа – анализ главных компонент и анализ общих факторов.

В анализе главных компонент (Principal components)  основное внимание уделяется объясненной факторами дисперсии. Вариабельность всех исходных переменных составляет 100 % дисперсии. Замена переменных факторами позволяет объяснить только часть дисперсии. Анализ главных компонент рекомендуется, если основная задача исследователя – выделить минимальное число факторов, которые описывают максимальное количество всей дисперсии.

При анализе общих факторов (Principal factor analysis) решается другая задача – определение структуры данных. Основное различие двух моделей факторного анализа состоит в том, что при анализе главных компонент предполагается, что должна быть использована вся изменчивость переменных, тогда как при анализе главных факторов используется только изменчивость переменной, общая и для других переменных.

В большинстве случаев эти два метода приводят к весьма близким результатам.

В меню определения методов нужно оставить отметку «Principal components». Далее будет необходимо, используя параметры:  максимальное количество выделяемых факторов «Max no. of factor» и минимальное собственное значение «Mini eigenvalue», задать  количество факторов, которые выделятся в ходе факторного анализа.

В ходе процедуры факторного анализа будет выделено или указанное количество факторов, или меньшее количество – все факторы, собственное значение которых больше заданного вами минимального собственного значения.

Существует несколько способов ответить на вопрос «Сколько факторов будет в конечной модели?»

Критерий собственного значения. Собственное значение отражает объем дисперсии исходных переменных, который определяется этим фактором. Задать минимальное собственное значение факторов – это один из распространенных способов отобрать минимальное количество факторов.

Поскольку факторный анализ предназначен для того, чтобы уменьшить количество исходных переменных, то было бы бессмысленно доводить количество факторов до количества переменных. Практическое правило, на которое обычно полагаются при проведении  факторного анализа, заключается в том, что все факторы, включенные в модель (до вращения), должны объяснять, по крайней мере, такую же часть дисперсии, как и «средняя переменная». Фактор, собственное значение которого меньше 1,0, не лучше одной переменной, поскольку нормированная дисперсия исходных переменных составляет 1,0. Следовательно, собственное значение фактора должно быть больше 1,0. В противном случае будет лучше оставить исходную переменную. Таким образом, следуя критерию собственного значения, мы задаем минимальное собственное значение «Mini eigenvalue» равным 1,0.

Другой, часто используемый критерий ограничения количества выделяемых факторов, – критерий «каменистой осыпи». График «каменистой осыпи» – это график зависимости собственных значений от числа факторов в порядке их выделения (рис. 5.4).  Для определения числа факторов оценивается форма графика. Обычно на графике виден четкий перелом между крутой частью и пологим «хвостом». Этот «хвост» и называют «каменистой осыпью».

Для нашего случая на основании критерия собственного значения отберется шесть факторов, критерий «каменистой осыпи» указывает в большей степени на необходимость отобрать только пять факторов (рис. 5.4).

 

 

Рис. 5.4. График «каменистой осыпи»

 

Критерий «процент объясненной дисперсии». При данном подходе число отбираемых факторов определяется таким образом, чтобы суммарный процент объясненной отобранными факторами дисперсии достигал удовлетворительного уровня (чаще всего этот уровень принимается равным 70 %). На рис. 5.5 показана выведенная на экран монитора таблица собственных значений, в которой указаны номер фактора (в порядке выделения), его собственное значение (eigenvalue), процент общей дисперсии объясненной фактором (% Total variance), кумулятивное собственное число (сумма всех собственных значений, включая предыдущие факторы), кумулятивный процент объясненной факторами дисперсии (Cumulate %).

 

 

 

Рис. 5.5. Таблица собственных значений факторов

 

В таблице собственных значений факторов (рис. 5.5) хорошо видно, как уменьшается вклад в объясненную дисперсию по мере увеличения порядкового номера фактора. Кумулятивный процент объясненной дисперсии достигает 100 %, когда число факторов сравнивается с числом переменных.

Вернемся к анализу переменных, описывающих ассоциации студентов с творчеством. Установим максимальное количество выделяемых факторов «Max no. of factor» – 26 и минимальное собственное значение «Mini eigenvalue» – 0,00. Это позволит  рассмотреть все факторы и выбрать оптимальное их количество. После этого зайдем обратно в диалоговое окно «Define Method of Factor Analysis» и зададим (в зависимости от нашего выбора) или определенное количество факторов, или минимальное собственное значение. Затем нажмем «ОК». В результате наших действий откроется диалоговое окно вывода результатов факторного анализа (рис. 5.6).

 

Нажатие кнопки «Scree plot» позволит вывести на экран график «каменистой осыпи» (рис. 5.4). Нажатие кнопки «Eigenvalue» даст возможность просмотреть таблицу собственных значений факторов (рис. 5.5).

 

 

Рис. 5.6. Окно вывода результатов факторного анализа

 

Если в качестве способа определения необходимого количества факторов мы выберем критерий «процент объясненной дисперсии», то десять факторов будут составлять оптимальное  количество для описания исходных двадцати шести переменных. В этом случае все девять факторов объяснят 69 % всей вариации переменных.

В нашем случае мы воспользуемся  критерием собственного значения и соответственно зададим количество факторов равным семи, поскольку седьмой фактор имеет собственное значение лишь немного меньше единицы. Процент описываемой  всеми выбранными факторами дисперсии  при этом составит 63 %.

Следующим шагом после выделения факторов является их вращение. Нужно войти в подменю «Quick» и в опции «Factor rotation» установить один из методов вращения факторов «Varimax normalized» (рис. 5.7).

 

 

 

Рис. 5.7. Окно выводов результатов факторного анализа

 

 

Вращение факторов – это математическая процедура, которая позволяет выбрать наиболее оптимальное сочетание факторных нагрузок для последующей интерпретации факторов. Существует много методов вращения. При вращении «Varimax» каждый фактор имеет тенденцию давать большие нагрузки (близкие к 1 или -1) на небольшое количество переменных, что упрощает интерпретацию полученных в результате факторов. Нагрузка отражает связь между переменной и фактором, являясь подобием коэффициента корреляции. Значение нагрузки лежит в пределах от -1 до 1 (рис. 5.8).

Войдите в подменю «Loadings» и нажмите кнопку «Factor loadings». На экран монитора будет выведена таблица факторных нагрузок.

 

 

Рис. 5.8. Повернутая модель факторов (таблица факторных нагрузок)

 

После того как произведено вращение факторов, необходимо интерпретировать смысл выделенных факторов. Интерпретация факторов осуществляется исходя из больших значений факторных нагрузок (в таблице они выделены красным цветом).

Первый выделенный фактор описывает 12 % общей дисперсии и тесно связан с переменными, характеризующими ассоциации с творчеством: «добро», «душевность» (факторные нагрузки составляют 0,81, 0,85 соответственно). Довольно сильно этот фактор связан с переменными «интересные люди», «свобода и независимость». Скорее всего факторные нагрузки указывают на группу ассоциаций с творчеством, общий смысл которых заключается в следующем. Творчество ассоциируется с отношениями между людьми, проникнутыми добрыми и душевными чувствами. При этом связь смыслов «свобода» и «добро» определяют своеобразные формы взаимоотношений, характерных для молодежных сообществ: позволить другому быть независимым и свободным, быть самим собой. Таким образом, первый фактор может быть кратко обозначен как творчество – душевное, доброе человеческое взаимодействие.



Поделиться:


Последнее изменение этой страницы: 2021-01-08; просмотров: 169; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.119.131.72 (0.214 с.)