Многомерного анализа данных о личности 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Многомерного анализа данных о личности



В психологии существуют два основных направления исследований личности: подход на основе выделения черт личности и типологический подход

Первый предполагает существование конечного набора базисных качеств, и личностные различия определяются степенью их выраженности. При типологическом подходе исходят из постулата, что тип личности является целостным образованием, не сводимым к комбинации отдельных личностных факторов. Но оба подхода предназначены для формирования понятийного аппарата, систематизирующего информацию об индивидуальных различиях.

Черты объединяют группы тесно связанных признаков и выступают как некоторые интегральные характеристики, обобщающие информацию, содержащуюся в данной, группе признаков. Число черт определяет размерность личностного пространства.

Типы объединяют группы похожих испытуемых и составляют иной набор объяснительных понятий, где в качестве имени понятия выступает название соответствующего типа, а содержание раскрывается описанием типичного (или усредненного) представителя.

Таким образом, подход на основе черт требует группировки признаков, а подход на основе типов – группировки испытуемых.

Для решения каждой из этих двух задач существуют специальные математические методы и модели. Наиболее часто для группировки признаков используются методы факторного анализа, а для группировки испытуемых – методы автоматической классификации. Эти методы являются двумя способами формирования обобщений на экспериментальном массиве данных. Они позволяют «сжать» информацию за счет выявления неоднородностей в структуре связей между признаками или испытуемыми. В результате массив экспериментальных данных разбивается на некоторые подмассивы, которые являются обобщениями совокупности данных.

Для удобства понимания способа построения обобщений с помощью методов факторного анализа и автоматической классификации представим экспериментальный массив данных в виде двухмерной матрицы размерностью N на М (рис. 1).

a b c d e f M

             
             
             
             
             
             

N

 

Строки матрицы данных соответствуют множеству испытуемых (ученики, педагоги и т. п.), а столбцы – признакам личности (в «L»-, «Q»- или «T»-данных).

Такое представление данных допускает, как минимум, два способа построения обобщений: 1) по столбцам (признакам личности) и 2) по строкам матрицы данных (группировкам испытуемых).

Обобщение данных путем группировки признаков (по столбцам). Оно состоит в выделении из матрицы данных групп тесно связанных признаков при помощи методов факторного анализа.

Факторный анализ представляет собой систему методов для преобразования исходного набора признаков к более простой и содержательной форме. Он базируется на предположении, что наблюдаемое поведение испытуемого может быть объяснено с помощью небольшого числа скрытых характеристик, называемых факторами.

В матричном виде работа методов факторного анализа может быть представлена как разбиение матрицы данных по столбцам на подматрицы, каждая из которых соответствует одной группе сильно коррелирующих признаков, т. е. исходный прямоугольник (рис.2а) разрезается на вертикальные полоски (рис.2b) так, что каждая полоска содержит информацию о всех испытуемых, но не по всем признакам, а только по группе сильно коррелирующих признаков.

 

a M b M c P

    ........... ….   Черта i ...........    

N N N

Помимо разбиения матрицы данных на вертикальные полоски (группы сильно коррелирующих признаков), факторный анализ формирует новый обобщающий вертикальный столбец (комплексный признак-фактор), который в конденсированном виде содержит основную информацию об испытуемых по всем столбцам соответствующей полоски. Это сжатие может быть изображено как замена матрицы с большим числом столбцов на матрицу с малым числом столбцов, равным числу факторов (Р) и хорошо описывающим все столбцы исходной матрицы данных (рис.2 с).

 

Обобщение данных путем группировки испытуемых (по строкам). Оно представляет собой группировку испытуемых по степени их близости в пространстве измеряемых признаков, т. е. на матрице данных выделяются группы похожих испытуемых.

Существуют два основных варианта постановки задачи группировки испытуемых: 1) группировка испытуемых на незаданные группы; 2) группировка испытуемых на заданные группы.

1. Задача группировки испытуемых на незаданные группы (кластерный анализ). Этот вариант задачи формулируется следующим образом: имеется многомерное психологическое описание выборки испытуемых и требуется осуществить их разделение на однородные группы, т. е. такое разделение, при котором в составе выделенных групп оказались бы испытуемые, похожие по психологическим характеристикам. Такая постановка задачи группировки испытуемых соответствует интуитивным представлениям о типе личности.

Для решения этой задачи используются методы автоматической классификации «без учителя». Методы автоматической классификации разработаны в рамках математической теории распознавания образов и предназначены для анализа структуры взаимного расположения испытуемых в пространстве измеряемых признаков. Они позволяют производить объективную классификацию испытуемых по большому набору признаков и основываются на гипотезе «компактности». Если представить каждого испытуемого в виде точки в многомерном пространстве признаков, то естественно предположить, что геометрическая близость точек в этом пространстве указывает на похожесть соответствующих испытуемых.

Методы автоматической классификации «без учителя»дают возможность получать сокращенное описание распределения испытуемых путем выделения их скоплений в пространстве исследуемых признаков.

Под структурой множества испытуемых в этом случае понимается взаимное расположение этих скоплений, их размеры и число испытуемых в каждом скоплении. В результате разбиения множества испытуемых на типы, соответствующие скоплениям похожих испытуемых, получаем описание распределения испытуемых в терминах выделенных типов. В этом случае каждый испытуемый характеризуется уже не исходным набором признаков, а принадлежностью к тому или иному типу.

Таким образом, в результате автоматической классификации матрица данных (рис. 3а) разбивается по строкам на подматрицы, каждая из которых соответствует группе похожих между собой испытуемых (рис.3b). Это позволяет «сжать» информацию, представленную в исходной матрице данных, с большим числом строк и построить новую матрицу с меньшим количеством строк, равным числу выделенных типов испытуемых (рис. 3c).

 

 

a M b M c M

    ......    
Тип j K
......

N N

 

Если сравнить схемы на рисунках 2 и 3, то становится ясно, что, в отличие от методов факторного анализа, которые разбивают матрицу данных на вертикальные полоски, методы автоматической классификации производят разбиение матрицы данных на горизонтальные полоски. При этом каждая горизонтальная полоска соответствует одному типу испытуемых, представители которого являются близкими по значениям всего набора используемых признаков.

2. Задача группировки испытуемых на заданные группы – дискриминантный анализ. При решении этой задачи предполагается, что имеются результаты психологического обследования нескольких групп испытуемых, и о каждом испытуемом заранее известно, к какой группе он принадлежит. Например, в задаче профотбора это могут быть группы хороших и плохих специалистов, при исследовании полового диморфизма – это испытуемые разного пола, при педагогических исследованиях – это группы школьников, различающихся по успешности обучения, дисциплинированности, общественной активности, возрасту и т. п.

Задача заключается в том, чтобы найти правило разбиения испытуемых на заданные группы по психологическим характеристикам.

В настоящее время для решения этой задачи с успехом используются алгоритмы обучения распознаванию образов с «учителем». Все они основываются на предположении, что существует такое многомерное пространство психологических характеристик, в котором точки, представляющие испытуемых одной группы, расположены кучно и «далеко» от точек, представляющих испытуемых другой группы.

В этом случае может быть построена простая поверхность, разделяющая испытуемых разных групп.

Для того чтобы найти разделяющую поверхность, выбирается некоторое количество испытуемых первой и второй групп (при классификации на две труппы) и проводится обучение программы. В результате программа формирует разделяющее правило (в виде уравнения разделяющей поверхности), с помощью которого можно по значениям психологических признаков определить, к какой группе принадлежит испытуемый. Это оказывается возможным, если каждой группе испытуемых соответствует своя область в многомерном пространстве психологических признаков, так как тогда группы хорошо разделяются сравнительно простыми поверхностями.

Таким образом, очевидно, что обе постановки задачи группировки испытуемых достаточно близки, ибо обе базируются на гипотезе «компактности».

 

Методы одновременного выделения черт и типов. В большинстве психологических исследований разрабатывается какой-либо один подход: на базе черт или типологический. Вместе с тем представляется перспективным их объединение. Объединение этих двух подходов предполагает одновременное выделение черт и типов. С этой целью могут быть использованы методы, основанные на использовании комбинации моделей факторного анализа и автоматической классификации.

В рамках данного подхода разработано два вида комбинаций совместного использования факторного анализа и автоматической классификации: прямая и обратнаякомбинации.

При прямой комбинации методами факторного анализа вначале производится группировка признаков, а затем с помощью методов автоматической классификации в каждой выделенной группе параметров осуществляется группировка испытуемых. В матричном виде прямая комбинация может быть изображена как разбиение матрицы данных вначале по столбцам, а затем разбиение каждой из подматриц по строкам.

При прямой комбинации мы получаем информацию о факторах и об особенностях распределения испытуемых по каждому фактору.

При обратной комбинации вначале используются методы автоматической классификации, и только после этого производится группировка признаков с помощью методов факторного анализа в каждом выделенном типе отдельно. Условно обратная комбинация может быть изображена, как разбиение матрицы данных вначале по строкам, а затем разбиение каждой из подматриц по столбцам.

В результате использования обратной комбинации методов факторного анализа и автоматической классификации мы получаем информацию о типах и об особенностях группировки признаков в каждом типе.

Таким образом, в результате применения комбинации методов факторного анализа и автоматической классификации исходная матрица данных большой размерности заменяется на матрицу с меньшим числом строк и столбцов. Причем строки новой матрицы соответствуют обобщенным признакам, а столбцы – обобщенным испытуемым. Такое представление информации позволяет сильно «сжать» данные, понять их внутреннюю структуру, выявить наиболее существенные закономерности, определяющие вариативность личностных признаков в изучаемом материале.

 



Поделиться:


Последнее изменение этой страницы: 2016-08-26; просмотров: 203; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.139.104.214 (0.011 с.)