Научно-методические основы разработки методик профессионального психологического отбора 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Научно-методические основы разработки методик профессионального психологического отбора



В практике профессионального психологического отбора кадров используется большое количество разнообразных методик, спосо­бов и приемов, позволяющих оценить уровень развития тех или иных психологических и психофизиологических свойств у испыту­емых. Общепринятой классификации этих методов не существует.

Различными авторами многократно предпринимались попыт­ки систематизации наиболее общих сведений о направленности, надежности, валидности, форме и условиях проведения тестов. Однако особого успеха эти попытки не имели. По форме и усло­виям проведения различают: экспериментальные и неэксперимен­тальные, лабораторные и клинические, исследовательские и ди­агностические методы. Выделяют 3 большие группы методов:

Регистрация реального поведения человека в повседневной жизни, так называемые 1,-данные (Life record data). К числу ме­тодик, входящих в этот метод (по сути метод наблюдения), мож­но отнести: наблюдение и телерегистрацию двигательных, рече­вых, эмоциональных и других реакций в реальных ситуациях жизнедеятельности с последующей экспертной оценкой поведен­ческих проявлений психологических и психофизиологических свойств испытуемого.

Изучение психологических и психофизиологических свойств с помощью опросников и других методов самооценки — Q-дан­ные (Questionnaire data). По сути, это регистрация в экспери­ментальных условиях результатов наблюдения испытуемого за самим собой. К числу методик самооценки относятся: методика многостороннего исследования личности (русифицированная адап­тированная версия известного теста MMPI), опросник 16-ФЛО, опросники Айзенка, шкалы ситуационной и личностной тревож­ности и многие-многие другие.

Объективные измерения психологических и психофизио­логических показателей в контролируемой экспериментальнойситуации — Г-данные (Objective test data). Этот метод предус­матривает создание специальных микроситуаций, способствую­щих проявлению психологических и психофизиологических свойств. В эту группу можно отнести методики: исследования интеллекта и креативности («творческости») памяти, внимания, восприятия, специальных способностей, проективные и другие тесты.

При разработке любых методов или конкретных методик, ориентированных на оценку профессиональной пригодности спе­циалистов, возникают две взаимосвязанные задачи.

Первая задача призвана ответить на вопрос, какие индивиду­альные психологические качества определяют профессиональную пригодность.

Вторая задача направлена на решение проблемы, каким спо­собом можно надежно измерить эти необходимые для успешной, деятельности специалиста качества.

Решение первой задачи связано с применением методов профессиографии и психологической диагностики.

Решение второй задачи связано с применением современных технологий разработки или адаптации психологических тестов, с психометрическими основами профессионального психологичес­кого отбора.

На основании анализа теоретических и прикладных исследо­ваний в области профессионального психологического отбора на рис. 7.2 представлена схема разработки средств измерения и оцен­ки профессиональной пригодности.

Из схемы видно, что процедура создания методики оценки профессиональной пригодности начинается с анализа профессиограммы. В дальнейшем она делится на два взаимосвязанных на­правления:

- разработка новых или адаптация известных тестов измере­ния и оценки ПВК;

- разработка методов регистрации параметров деятельности (сбора внешних критериев).


Заканчивается создание методики оценки профессиональной пригодности разработкой нормативно-оценочных шкал ПВК и собственно нормативно-оценочной шкалы (шкал) профессиональ­ной пригодности с обязательной их проверкой цо критериям ва­лидности и надежности.

Ниже рассматриваются некоторые элементы этой схемы.

3.1. Анализ профессиограммы

При проведении анализа профессиограммы в интересах раз­работки методики оценки профессиональной пригодности реша­ются две основные задачи:

ü определение перечня ПВК, оказывающих наибольшее вли­яние на эффективность и Надежность профессиональной де­ятельности;

ü определение параметров деятельности, характеризующих эффективность и надежность деятельности человека.

Определение перечня ПВК, основных параметров деятельнос­ти связано с содержательным анализом профессиональной деятельности и с задачами профессионального психологи­ческого отбора.

В перечень ПВК должны быть включены только основные качества личности, без которых эффективная деятельность не­возможна. Необоснованное расширение перечня ПВК (например, почти все социально значимые качества необходимы профессио­налу) не только затрудняет разработку методик отбора и последу­ющего ее применения, но и может привести к искажению резуль­татов анализа.

При определении параметров деятельности, характеризующих работу профессионала, необходимо стремиться к поиску объек­тивных показателей, отражающих главные особенности деятель­ности профессионала. Среди таких параметров могут быть пока­затели качества, эффективности выполнения человеком ключе­вых элементов трудового процесса.

3.2. Разработка методик регистрациивнешних критериев

Методики, ориентированные на сбор внешних критериев, разрабатываются на основании выделенных на этапе профессиографии основных параметров деятельности.

Известно два основных подхода к разработке таких методик:

1. Сбор показателей, характеризующих деятельность челове­ка в производственном цикле, например, точность выдержива­ния параметров глиссады летчиком при посадке самолета.

2. Опрос экспертов.

Первый подход наиболее понятен и требует лишь разработки процедур фиксации и накопления данных. В каждом конкрет­ном случае он решается с учетом специфики исследуемой дея­тельности. Наиболее часто в качестве критериев используются показатели, характеризующие меру достижения работником це­лей деятельности. Критерий при этом могут быть прямыми или косвенными. В качестве прямых критериев обычно используют показатели скорости, точности действий, ошибочные действия и т. д. В качестве косвенных критериев находят широкое приме­нение оценки на экзаменах, показатели, характеризующие уро­вень профессиональных знаний, навыков или вклад работника в общей результат деятельности.

Второй подход основан на применении экспертных методов и требует от разработчиков-знаний по их применению. Этот подход применяется достаточно часто, особенно когда внешние крите­рии трудно получить другим путем. Например, при оценке доб­росовестности, исполнительности.

Обычно выделяются два основных метода получения эксперт­ных оценок:

Непосредственное прямое оценивание измеряемого свой­ства.

Приписывание оценки по измеряемому признаку на основе совокупности косвенных данных.

Прямое измерение. В простейшем случае оценка измеряемого признака экспертом производится путем выбора, как правило, одного ответа из серии предложенных или путем выбора одного числового балла из некоторой совокупности чисел. В качестве ин­дикатора данного свойства может служить вопрос, обращенный к эксперту: «Выполняет ли Иванов работу без брака?» При этом предполагаются варианты ответов: постоянно, довольно часто» ред­ко, никогда. Ответам приписываются числовые оценки — соответ­ственно 4, 3, 2,1. Иногда удобно для оценки измеряемого качества использовать графические шкалы. Такая шкала представляет со­бой отрезок прямой линии (например, длиной в 10 см), разделен­ный на равные части и снабженный словесными или числовыми обозначениями. Такова, например, методика Осгуда, которая пред­полагает выяснение семантической близости любых пар понятий.

Ранжирование объектов. Ранжирование объектов является другим широко используемым приемом измерения. При ранжи­ровании производится оценивание по измеряемому качеству со­вокупности объектов путем их упорядочивания по степени выра­женности данного признака. Первое место, как правило, соответ­ствует наиболее высокому уровню. Каждому объекту приписыва­ется оценка, равная его месту в данном ранжированном ряду. Например, для оценки добросовестности в конкретной группе можно попросить эксперта проранжировать (упорядочить) по этому качеству всех членов группы.

Метод парных сравнений. Сущность метода состоит в трм, чтобы предложить нескольким экспертам произвести сравнение объектов попарно, с тем чтобы установить в каждой паре наибо­лее значимый из них. Одним из главных требований к методике является тщательная формулировка инструкции для экспертов, где суть заданий должна быть изложена просто и ясно. Напри­мер, требуется шести экспертам оценить пять человек по степени их добросовестности. Обозначим каждого оцениваемого индиви­да символами A1A2A3A4AS. Из символов образуем всевозмож­ные пары: (Aj А_), (А_ А,) и т. д. Всего.таких парных комбинаций получится 10. Выделенные пары, предъявляются экспертам на отдельных карточках так, чтобы один и тот же индивид не появ­лялся подряд в двух последовательно идущих карточках. Резуль­таты опроса сводятся в таблицу. К сожалению, при большом ко­личестве объектов сравнения данный метод оказывается громозд­ким и в практическом смысле малопригодным.

Метод равных интервалов. Основная идея и отличие данного метода от метода парных сравнений заключается в том, что боль­шой список суждений об изучаемом объекте оценивается эксперта­ми, которые, располагают признаки (суждения) в фиксированное число категорий (обычно равное 7, 9 или 11), ранжированных по степени предпочтения. Интервалы между категориями должны быть субъективно равными, т. е. эксперту должно казаться, что разли­чия по степени предпочтения между суждениями любых двух смеж­ных категорий равны. При создании оценочной шкалы на основе данного метода прежде всего сюуществляется сбор несколько сот различных мнений, связанных с объектом оценки. В задачу иссле­дователя входит получение всевозможных оттенков мнений по ин­тересующему вопросу, причем формулировки этих мнений должны быть самыми разнообразными по своему словарному запасу.

Например, если исследуется отношение студента к учебе в учебном заведении, то могут быть высказаны такие суждения.

Ø Учусь, потому что хочу больше знать.

Ø Все учатся, и я учусь.

Ø Учусь, потому что интересно.

Ø Учиться заставляют близкие.

Ø Я и сам не знаю, зачем учусь.

Ø Это позволит исполнить мою мечту, овладеть желаемой профессией.

Ø Учусь, чтобы иметь возможность и дальше продолжить об­разование.

Ø Учеба позволит мне достигнуть материального благополу­чия (и т. д.).

Из выписанного списка суждений отбирается 100 и более, которые по возможности равномерно покрывают весь континуум установки: от мнений, выражающих крайнее положительное от­ношение к объекту установки, до мнений, выражающих крайнее отрицательное отношение к этому объекту. Особое внимание уде­ляется формулировке нейтральных мнений. При отборе сужде­ний необходимо руководствоваться следующими правилами:

Ø суждения формулируются в утвердительной форме и долж­ны выражать сиюминутную психологическую установку ис­пытуемого, не смешивая ее с отношением к тому же объек­ту в прошлом;

Ø каждое суждение должно быть достаточно кратким, чтобы не утомлять опрашиваемых;

Ø суждения должны быть сформулированы таким образом, чтобы их можно было принять или отвергнуть, и выражать они должны одну, а не несколько идей, необходимо избе­гать утверждений, по отношению к которым большинство респондентов не имеют определенного мнения;

Ø суждения должны иметь такую форму, чтобы согласие или несогласие с ними указало на их отношение к объекту уста­новки;

Ø суждения не должны быть двусмысленными или неопреде­ленными;

Ø характер суждений не должен быть фактическим;

Ø необходимо исключать утверждения, которые могут быть приняты как теми, кто имеет отрицательное отношение к объекту установки, так и теми, кто имеет положительную установку.

Далее каждое утверждение, отобранное по перечисленным выше критериям, заносится на отдельную карточку и затем предъявляется группе экспертов для упорядочения. Экспертов просят независимо друг от друга разложить карточки на 7, 9 или 11 групп так, чтобы в группу с наибольшим номером помеща­лись карточки с утверждениями, которые соответствуют макси­мально положительной установке индивида, в первую группу помещаются карточки с утверждениями, соответствующими мак­симально негативной установке к объекту исследования, в сред­нюю группу помещаются карточки с нейтральными утверждени­ями. Необходимо обращать внимание на то, чтобы расстояния между любыми двумя соседними группами карточек были субъек­тивно равными.

После того как сортировка карточек произведена, необхо мо оценить каждое суждение с точки зрения его соответств шкале, отобрать наиболее приемлемые и установить вес сух ния на шкале — присвоить определенное числовое значение.

Метод суммарных оценок (шкала Лайкерта). Суть метода: гр- пе лиц даются вопросы, которые должны оцениваться по 5-балльн системе в отношении согласия с этими вопросами (суждениями);

— полностью согласен;

— согласен;

— нейтрален;

— не согласен;

— полностью не согласен.

Баллы одного лица относительно всех вопросов суммируютА ся. Полученная сумма — балл этого лица. Затем лица ранжиру­ются по баллам.

Шкалограммный анализ Гуттмана. Эта техника связана с построением одномерных шкал, т. е. шкал, не затрагивающих вопросов или не включающих факторов, посторонних по отног. нию к измеряемой характеристике. Основная идея метода состой ит в том, что шкала должна состоять из иерархизированной системы вопросов, т. е. такой, в которой согласие с вышестоящим по иерархии суждением должно вести к согласию с нижестоящими суждениями. Например, утверждение о том, что кандидатА имеет высшее образование, говорит о том, что он учился в вузе, Щ также о том, что он закончил среднюю школу.

К сожалению, все экспертные методы получения внешних критериев имеют общие недостатки, которые являются источвдщ ком ошибок измерения соответствующих показателей профессиональной успешности. К ним прежде всего относится так называемый «галло-эффект», состоящий в тенденции оценивать человека v сходным образом по нескольким независимым шкалам в зависимо­сти от общего (благоприятного или неблагоприятного) отношения оценивающего к оцениваемому. Галло-эффект есть следствие несло-. собности к дифференциации различных особенностей личности,подлежащих оценке. Он проявляется в высоких корреляциях оценок различных аспектов профессиональной деятельности. Галло-эффект может быть также следствием небрежности. Другим существенным недостатком являются различия в распределении оценок, даваемых разными экспертами. Одни склонны к их за­вышению, другие — к занижению. Поэтому один и тот же балл у разных экспертов может иметь различное значение. Отсюда сле­дует, что баллы различных экспертов не могут суммироваться и усредняться.

Указанные недостатки явились причиной поиска более совер­шенных способов оценки. Один из них — дополнение баллов опи­санием типичных особенностей поведения, соответствующих раз­личным градациям показателя профессиональной успешности. Это позволяет в некоторой степени стандартизировать значение бал­льных оценок и уменьшить ошибки измерения, связанные с раз­личным толкованием баллов. Существуют также другие способы улучшения экспертных оценок, описание которых можно найти в специальной литературе.

Резюмируя сказанное, отметим некоторые правила, следуя которым, можно добиться снижения искажений внешнего кри­терия на основе экспертных оценок:

Ø особенности личности, подлежащие оценке, должны быть определены достаточно четко и однозначно;

Ø если необходимо оценить группу испытуемых по несколь­ким свойствам, то рекомендуется оценивать всю группу по­очередно по каждому свойству личности (не рекомендуется оценивать испытуемого сразу по всем свойствам, так как это усиливает галло-эффект);

Ø рекомендуется разъяснить экспертам сущность галло-эффекта и подчеркивать необходимость его устранения;

Ø достоверность измерения повышается при обобщении неза­висимых оценок нескольких экспертов;

Ø подготовленные и обученные эксперты дают более досто­верные оценки;

Ø точность оценок выше при продолжительном наблюдении, проводимом в различных обстоятельствах и ситуациях.

В заключение следует отметить, что к внешним критериям, независимо от метода их получения, предъявляется ряд общих требований.

Прежде всего они должны быть релевантными, т. е. обеспечи­вать значимость критерия как показателя эффективности про­фессиональной деятельности. Избранные критерии должны от­ражать все значимые стороны профессиональной деятельности (полнота критерия). Критерии должны проверяться на надеж­ность, т. е. на устойчивость, стабильность характеристик профес­сиональной деятельности. Надежность может оцениваться кор­реляцией повторных замеров критерия, проведенных с различ­ными интервалами времени. Выбранный критерий должен раз­личать специалистов с высокой и низкой профессиональной при­годностью (дискриминантность критерия).

В настоящее время многие авторы считают неприемлемыми глобальные оценки профессиональной пригодности. Установле­но, что показатели профессиональной успешности зависят не от одного, а от нескольких факторов. Считается, что каждый фак­тор профессиональной успешности должен прогнозироваться от­дельно, а заключение о пригодности должно выноситься с учетом всех факторов профессиональной деятельности.

Необходимо учитывать также динамичность критериев, ко­торая состоит в изменении их факторной структуры и валид­ности тестов относительно различных периодов становления профессиональной деятельности. Динамичность критериев свя­зана с изменением психофизиологической и психологической структуры навыков и приемов работы в процессе обучения и накопления последующего профессионального опыта. Практи­ческое значение динамичности критериев состоит в том, что прогноз профессиональной успешности в различные периоды обучения и деятельности может быть связан с показателями различных тестов.

Стандартность процедуры тестирования

Понятие «тест» имеет два основных толкования. Одно из них рассматривает тест как эмпирико-аналитическую процедуру, удов­летворяющую критериям научного познания. Другое — как сис­тему заданий, предъявляемых испытуемым с целью получения надежной и валидной информации об интересующих признаках. Первое толкование имеет меньшее распространение, для его вы­ражения чаще используется термин «тестирование», понимаемое как стандартизованное измерение индивидуальных различий. Собственно «тест» рассматривается как средство для осуществле­ния этого измерения. Тест представляет собой стандартный на­бор заданий и должен применяться в стандартных условиях:

Ø всем испытуемым должны предъявляться одинаковые стимулы и предоставляться одинаковый набор возможных ре­акций;

Ø указания и инструкции сообщаются испытуемым одинако­вым образом, желательно письменно;

Ø текст указаний должен быть построен в простых выраже­ниях, доступных пониманию всех;

Ø ни одному испытуемому не должно даваться никаких пре­имуществ перед другими;

Ø заранее разработанная система оценки тестовых результа­тов применяется ко всем испытуемым без исключения;

Ø тестирование различных групп испытуемых должно прово­диться по возможности в одинаковое время дня; в сходных условиях;

Ø в процессе тестирования нежелательно присутствие посто­ронних лиц, особенно представителей администрации, пе­дагогов и других значимых (для испытуемого) лиц;

Ø эксперт не должен делать пояснений в процессе тестиро­вания;

Ø инструкция и смысл каждого задания должны быть по­нятны каждому испытуемому (соответствие теста этомутребованию должно тщательно проверяться на этапе его создания);

Ø в сравнительных исследованиях необходимо стремиться к выравниванию групп по уровню мотивации (различная мо­тивация, как недостаточная, так и чрезмерная, дает сме­щенные результаты).

Данные тестирования обрабатываются на ЭВМ по стандарт­ным статистическим программам. Высокий уровень стандартиза­ции на всех этапах сбора и обработки информации обеспечивает сопоставимость тестовых результатов и возможность содержатель­ного анализа данных.

Анализ результатов тестирования строится на основе пред­ставлений о сущности теста, о его связи с теми явлениями, кото­рые предполагается оценить. Тесты могут быть предназначены для измерения одного (гомогенные шкалы) или нескольких (ге­терогенные шкалы) признаков. Качество теста зависит от содер­жания заданий и от структуры теста. Каждое задание, входящее в состав теста, является эмпирическим индикатором того свой­ства, на оценку которого направлен данный тест или данная шкала гетерогенного теста. Количество эмпирических индикаторов, не­обходимое дли получения достоверной оценки исследуемого при­знака, определяется исходя из двух положений:

точность измерения, как правило, увеличивается с увели­чением количества заданий;

значительное увеличение количества заданий приводит к развитию смещения тестовых результатов, связанному со снижением мотивации обследуемых, утомлением, отвлече­нием внимания..

Для гомогенного теста количество заданий считается:

минимальным — 10;

достаточным — 23-29; |

практически оптимальным — 30-40;

теоретически желаемым — свыше 40.

В гетерогенном тесте, состоящем из т гомогенных шкал, при­мерное число заданий увеличивается в т раз.

Тесты вызывают у разных людей различное отношение: пози­тивное, негативное, смешанное, индифферентное.

Достоверность результатов измерения во многом зависит от желания испытуемого сотрудничать с экспертом. Важнейшую роль в формировании этого желания играет инструкция. Стиль текста инструкции должен быть выдержан в уважительном, приглаша­ющем, располагающем тоне. Истинная цель и подлинные задачи исследования испытуемым сообщаются в общих выражениях, в более абстрактных понятиях по отношению к предмету измере­ния, но из той же области знаний. Излишняя конкретизация может вызвать искажение результатов за счет установочного по­ведения испытуемых. Инструкция должна быть краткой, ясной и полной, охватывать все основные вопросы поведения испытуе­мых в процессе тестирования.

Требование ясности и понятности относится и к самим тесто­вым заданиям/ Особенно это касается опросников и анкет. Вы­сказывания должны быть по возможности короткими, содержать не более одного придаточного предложения. Они не должны вы­зывать необходимости пояснений и уточнений., В инструкции следует подчеркнуть, что на тестовое высказывание надо отве­чать в общем, не вдаваясь в излишние детали и конкретизацию. Высказывания не должны содержать узконаучных терминов, иностранных слов, малораспространенных оборотов речи. Неже­лательно использовать в тестовых высказываниях обороты с от­рицанием «не», например: «Не думаю, что родители всегда пра­вы». В этом случае испытуемый, считающий, что родители все­гда правы, должен ответить «неверно», т. е. осуществить логи- v ческую операцию «двойное отрицание». Это значительно затруд­няет работу с опросником и повышает вероятность выбора оши­бочного ответа. В каждом высказывании должно утверждаться что- нибудь одно, поскольку отношение испытуемого к различным эле­ментам перечня (например: «Мне нравятся книги Л. Толстого,А. Чехова и И. Тургенева») может быть различным, а ответ «вер­но» предполагает положительное отношение ко всему перечис­ленному.

Имеет значение форма, в которой представлены тестовые вы­сказывания. Например, испытуемые более охотно и искренне ра­ботают с опросниками, в которых тестовые высказывания сфор­мулированы не в виде вопросов, а в виде суждений, к которым предлагается выразить свое отношение («согласен» — «не согла­сен»). Такая формулировка позволяет несколько снизить защит­ную реакцию испытуемых, вызванную попыткой вторжения в их внутренний мир.

Вопросы или тестовые высказывания могут быть «закрыты­ми» и «открытыми». В 1-м случае испытуемому предлагаются уже сформулированные варианты ответов, из которых необходимо выбрать один правильный. Количество ответов на каждое выска­зывание колеблется» как правило, от 2 до 7. «Ступенчатость», конкретная градуировка шкалы ответов определяется задачей исследования*, характером изучаемого признака, содержанием тестовых высказываний и особенностями методов предполагае­мой статистической обработки. «Открытые» тестовые высказы­вания предполагают получение ответа в произвольной форме, испытуемые не ставятся в ситуацию вынужденного выбора.

Тесты должны быть сбалансированы по числу позитивных и негативных высказываний. В противном случае, у испытуемых развиваются защитные реакции по типу «лакировки» действи­тельности или преподнесений себя в более выгодном свете.

3.4. Надежность и валидность тестов

Надежность и валидность психодиагностических тестов явля­ются основными критериями качества методик и возможности их использования в профессиональном отборе. В психодиагности­ке термин «надежность» означает устойчивость или постоянство оценок, получаемых испытуемым при повторных исследованиях.

Надежность и валидность измеряются статистически. Существу­ют следующие подходы к оценке надежности тестов.

Повторное тестирование (тест-ретест надежность) — проведе­ние повторного обследования через определенное время (1-3 ме­сяца) и сопоставление полученных результатов. Если результаты изменились — проводится статистическая проверка: расчет сред­них значений, оценка достоверности различий, вычисление коэф­фициента корреляции. При отсутствии статистически значимых различий распределений оценок при 1-м и 2-м обследованиях и наличии высокой корреляционной связи между этими оценками можно утверждать, что тестовые результаты являются устойчивы­ми, стабильными и воспроизводимыми. Коэффициент корреляции в этом случае называется коэффициентом надежности (г.х).

Параллельное тестирование — проведение обследования с ис­пользованием параллельных (эквивалентных) форм теста и сопо­ставление полученных результатов. Получаемый в этом случае коэффициент надежности обычно называется коэффициентом эквивалентности. Если интервал между предъявлением параллель­ных форм был достаточно велик (дни, недели й т. д.), этот коэф­фициент называется коэффициентом эквивалентности и ста­бильности. Трудность этого подхода связана с необходимостью разработки эквивалентных форм тестов и доказательства тожде­ственности оценок, получаемых с их помощью. Эквивалентные формы должны быть выровнены по содержанию (психологичес­кому смыслу) каждого тестового высказывания, по внутренней структуре связей тестовых высказываний, по значениям средних и дисперсий тестовых оценок.

Метод раздельного коррелирования — разделение теста на две эквивалентные части и сопоставление результатов выполнения каждой из этих частей. Коэффициент корреляции между резуль­татами выполнения отдельных частей называется коэффициен­том внутренней состоятельности теста (г1/2). Метод раздельного коррелирования может быть применен не только для половин теста, но и для отдельных тестовых заданий.

Надежность — необходимый, но недостаточный критерий ка­чества психодиагностического теста. Важное значение имеет вто­рой критерий — валидность теста. В общем виде валидность рас­сматривается как способность теста измерять то, что он должен измерять по замыслу. Понятие валидности поэтому относится не столько к самому тесту, сколько к цели, условиям и процедуре его применения. Тест может быть надежным, но невалидным для той или иной цели. Валидные тесты — обязательно надежны. Про­блема валидности решается только путем эмпирической провер­ки соответствия тестовых результатов фактам действительности. Сложность проблемы валидности в психодиагностике заключает­ся в том, что получение достоверных фактов о психических явле­ниях представляет собой трудную задачу, т. е. в данной области исследований факты действительности не являются такими оче­видными, как, например, в геометрии или физике. На начальных этапах развития психодиагностики распространенным способом обоснования валидности тестов являлись ссылки на мнение извес­тных ученых, которые, в свою очередь, основывались на собствен­ной интуиции. Такой подход называется «валидизация по автори­тету». Ограниченность этого подхода вполне понятна. Субъекти­визм, даже подкрепленный авторитетом, остается субъективизмом.

Научный подход к валидизации тестов основывается в пер­вую очередь на анализе соответствия между содержанием теста и сущностью изучаемой (с помощью этого теста) проблемы. Содер­жание теста, смысл тестовых высказываний должны быть наце­лены на выявление специфических черт, имеющих отношение к оцениваемому свойству, отражать существенные стороны иссле­дуемого признака. Репрезентативность (представительность) со­держания теста в структуре исследуемого признака рассматрива­ется как основа валидизации теста по содержанию. Исследова­ние того или иного явления с помощью тестов осуществляется, как правило, не «в лоб», не путем прямых вопросов, а по косвен­ным признакам, по некоторым эмпирическим индикаторам. Ес­тественно, качество теста будет зависеть от того, насколько полно представлены основные стороны исследуемого признака этими эмпирическими индикаторами.

Концептуальная валидность является мерой соответствия пока­зателя теста теоретическим представлениям о сущности измеряе­мых свойств. Исходным пунктом концептуальной валидизации слу­жит анализ основных понятий. Одним из методов такого анализа является операционализация понятий. Операционализация позво­ляет расчленить, уточнить и детализировать основное понятие, по­ставить ему в соответствие некоторый набор понятийных и эмпири­ческих индикаторов. Следующим этапом валидизации служит при­менение приемлемых эмпирических методов подтверждения соот­ветствия выработанной концепции реальной действительности. Од­ним из широко распространенных средств структурирования эмпи­рических индикаторов является факторный анализ, позволяющий выделить в нагромождении разрозненных фактов определенную более или менее непротиворечивую логическую структуру. Если большин­ство концептуально выделенных индикаторов (тестовых высказы­ваний) образуют концептуально предполагавшиеся факторы-поня­тия, то результат факторного анализа следует рассматривать как подтверждение концептуальной валидности теста.

Критериальная валидность указывает на соответствие тестовых показателей определенным оценкам успешности профессиональной деятельности — «внешнему критерию». Можно выделить три эм­пирических подхода к валидизации тестов по внешнему критерию.

Прогностический подход — тестирование кандидатов, посту­пающих на работу, и сопоставление тестовых результатов с ре­зультатами овладения профессией и успешностью последующей профессиональной деятельности. Мерой критериальной, в дан­ном случае — прогностической валидности будет являться коэф­фициент корреляции между тестовыми оценками и показателя­ми трудовых достижений. Высокие значения коэффициента ва­лидности указывают на возможность применения данного теста для прогнозирования профессиональной пригодности кандидатов к той или иной деятельности.

Прогностическая валидность ограничена тем интервалом вре­мени, который разделяет момент обследования и момент получе­ния оценок внешнего критерия. Этот интервал называется глу­биной прогноза.

Конкурентный подход — тестирование работающих специа­листов и сопоставление тестовых оценок с трудовыми достиже­ниями испытуемых. Мерой конкурентной валидности также яв­ляется коэффициент корреляции. Высокие значения этого коэф­фициента указывают на валидность тестов в отношении измере­ния имеющихся трудовых достижений специалиста. Предпола­гается, что эти же тесты должны быть валидными в отношении прогнозирования трудовых достижений кандидата на работу.

Третий подход основывается на сравнении тестовых резуль­татов в известных контрастных {полярных) группах. Если те­стовые результаты в этих группах достоверно различаются, то можно с определенной вероятностью предполагать, что тест обла­дает дискриминантной способностью и позволяет различать «луч­ших» и «худших» по интересующему признаку (например, по успешности профессиональной деятельности).

Валидность теста обладает ситуационной специфичностью. Рассчитанная в определенных условиях, на основе сопоставления с конкретным критерием успешности деятельности, она может существенно изменяться при отклонении от этих условий, при использовании другого критерия. Установление ситуационной спе­цифичности валидности послужило импульсом для разработки теоретической концепции синтетической валидности. Эта концеп­ция заключается в поиске соответствия тестовых оценок не гло­бальным критериям успешности профессиональной деятельности, а частным критериям, показателям успешности выполнения от­дельных операций (действий), устанавливаются весовые коэффи­циенты вклада отдельных элементов деятельности в общий ре­зультат деятельности. После этого так называемые «элементные» валидности синтезируются в оценку валидности относительно гло­бальных критериев профессиональной успешности.

Вопросыдля самоконтроля

4. Дайте определения и приведите классификации професси­онально важных качеств.

5. Какие критерии успешности профессиональной деятельно­сти специалистов вы знаете?

Задание для самостоятельной подготовки

Используя приведенные в предыдущих темах методики пси­хологического и психофизиологического обследования, самосто­ятельно подберите батарею тестов, наиболее полно оценивающих специалистов по составленной вами профессиограмме.

Используя методику экспертной оценки успешности про­фессиональной деятельности (с. 507), оцените эффективность ра­боты ваших специалистов.

Вопросы для тестового контроля знаний

1. Объективные измерения психологических и психофизио­логических показателей называются:

а) 1,-данные;

б) Q-данные;

в) Г-данные;

г) все ответы верны;

д) все ответы неверны.

2. Процедура создания методики оценки профессиональной пригодности включает:

а) анализ профессиограммы;

б) разработку новых или адаптация известных тестов измере­ния и оценки ПВК;

в) разработку методов регистрации параметров деятельности (сбора) внешних критериев;

г) разработку нормативно-оценочных шкал ПВК и шкалы (шкал) профессиональной пригодности;

д) все ответы верны;

е) все ответы неверны.

3. Тенденция оценивать человека сходным образом по несколь­ким независимым шкалам в зависимости от общего (благоприят­ного или неблагоприятного) отношения оценивающего к оцени­ваемому называется:

а) шкалограммный анализ Гуттмана;

б) шкала Лайкерта;

в) галло-эффект;

г) метод равных интервалов;

д) метод парных сравнений;

е) все ответы верны;

ж) все ответы неверны.

4. Оптимальное количество заданий для гомогенного теста составляет:

а) 10;

б)23-29;

в) 30-40;

г) свыше 40.

5. Надежность психодиагностических тестов проверяется ме­тодами:

а) повторного тестирования, параллельного тестирования, раз­дельного коррелирования;

б) оценки теста по содержанию, концептуальному соответствию показателя теста теоретическим представлениям о сущности из­меряем



Поделиться:


Последнее изменение этой страницы: 2017-01-26; просмотров: 392; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.219.22.107 (0.113 с.)