История: скорость реакции - от хронометрических экспериментов до мысленного вращения 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

История: скорость реакции - от хронометрических экспериментов до мысленного вращения



В психологической литературе понятие скорости реакции впервые упоминается в работе Ф. К. Дондерса, датского физиолога, который установил, что продолжительность психического явления можно определить, найдя разницу между скоростями реакций, получаемых при выполнении различных видов заданий (Boring, 1950). Его идея породила водопад исследований, посвященных явлению, сегодня известному как «психическая хронометрия». Сначала исследователи измеряли скорость простой сенсомоторной реакции (ПСР) - скорость однократной реакции, полученной сразу за предъявлением однократного стимула, например сигнала красного цвета. Далее они усложняли задание, показывая поочередно два стимула и предлагая испытуемому отвечать только на один из них. Это получило название скорости реакции выбора (РВ), так как испытуемому требовалось сначала дифференцировать стимулы, например красный и зеленый сигналы, а затем отвечать на один из них. СДР включает СПР плюс время психического явления «дифференциации», поэтому было решено, что найдя разность СДР и СПР можно получить продолжительность этого психического явления:

РВ = ПСР + дифференциация; дифференциация = РВ - ПСР.

Процедуру можно разрабатывать и дальше, получая более дробные разности психических явлений - этот процесс очень воодушевлял исследователей конца XIX в., так как в то время они пытались заявить психологию как науку, а что может быть более научным, чем измерение психических явлений с точностью до долей секунд? Особенно высокой популярностью эта процедура пользовалась в лаборатории Вундта в Лейпциге, и как видно из рис. 4.3, она была быстро импортирована в Соединенные Штаты. На рисунке показан ход эксперимента по измерению скорости реакции, проводящийся в Университете Кларк в начале 1890-х гг.

К сожалению, вскоре обнаружились серьезные проблемы. В частности, в одних случаях скорость реакции была ниже, чем предсказывалось, а в других выше. Освальд Кюльпе, один из студентов Вундта, отметил главнейшую ошибку метода - более сложные психические явления не образуются из простых в результате их простого суммирования. Напротив, сложные психические явления обладают присущими только им качествами, которые не являются суммой более простых.

Хотя доводы Кюльпе быстро положили конец психической хронометрии и дискредитировали измерение скорости реакции как метод еще в период расцвета бихевиоризма (приблизительно 1930-1950 гг.), впоследствии она пережила возрождение в некоторых областях когнитивной психологии. Возникла идея применять психическую хронометрию не для измерения точной продолжительности психических явлений, а для проверки предположений, сделанных на основе когнитивных теорий. Хороший пример тому - феномен мысленного вращения. Ше-пард предположил, что если участники применяют мысленное вращение, то эта умственная активность должна занимать определенное количество времени (Shepard & Metzler, 1971). Поворот на больший угол должен занимать больше времени, и как вы могли убедиться, это действительно так.

Рис. 4.3. Эксперимент по изучению скорости реакции, проводившийся в Университете Кларк около 1892 г.

Ответная реакция выражалась в том, что участник, видя в трубе предъявляемый стимул, правой рукой

переставал нажимать на телеграфный ключ

Надежность

В целом измерение характеристик поведения считается надежным, если его результаты повторяются при повторном измерении. Скорость реакции является хорошим примером — высокая надежность была одной из причин многолетней популярности таких измерений. Человек, при первой попытке реагирующий на красный сигнал через 0,18 секунды, наверняка покажет ту же скорость при следующих попытках, и практически все попытки будут давать результаты, близкие к 0,18 секунды. К примеру, оценки теста GRE {Graduate Record Exam) также относительно надежны. Человек, получивший 850 за общий тест GRE, во второй раз, скорее всего, получит сходную оценку, и очень маловероятно, что его балл будет 1350.

Из этих двух примеров можно понять, почему надежность измерений настолько важна. Без нее невозможно было бы определить, что означают оценки, полученные при конкретном измерении. Предположим, измеряя скорость реакции, вы хотите узнать, насколько быстро реагирует конкретный человек. Если это время станет сильно изменяться от попытки к попытке, то на данный вопрос ответить будет невозможно. Аналогично, если разница в оценках теста GRE для одного человека может составлять 400 или 500 баллов, вузы не смогут использовать результаты этого теста, так как по ним нельзя будет предположить действительный уровень знаний студента.

Надежность измерения характеристик поведения — это функция от количества ошибок измерения. Если ошибок много — надежность низкая, и наоборот. Ни одно подобное измерение не является абсолютно надежным, так как все они содержат некоторое количество ошибок. Это означает, что результат измерения представляет собой гипотетическую истинную оценку плюс ошибку измерения. В идеале ошибка измерения настолько мала, что полученная оценка близка к истинной.

Процедура измерения скорости реакции хорошо иллюстрирует, что такое ошибка измерения и как она влияет на надежность. Как и в предыдущем примере, предположим, что скорость реакции человека составила 0,18 секунды. Является ли это истинным значением измеренной скорости? Нет, как несложно заключить из следующих результатов, полученных при измерении скорости реакции у того же человека:

0,16 с, 0,15 с, 0,19 с, 0,17 с, 0,19 с.

Результаты различаются, потому что каждая из попыток не обошлась без ошибки измерения. Эта ошибка вызвана различными факторами — некоторые из них действуют случайным образом от попытки к попытке. Например, при одной из попыток человек может реагировать быстрее, чем предполагает истинное значение, если будет ожидать появления стимула, или медленнее из-за кратковременного снижения внимания. Также может возникнуть систематическая ошибка, если, к примеру, перед тем, как предъявить стимул, экспериментатор дает участнику сигнал приготовиться, а время между этим сигналом и стимулом остается постоянным. В этом случае участник начнет предугадывать стимул и скорость реакции будет систематически выше, чем истинная оценка.

Несмотря на небольшую ошибку измерений, приведенные выше оценки неплохо соответствуют друг другу и измерение скорости реакции в этом случае будет считаться более надежным, чем при следующем наборе оценок, полученном вслед за результатом 0,18 секунды:

0,11с, 0,25 с, 0,19 с, 0,09 с, 0,31с.

При результатах, варьирующихся от одной десятой секунды до одной третьей, очень трудно установить действительную скорость реакции человека.

Если оценки надежны, то исследователь может в зависимости от их значений приписать им некоторый смысл. Надежность также позволяет исследователю делать более осмысленные сравнения одних оценок с другими. Например, сравнение первого набора оценок (0,16 с, 0,15 сит. д.) с нижеследующим обнаруживает разницу в общей скорости реакции:

0,23 с, 0,26 с, 0,21с, 0,22 с, 0,24 с.

Очевидно, что второй испытуемый реагировал медленнее, чем первый.

Есть разные способы вычисления надежности, но в экспериментальных исследованиях это редко проделывают. Уверенность в надежности измерений вырабатывается со временем в результате процесса их повторения. Например, процедура вырабатывания привыкания и измерение скорости реакции проводились достаточно часто и приносили весьма непротиворечивые результаты, так что исследователи убедились в их надежности.

Надежность вычисляется более строго в исследованиях, посвященных оценке адекватности всевозможных психологических тестов, разработанных для измерения таких конструктов, как личностные факторы, способности (например, IQ) и установки. Это обычно письменные тесты, в которых требуется отвечать на вопросы или что-либо утверждать/опровергать. В описанном выше исследовании булимии участницы заполняли различные тесты, в том числе так называемую шкалу восприятия поддержки. Анализ, призванный установить надежность такого вида тестов, требует применения корреляционных процедур. Например, участники могут выполнить тест в двух различных ситуациях, а далее будет определена степень сходства двух наборов оценок. Если не повлияют серьезные изменения, произошедшие в жизни участников, результаты двух измерений по шкале восприятия поддержки должны быть похожи. Степень сходства выражается в терминах корреляции (высокое сходство = высокая корреляция). В главе 9 будут более подробно объяснены особенности этого вида анализа и его значение для психологического тестирования в целом.

Валидность

Измерение характеристик поведения считается валидным, если измеряют именно то, что собирались. В ходе оценки восприятия социальной поддержки должно действительно измеряться количество поддержки, которую (по их мнению) получают испытуемые, а не какой-либо другой конструкт. Тест на интеллект должен измерять интеллект, а не что-то иное.

Иногда считается, что измерение обладает определенной валидностыо просто потому, что оно представляется разумным. При измерении интеллекта тест с задачами, требующими размышлений, представляется более подходящим, чем тест, в ходе которого участники должны аккуратно проехать на велосипеде между двумя белыми линиями. Это значит, что решение задач и рассуждения имеют большую очевидную валидность для измерения интеллекта, чем езда на велосипеде (которая обладает очевидной валидностыо для определения способности к удержанию равновесия). Но конечно, только очевидной валидности недостаточно — тест может выглядеть весьма разумным, но при этом не быть валидным. Большинство опросов, которые публикуются в популярных журналах, попадают именно в эту категорию.

Более строгий вид валидности называется критериальной валидностью. Она показывает: а) можно ли на основании измерения предсказать будущее поведение и б) связано ли это измерение с другими измерениями поведения. Например, чтобы тест на уровень интеллекта был валидным: а) должно быть возможным на его основании предсказать успеваемость ребенка в школе и б) его результаты должны быть сходны с результатами других известных тестов по измерению уровня интеллекта. Валидность названа «критериальной», потому что результаты рассматриваемых измерений сопоставляются с некоторым значением или критерием. В данном примере критериальными переменными являются: а) будущие оценки в школе и б) оценки по существующим тестам на интеллект. Так же как оценка надежности, исследование критериальной валидности корреляционное по своей природе и проводится в первую очередь для оценки психологических тестов. В главе 9 вы снова встретитесь с этим вопросом.

Еще один вид валидности — конструктная валидность — особенно подходит для экспериментальных исследований. Она имеет отношение сразу к двум вопросам: является ли оцениваемый конструкт валидным, а инструмент, с помощью которого производится оценка, — наилучшим. Конструктная валидность тесно свя-

зана с сущностью теории, построением гипотезы на основании теории и оценкой теорий, выведенных из результатов исследования. Конструктная валидность как таковая никогда не подтверждается и не разрушается одним исследованием, а также ее невозможно доказать по тем же причинам, по каким невозможно доказать теорию. Уверенность в конструктной валидности растет постепенно по мере получения исследованиями подтверждающих результатов.

Как мы видели, аппарат психологии насыщен конструктами, которые не могут наблюдаться непосредственно, — такими понятиями, как голод, тревожность, интеллект, депрессия, воспринимаемая социальная поддержка, объем внимания и т. д. Так как эти конструкты являются гипотетическими, их наличие может быть выведено только из специально проведенных измерений. Исследование, в котором проводится измерение конструкта определенным образом и которое дает ранее предсказанные результаты, подтверждает не только сам конструкт, но и инструмент, использованный для его измерения.

Пример 3. Конструктная валидность

Для примера конструктной валидности рассмотрим серию исследований, проведенных Уолтером Мишелем — ученым, занимающимся психологией личности, — и его коллегами. Мишель интересовался вопросом, почему дети бывают нетерпеливы, почему они иногда хотят чего-то «прямо сейчас» и почему им трудно ждать. Мишель придумал конструкт, который назвал «задержка удовольствия» и попытался разработать для него подходящий способ измерения. Его исследовательская программа показала, что задержка удовольствия валидна как конструкт и соответствует общей когнитивно-социальной теории личности, а также валидность разработанных им измерений.

Одно простое измерение, придуманное Мишелем, состояло в том, чтобы попросить детей выбрать между маленькой наградой, доступной в этот же момент, и большей, но при условии, что ее выдадут спустя некоторое время. Мишель предположил, что если неспособность к задержке удовольствия является неотъемлемой особенностью маленьких детей, то старшие дети должны охотнее ждать большую награду. Эти рассуждения привели к очевидному эксперименту (процитировано в Mischel, 1981), в ходе которого дети выполнили небольшое задание, а затем им сказали:

Я бы хотел раздать каждому из вас по конфете, но сегодня я взял с собой очень мало вот таких (показывая большую конфету). Поэтому вы можете либо взять такую (показывая маленькую конфету) прямо сейчас, или, если хотите, можете подождать такую (показывая), которую я принесу в следующий четверг (неделей позже).

Mischel, 1981, р. 164-165

Результаты подтвердили предположение Мишеля: немедленное (но маленькое) вознаграждение было выбрано 81% 7-летних, 48% 8-летних и 20% 9-летних детей.

Естественно, одного этого эксперимента недостаточно для того, чтобы установить валидность задержки удовольствия как конструкта или процедуры измерений, предложенной Мишелем, поэтому он продолжил разработку серии экспериментов, исследуя возможные взаимосвязи между изучаемым конструктом и другими признанными конструктами. Например, он обнаружил, что дети, решившие

отложить удовольствие, были также эмоционально более зрелыми, сильнее нацелены на успех, вероятность делинквентности для них была ниже, а вероятность стать социально ответственными — выше (Mischel, 1981). Таким образом, на основании ряда исследований, результаты которых подтвердили сделанные предположения, задержка удовольствия была признана валидным конструктом.

Надежность и валидность

Чтобы измерение имело ценность для психологического исследования, оно должно обладать одновременно и надежностью, и валидностью. Надежность важна для формирования уверенности в том, что проводимое измерение приближает к истинному значению, а валидность важна, так как она указывает, что измеряется именно то, что вы предполагаете. Обратите внимание, что валидность предполагает надежность, а обратное не верно. Надежные измерения могут не быть валидными, но валидные должны быть надежными.

Проиллюстрировать это можно на простом примере. Из главы 1 вы получили некоторые сведения о френологии — популярной в XIX в. теории, утверждающей, что можно определить «способности» человека по форме его черепа. После обсуждения проблемы надежности вы можете сделать вывод, что френологические измерения черепа действительно обладали высокой надежностью — расстояние между точкой, расположенной пятью сантиметрами выше вашего левого уха, и другой, находящейся пятью сантиметрами выше вашего правого уха, не сильно изменится от измерения к измерению. Однако утверждение, что при измерении определяется «деструктивная» способность человека, — это совсем другое дело. Мы уверены, что измерение черепа не является валидным измерением деструктивно-сти, поскольку оно не кажется нам разумным (очевидная валидность), на основании его невозможно предсказать проявление агрессивности (критериальная валидность), а также потому, что оно не согласуется с другими исследованиями конструктов, связанных с деструктивностью, таких как импульсивность, или исследованиями функций мозга (конструктная валидность).

Вопрос надежности и валидности имеет также этическую сторону, особенно если результаты измерений используются для принятия решений, касающихся жизни людей. Студентов принимают или нет в учебные заведения, людей берут или нет на работу, кому-то ставят психиатрический диагноз и предоставляют лечение — и все это на основании измерений способностей или оценки особенностей поведения. Если вы ищете работу и ваши оценки по некоторому тесту являются решающим показателем, то вы испытаете законное разочарование, узнав, что тест не был достаточно надежным и валидным.

И последнее замечание. В этой главе понятие валидности обсуждалось в контексте темы измерений. Как вы узнаете из следующей главы, валидными могут быть не только измерения психологических конструктов. Валидность также в более общем смысле характеризует весь исследовательский проект. По отношению к измерениям валидность означает, что используемый инструмент измеряет именно то, что должен. В более широком смысле валидность характеризует правильность проведения экспериментов и проверки гипотезы.

Виды шкал измерений

Результаты измерении характеристик поведения представляются в виде набора чисел. Мы говорим, что кто-то среагировал через 3,5 секунды, получил 120 баллов за /Q-тест или нашел выход из лабиринта третьим по счету. Мы также относим X человек к определенной категории в зависимости от их поведения или обладания некоторыми особенностями. Данные примеры иллюстрируют четыре числовых способа описания явлений, а следовательно, четыре шкалы измерений. Ясное понимания этих способов необходимо для дальнейшего обсуждения статистических методов, так как от вида используемой шкалы зависит вариант соответствующего статистического анализа данных. Именно неразбериха со шкалами измерений оказалась столь затруднительна для Дилберта, история которого изображена на рис. АЛ.

Номинальная шкала

Иногда численные характеристики, которые мы приписываем явлениям, служат только для того, чтобы разделить эти явления по группам. В этом случае мы используем так называемую номинальную шкалу измерений и числа являются не более чем ярлыками категорий (например, 15 мужчин, 25 женщин). В исследованиях с использованием этой шкалы люди обычно разделяются по категориям и далее подсчитывается количество людей, попадающих в каждую из них. Номинальную шкалу используют, если поставлены, например, такие эмпирические вопросы:

• Среди людей, занимающихся бегом, кто чаще бегает по утрам, а кто по вечерам, мужчины или женщины?

• Если разделить психически неуравновешенных людей на замкнутых и общительных, будут ли интроверты чаще испытывать состояние тревоги, чем экстраверты?

• Если разделить людей на ожидающих сильный электрический шок и на не ожидающих, повлияет ли это их ожидание на тенденцию к аффилиации?

Последний эмпирический вопрос был поставлен в хорошо известном эксперименте по социальной психологии, проведенном Стэнли Шехтером в 1959 г. Половине женщин, участвующих в исследовании, он сказал что в эксперименте будет изучаться психологическая реакция на сильный электрический шок, а остальным — что разряд будет очень слабым и станет щекотно. После того как женщин в обеих

группах проинформировали о предстоящем испытании, их попросили подождать 10 минут, пока настраивается оборудование, и спросили, как они предпочитают ждать, вместе с другими; в одиночестве, или же не имеют в этом отношении предпочтений. В действительности Шехтера интересовал ответ именно на этот вопрос, и эксперимент был окончен после того, как участницы высказались.

Шехтер изучал влияние состояния тревожности на конструкт, названный аф-филиацией (желание находиться вместе с другими). Каковы же были результаты? Те, кто ожидал сильного шока, предпочитали ждать вместе с другими, а те, кто ожидал слабого — в основном не имели предпочтений. Этот эксперимент иллюстрирует применение номинальной шкалы, поскольку Шехтер разделил все данные на шесть категорий и подсчитал количество людей, попадающих в каждую из них в зависимости от того: а) какой силы электрический разряд они ожидали получить и б) как они ответили на ключевой вопрос. Количество людей («подсчет частости») в каждой категории показано в табл. 4.2. Информация также переведена в проценты, что является обычным при использовании номинальных данных.

Таблица 4.2 Использование номинальной шкалы: исследование Шехтером аффилиации

 

  Количество людей, выразивших следующие предпочтения
  Ждать в одиночестве Ждать вместе с другими без предпочтений
Ожидающие сильный шок Ожидающие слабый шок 3(9%) 2(7%) 20 (63%) 10 (33%) 9 (32%) 18(60%)

Порядковая шкала

Порядковая шкала измерений представляет собой набор порядковых мест. Например, в списках успеваемости в колледжах обычно отражаются места студентов в группе: 1е, 2е, Зе, 50е и т. д. Из такого списка можно узнать, что один студент получает более высокие оценки, чем другой. Однако относительная позиция — это все, что можно узнать. Эд, Тед и Фред будут занимать соответственно 1-е, 2-е и 3-е места в каждом из двух приведенных ниже случаев, несмотря на то что оценки Эда заметно выше оценок Фреда и Теда только во втором случае:

 

Случай 1 Случай 2
Средний балл Эда = 4,0 Средний балл Эда = 4,0
Средний балл Фреда = 3,9 Средний балл Фреда = 3,6
Средний балл Теда = 3,8 Средний балл Теда = 3,5

Исследования, в которых используется порядковая шкала, пригодны для разрешения таких эмпирических вопросов:

• Если ребенок расположит пять игрушек в ряд в порядке убывания привлекательности, а затем ему дадут игрушку, занимающую третье место в ряду,

то увеличится или уменьшится порядковый номер этой игрушки в ряду спустя неделю игры с нею?

• Изменяется ли ранжирование студентами авторов учебников-ло естественнонаучным и гуманитарным дисциплинам, если они знают пол авторов?

• Как молодые и пожилые люди оценят и расположат в ряд 10 кинофильмов с разным количеством сексуальных сцен и сцен насилия?

Хороший пример использования порядковой шкалы — исследование Корна, Девиса и Девиса (Korn, Davis, and Davis), проведенное в 1991 г. Историков психологии и заведующих кафедр попросили назвать 10 психологов, чьи работы, по их мнению, наиболее важны, и расположить их в ряд. Требовалось составить два ряда: один из десяти психологов, лучших «во все времена», и другой — из современников. Затем результаты обобщили. Кто же был первым в списке? И историками, и заведующими кафедр самым выдающимся современным психологом был признан Б. Ф. Скиннер. При этом заведующие кафедр назвали Скиннера и лучшим психологом в истории, а историки, склонные предпочитать психологов более ранних периодов, поместили Скиннера на девятое место, а на первое — Вундта.

Интервальная шкала

В большинстве психологических исследований используется либо интервальная шкала измерений, либо шкала отношений. Интервальная шкала дополняет идею ранжирования принципом равных интервалов между ранжируемыми явлениями. Наиболее распространенный пример использования интервальной шкалы — психологические тесты личности, установок и способностей. Например, результаты теста интеллекта обычно представляются подобным образом. Некто, имеющий IQ 120, предполагается более умным (предположим, что IQ определяет умственные способности), чем тот, чей 1Q равен 110. Более того — и в этом заключается отличительная особенность интервальной шкалы — разница в интеллектуальных способностях двух людей с IQ 120 и 110 предполагается такой же, как разница между людьми с IQ 110 и 100. Другими словами, предполагается, что каждый шаг увеличения значения IQ отражает одинаковую степень увеличения интеллекта (интервалы равные). Обратите внимание на слово «предполагается» — некоторые психологи считают, что IQ (а также результаты большинства тестов личности) строятся по принципу шкалы отношений; они утверждают, что довольно трудно, если вообще возможно, в этом случае предполагать равные интервалы. Но большинство ученых считают, что IQ относится к интервальной шкале, хотя говорят так отчасти по прагматическим причинам: психологи любят использовать интервальную шкалу и шкалу отношений в основном потому, что структура данных этих шкал позволяет проводить более сложный статистический анализ.

В описанном ранее исследовании булимии использовались различные виды измерений (например, по шкале восприятия социальной поддержки), являющихся примером интервальной шкалы. Во вставке 4.2 рассматривается классическая серия экспериментов, в которых интервальная шкала использовалась при попытке показать влияние телосложения на тип личности.

ВСТАВКА 4.2



Поделиться:


Последнее изменение этой страницы: 2017-02-17; просмотров: 796; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.145.173.112 (0.047 с.)