Внешняя валидность: представленность изучаемой популяции 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Внешняя валидность: представленность изучаемой популяции



 

Эффективность любого из описанных нами экспериментов определяется тем, в какой мере его результаты можно распространить на интересующую исследователя популяцию: покупателей универсамов, курсантов, которые будут учиться сажать самолет Т-37, студентов, которым предстоит изучать испанский язык в высшей школе Постгейта. Нам понятно, что выборка испытуемых из популяции не может представлять последнюю безупречно. Такой она могла бы стать лишь в безупречном эксперименте, а он, как мы знаем, неосуществим. В эксперименте полного соответствия испытуемые фактически и были бы той популяцией, к которой затем будут применяться полученные результаты. С этой точки зрения внешняя валидность реального эксперимента зависит от того, насколько мы приближаемся к столь недостижимой цели благодаря своим способам отбора испытуемых.

 

Данный аспект вопроса о внешней валидности можно было бы обсуждать на примере эксперимента с привлечением одной и той же группы испытуемых для разных условий (когда оба условия предъявляются каждому испытуемому в последовательности АББА). Но мы продолжим анализ схем экспериментов с межгрупповым сравнением, это позволит нам лучше соотнести вопросы внешней и внутренней валидности.

 

Отбор из популяции

 

Популяций существует очень много. Многие будущие покупатели, летчики и студенты, которые будут изучать испанский, пока еще дети или даже не родились. С другой стороны, более и менее обширные популяции, из которых можно выбирать испытуемых, уже существуют, например все студенты Соединенных Штатов, начавшие изучать курс испанского языка. В одном из трех исследований этой главы — в эксперименте с мысленной тренировкой — использовалась относительно небольшая популяция. Но, конечно, курсантов на воздушной базе в Уильямсе гораздо больше, чем можно было привлечь в качестве испытуемых для эксперимента. Поэтому случайная стратегия применялась в этом случае не для распределения всех имеющихся в распоряжении курсантов, а для отбора экспериментальных групп из данной популяции.

 

Случайный отбор групп

 

Сейчас можно подробно описать процедуру отбора групп (с равным числом испытуемых для каждого из экспериментальных условий), которой воспользовался Пратер. Это четвертая схема межгруппового сравнения — случайный отбор групп.

 

Предположим, популяция включает 810 курсантов, и из нее надо отобрать 30 человек, по 15 в каждую экспериментальную группу. Как нужно действовать в этом случае? Сначала фамилии 810 курсантов записывают по алфавиту, и каждому присваивается порядковый номер от 1 до 810. Затем, как всегда, бросают игральную кость и определяют, с какой колонки таблицы 4.3 начать отбирать испытуемых. Выпадает, скажем, 5, и начинают с пятой колонки сверху (17—20). При этом в каждом числе учитывают только три последних знака из четырех. Первое число в колонке— 5993, и три последних знака дадут 993. Это число указывает вам порядковый номер курсанта, которого нужно отобрать для эксперимента. Но такого курсанта нет, их всего 810. Тогда нужно просто перейти к следующему числу—3508. Из алфавитного списка отбирается курсант под номером 508. Следующим будет курсант под номером 223 и т. д. до тех пор, пока из 810 курсантов не будут отобраны 30 человек для эксперимента.

 

Если номер случайно повторится, скажем, еще раз встретится 508, его нужно пропустить и перейти к следующему. Зачисляя курсантов поочередно в одну из двух групп, вы получите по 15 испытуемых для каждого экспериментального условия. Чтобы знать, сколько людей отобрано, лучше всего ставить цифру 1 около фамилии первого отобранного курсанта, 2—около второго и так к каждому до 30.

 

Оценка внешней валидности. Приведенная процедура обеспечит вам случайный отбор 30 испытуемых из популяции в 810 человек. Достаточно ли велика такая выборка? Это зависит от степени различий среди популяции курсантов по их способности учиться сажать самолет Т-37. Поскольку перед допуском к тренировочной программе курсанты проходят тщательную проверку, у нас есть все основания считать, что группа довольно однородна, слишком неудачных испытуемых в ней нет. Поэтому даже небольшая выборка из 30 человек может оказаться достаточной. Мы имеем право рассчитывать на результаты, близкие к результатам эксперимента полного соответствия, где в обоих экспериментальных условиях участвовали бы все члены популяции (эксперимент, впрочем, совершенно бесполезный). Популяция хорошо представлена выборкой испытуемых, поэтому внешняя валидность эксперимента (в данном смысле) удовлетворительна.

 

Однако всегда есть опасность, что при более широком распространении результатов внешняя валидность окажется нарушенной. Если распространить результаты эксперимента на будущих курсантов-пилотов, может возникнуть вопрос: представительна ли популяция из 810 курсантов, обучающихся сейчас, для популяции курсантов, которые будут учиться через несколько лет? Знать этого наверняка мы не можем, необходимо провести сравнение вступительных экзаменов, сопоставить оценки курсантов по тестам на способности и т. д. Если эти данные сильно изменяются, то эксперимент окажется несоответствующим по параметру испытуемых. Легко убедиться, что индивидуальные вариации — одна из тех «дополнительных» переменных, уровень которой должен всегда быть соответствующим. Этот случай хорошо сравнить с «неправильным» вариантом эксперимента Джека Моцарта, в котором тот пытался применить результаты, полученные на вальсах, к будущему разучиванию сонат. Там дополнительной переменной, находившейся на несоответствующем уровне, был тип музыки; здесь ею могут стать индивидуальные характеристики испытуемых.

Связь внешней и внутренней валидности при отборе из популяции

 

Схема межгруппового сравнения. При использовании схемы эксперимента, которая применялась в исследовании с мысленной тренировкой, когда разные экспериментальные условия даются разным группам испытуемых, существует связь между внешней и внутренней валидностью. Если не только вся выборка, но и отдельные группы испытуемых, отобранные для каждого из условий, достаточно хорошо представляют изучаемую популяцию, то эти группы можно считать эквивалентными. Едва ли они будут соответствовать популяции, не будучи подобными одна другой. Поэтому в экспериментах данного типа достижение внешней валидности (в отношении испытуемых) обеспечивает один из важных аспектов внутренней валидности. Ведь основным источником нарушения внутренней валидности в эксперименте с межгрупповым сравнением являются различия между испытуемыми каждой группы.

 

Напротив, для достижения внутренней валидности эксперимента, т. е. уравнивания групп испытуемых, участвующих в каждом из условий, вовсе не обязательно, чтобы эти испытуемые были представительной выборкой исследуемой популяции. Предположим, что для эксперимента отобрали тех 30 курсантов, которые первыми вошли в класс для занятий. После этого их можно разделять на две группы с помощью любого ранее описанного приема, в том числе путем случайного распределения, но представительной выборкой популяции курсантов они все равно не станут. Таким образом, мы видим, что подобие групп по индивидуальным характеристикам еще ничего не говорит о представимости популяции. Внешняя валидность эксперимента обеспечивает его внутреннюю валидность, но обратное отношение не сохраняется.

 

Схема интраиндивидуального сравнения. В эксперименте с сообщениями о ценах можно было бы использовать интраиндивидуальную схему. Каждый испытуемый мог бы пройти все три экспериментальных условия. Но между внешней и внутренней валидностью такого эксперимента не будет абсолютно никакой связи. Если выборка испытуемых хорошо представляет популяцию, то достигается высокая внешняя валидность. Однако внутренняя валидность индивидуального эксперимента нарушается главным образом за счет влияний предшествующих проб, различия задач и изменчивости поведения во времени. На представительность выборки эти факторы не влияют. Так что даже если тщательно контролировать их, это все равно не позволит улучшить репрезентативность выборки, т. е. внешнюю валидность эксперимента.

 

Послойный случайный отбор

 

Выделение слоев можно применять вместе со случайным отбором испытуемых внутри каждого слоя точно так же, как при случайном распределении слоев. Это дает пятую и последнюю схему эксперимента с межгрупповым сравнением — случайный отбор групп с выделением слоев. В эксперименте с мысленной тренировкой основанием для выделения слоев могут быть, например, оценки курсантов в тестах на пространственное воображение. Тогда по высоким, средним и низким оценкам в популяции из 810 курсантов можно было бы выделить три слоя по 270 в каждом. Из каждого такого слоя можно отобрать по 5 испытуемых для каждого из двух условий и, таким образом, получить выборку из 30 человек.

 

Если основание выделения слоев (здесь — оценка в тесте на пространственное воображение) связано с изучаемым видом деятельности (здесь — обучение сажать самолет Т-37), то данная процедура дает крупное преимущество. При одном и том же количестве испытуемых она обеспечит лучшую представленность популяции, и это повысит внешнюю валидность эксперимента. А поскольку применяется схема эксперимента с межгрупповым сравнением, то внутренняя валидность тоже будет выше.

 

Привлечение испытуемых, имеющихся в наличии

 

Если в эксперименте участвуют не случайно отобранные представители популяции, а уже имеющиеся в наличии, будь то специально привлеченные испытуемые («заложники») или добровольцы, то вопрос о репрезентативности выборки становится весьма серьезным. Мы его уже рассматривали, когда обсуждали репрезентативность группы курсантов-летчиков набора одного года по отношению к наборам будущих лет. То же относится и к воображаемому эксперименту с обучением испанскому языку. Могут ли 100 участников эксперимента представить всех будущих студентов, которые будут учить испанский? Часто такие ситуации достаточно постоянны, и поэтому подобные проблемы не слишком серьезны.

 

Но что вы скажете о 75 добровольцах как представителях популяции покупателей универсамов? Нет никаких оснований полагать, что такая группа представляет всех покупателей. Хотя возможно, как раз тот факт, что участники эксперимента намного превосходят всю популяцию покупателей по своей заинтересованности, свидетельствует о достоверности полученных результатов. Иначе говоря, если даже эти, в каком-то смысле самые лучшие, испытуемые не смогли успешно воспользоваться вычислительным устройством (условие Б), то не стоит надеяться, что в более обширной популяции покупателей это устройство окажется эффективным. Когда в эксперименте участвует явно не репрезентативная выборка, то лучше прямо об этом сказать.

 

Обзор схем межгрупповых сравнений

 

В этой главе мы встретили так много различных схем, что запомнить их все сразу довольно трудно. Вам поможет табл. 4.4. В ней представлена классификация этих схем согласно типам стратегий построения экспериментальных групп и типам набора испытуемых. Приводится также общая оценка каждой из шести схем: насколько успешно решаются в них проблемы внутренней и внешней валидности. Две ячейки в таблице не заполнены, так как соответствующие комбинации типа стратегий и типа набора испытуемых просто невозможны. Подбор пар и привлечение реальных групп имеют смысл только в случае распределения испытуемых, но не их отбора.

 

Вы видите, что стратегия подбора пар, а также случайного распределения и отбора с выделением слоев обеспечивает более высокую внутреннюю валидность, чем случайная стратегия. Это объясняется тем, что зачастую при одном и том же числе испытуемых можно сделать группы более эквивалентными. Хуже всего — сравнивать реально существующие группы, в их подобии никогда нельзя быть уверенным из-за множества побочных влияний. При отборе испытуемых из популяции стратегия послойного случайного отбора может обеспечить также более высокую внешнюю валидность по сравнению с обычной случайной стратегией. Нередко она позволяет лучше представить популяцию.

 

Таблица 4.4. Сводка и оценка межгрупповых схем для представления популяпии

Стратегия построения групп Валидность Тип привлечения испытуемых
    отбор распределение
Случайная Внутренняя Внешняя Хорошая Хорошая Хорошая Зависит от дополнительной информации
Попарная Внутренняя Внешняя – – Очень хорошая Зависит от дополнительной информации
Случайная с выделением слоев Внутренняя Внешняя Очень хорошая Очень хорошая Очень хорошая Зависит от дополнительной информации
Реальные группы Внутренняя Внешняя – – Плохая Плохая

При распределении групп мы не можем оценить внешнюю валидность эксперимента непосредственно. За исключением эксперимента на реальных группах: здесь приходится сомневаться уже в том, что группы представляют одну и ту же популяцию. При распределении выборки испытуемых по разным экспериментальным условиям для ответа на вопрос о внешней валидности эксперимента нужны дополнительные данные. Нам необходимо знать, адекватны ли такие значимые индивидуальные характеристики испытуемых, как возраст, образование, социальные и экономические условия их жизни, соответствующим характеристикам изучаемой популяции.

При оценке каждой из приведенных схем мы предполагали наличие достаточно большого числа испытуемых. Если число испытуемых слишком мало, то мала и надежда на хорошую представленность популяций (внешнюю валидность), да и достичь подобия групп (внутренней валидности) становится труднее.

 

КРАТКОЕ ИЗЛОЖЕНИЕ

 

В этой главе мы обсудили три новых эксперимента, для каждого из которых, в отличие от ранее описанных, привлекалось большое число испытуемых. Первый эксперимент посвящен способам информирования о ценах на продукты. Экспериментальная гипотеза состояла в том, что прямое сообщение о цене за единицу веса (путем маркировки пакетов) позволит покупателям выбрать более дешевую покупку точнее и быстрее, чем два другие способа: (1) сообщение о весе пакета и его общей цене (текущая практика) и (2) то же плюс использование специального вычислительного устройства. Гипотеза подтвердилась. Первое преимущество эксперимента данного типа по сравнению с индивидуальным экспериментом заключается в том, что его результаты, полученные на выборке испытуемых, распространяются на более обширную популяцию, а не только на поведение отдельного человека.

 

Во втором эксперименте проверяли гипотезу о том, поможет ли специальная мысленная тренировка улучшить навыки пилотов по выполнению посадочных операций. Было обнаружено, что курсанты, прошедшие такую тренировку, выполняли эти операции лучше тех, кто тренировался лишь по обычной программе. Второе преимущество экспериментов нового типа также связано с наличием большого числа испытуемых. Становится возможным использование схемы эксперимента с межгрупповым сравнением.

 

Эксперимент с мысленной тренировкой (в том виде, в каком он был представлен) требовал применения такой схемы. Схема группы индивидуальных экспериментов, когда каждый испытуемый участвует во всех экспериментальных условиях, здесь просто неосуществима. Один и тот же человек не может овладеть одним и тем же навыком двумя различными путями. Но даже там, где в принципе можно провести ряд индивидуальных экспериментов, как в эксперименте с сообщением о ценах, преимущества остаются за схемой межгруппового сравнения. Здесь устраняются такие источники нарушения внутренней валидности эксперимента, как эффекты последовательности и факторы задачи.

 

Детально описан третий эксперимент — с двумя методами обучения испанскому языку. Для его проведения было очень важно подобрать две группы испытуемых, сходных по способности изучать испанский. И тогда стало ясно, что эксперимент с межгрупповым сравнением, устраняя некоторые источники нарушения внутренней валидности, порождает еще один. Это — индивидуальные различия испытуемых. Описаны два вида таких различий. Во-первых, это такие очевидные характеристики, как пол, возраст испытуемых, их образование. Сюда же относятся различия, выявляемые с помощью тестов, скажем, на знание слов испанского языка. Кроме того, существуют несистематические различия испытуемых, которые включают как изменчивость поведения каждого человека, так и отличия в выполнении задания разными людьми. Во всех трех экспериментах с межгрупповым сравнением использовались схемы, устраняющие систематическое смещение независимой переменной с индивидуальными различиями испытуемых. Но если группы, работающие в разных экспериментальных условиях, имеют явные различия, скажем, взяты из разных школ, то такое смешение неизбежно. Надежность эксперимента повышается за счет привлечения большого числа испытуемых и сокращения несистематических вариации. Последнее обеспечивается тем, что условия работы каждого испытуемого в группе одинаковы, а также путем сокращения разброса данных каждого испытуемого, как описано в главе 2.

 

Существуют три стратегии составления групп испытуемых, позволяющие уравнять эти группы в отношении изучаемого вида деятельности: случайная стратегия, подбор пар и случайная с выделением слоев. Их иллюстрациями служат три схемы экспериментов с межгрупповым сравнением, в которых все имеющиеся в наличии испытуемые распределяются по группам для каждого из экспериментальных условий. При использовании схемы случайного распределения групп каждый испытуемый может с равной вероятностью попасть в одну из них. При попарном подборе групп испытуемые сначала располагаются по степени выраженности одной из характеристик, связанной с изучаемым видом деятельности. Испытуемые с одинаковой степенью выраженности этой характеристики попадают затем в разные группы. Применение схемы случайного распределения слоев начинают с классификации испытуемых по некоторому значимому признаку, также связанному с деятельностью которая исследуется в эксперименте. А затем внутри каждого класса, или слоя, проводится случайное распределение по экспериментальным группам. Все три метода устраняют систематическое смешение независимой переменной с индивидуальными различиями испытуемых. Надежность повышается за счет увеличения числа испытуемых. Если основа подбора пар или выделения слоев действительно связана с исследуемой деятельностью, то при одном и том же количестве испытуемых соответствующие стратегии позволяют обеспечить более высокую надежность по сравнению с обычным случайным распределением.

 

Чтобы результаты эксперимента можно было распространить на интересующую нас популяцию, выборка испытуемых должна быть репрезентативной. Эксперимент полного соответствия (неосуществимый на практике) потребовал бы участия в нем всей популяции. Внешнюю валидность эксперимента можно оценить потому, насколько близок к этой недостижимой цели метод отбора испытуемых. Хорошо представить популяцию в целом могла бы случайная выборка достаточно большого размера. Однако подходящие условия для такого выбора встречаются редко: часто исследуемая популяция целиком даже не существует в данный момент времени. Самым удачным из описанных исследований был в этом смысле эксперимент с мысленной тренировкой. Здесь можно было применить стратегию случайного выбора к популяции курсантов. Поскольку эксперимент проводился по схеме межгруппового сравнения с исследованием двух условий независимой переменной, использовались две случайные выборки. Здесь случайная стратегия применялась для отбора испытуемых, а не для распределения по группам, это имеет место, когда все имеющиеся в наличии люди должны участвовать в эксперименте. Эта схема называется схемой случайно отобранных групп.

 

Хотя для эксперимента с мысленной тренировкой было отобрано не очень много испытуемых, выборка успешно представляла изучаемую субпопуляцию, так как индивидуальные различия между курсантами были не слишком велики. Если же исследователь хочет распространить результаты эксперимента за пределы данной популяции, скажем, на курсантов следующих лет, то проблемы внешней валидности станут более серьезными. Возникнет вопрос о соответствии «уровней» субъектных характеристик изучаемой популяции и той популяции, к которой прилагаются полученные результаты.

 

Связь внешней и внутренней валидности была описана для экспериментов, в которых испытуемые отбираются из популяции. Если способ отбора испытуемых обеспечивает высокую внешнюю валидность (в отношении индивидуальных различий), то тем самым достигается достаточное подобие групп, т. е. повышается внутренняя валидность. Напротив, группы, хорошо уравненные между собой по индивидуальным характеристикам, могут не быть достаточно представительными для исследуемой популяции. Иначе говоря, высокая внутренняя валидность эксперимента не гарантирует его высокой внешней валидности. При использовании схемы индивидуального эксперимента связь между внешней и внутренней валидностью отсутствует, поскольку та и другая зависят от разных факторов.

 

Вместе со случайным отбором, так же как и со случайным распределением, можно использовать выделение слоев. Это дает пятую эффективную схему эксперимента с межгрупповым сравнением — послойный случайный отбор. Сначала популяцию разделяют на классы, или слои, а затем внутри каждого слоя применяют случайный отбор. Выделение слоев дает то же преимущество, что и при случайном распределении, если его основание связано с изучаемым видом деятельности.

 

Когда для эксперимента привлекаются испытуемые, имеющиеся в наличии, будь то «заложники» или добровольцы, есть опасность, что выборка будет недостаточно репрезентативной. Для оценки репрезентативности выборки экспериментатор должен подробно проанализировать ситуацию, а также предвидеть последствия случаев, когда выборка недостаточно представляет популяцию.

 

ВОПРОСЫ

 

1. Чем отличаются возможности обобщения результатов экспериментов, описанных в этой главе, от экспериментов, рассмотренных ранее?

2. В каких случаях нужно проводить эксперимент с межгрупповым сравнением, а не интраиндивидуальный эксперимент?

3. Какие источники нарушения внутренней валидности устраняются в эксперименте с межгрупповым сравнением?

4. Каковы основные источники межиндивидуальных различий?

5. Почему неправильно проводить эксперимент на уже существующих группах испытуемых, например на ученических группах в разных школах?

6. Как можно повысить надежность в межгрупповом эксперименте?

7. В чем отличие двух межгрупповых схем: со случайным распределением по группам и со случайным отбором в группы?

8. Какова связь внешней и внутренней валидности в экспериментах с межгрупповыми схемами?

9. Приведите пример эксперимента, в котором хорошо представлена одна популяция и плохо — другая.

 

СТАТИСТИЧЕСКОЕ ПРИЛОЖЕНИЕ: СИЛА СВЯЗИ МЕЖДУ НЕЗАВИСИМОЙ И ЗАВИСИМОЙ ПЕРЕМЕННЫМИ

 

Зададимся вопросом: как велико различие в результатах, которое дает нам предъявление условия А по сравнению с условием Б? К настоящему моменту мы можем дать ответ только в терминах единиц зависимой переменной. Так, например, мы можем сказать:

 

1. С использованием наушников испытуемая Д пропустила 763 удара в час; без них она пропустила 908 ударов. Разница составляет 145 ударов в час.

2. Время реакции испытуемого на световой сигнал равно 185 мс; время реакции на звуковой сигнал равнялось 162 мс. Разница составляет 23 мс.

3. С умственной тренировкой испытуемые получили среднюю балльную оценку 4,21; «контрольная» группа получила среднюю балльную оценку 3,89. Разница составляет 0,32 деления на шкале балльных оценок.

 

В каком из экспериментов действие независимой переменной было наибольшим? Как вы сравните 145 ударов в час, 23 мс и 0,32 деления на шкале балльных оценок? Этого сделать нельзя. Одна из возможностей сравнения величин состоит в использовании отношения вместо разницы. Так, для трех данных экспериментов отношения большего результата к меньшему соответственно равны:

 

 

Как видим, отношения почти одинаковы. Фактически они кое-что говорят нам о силе связи, но они неадекватны по двум причинам. Во-первых, этот способ неприменим к экспериментам с более чем двумя условиями, такими, например, как эксперимент с информированием покупателей о стоимости товаров. Во-вторых, — и это более важно — отношение вообще не отвечает на наш вопрос: насколько отчетливо различаются показатели для одного условия и для других условий.

 

Использование частотных распределений

 

Для того чтобы понять, насколько различаются условия, мы можем нанести частотные распределения для этих условий на один и тот же график. Сравнение становится более понятным, если не только отмечать высоту колонок, но соединить их вершины линией. (Это называется полигоном частот) Данный метод уже был показан на рис. 4.3 для эксперимента по обучению испанскому языку.

 

По значительному перекрытию распределений мы можем судить, что тестовые оценки для двух условий — письменного и устного — различались незначительно.

 

Рассмотрим теперь распределения для эксперимента по измерению времени реакции, описанного в статистическом приложении к главе 1. Они показаны на рис. 4.4. Напомним, что это вымышленные данные. Предположим теперь, что они были получены в межгрупповом эксперименте. Тогда каждый из показателей времени реакции представляет среднее для одного из 7испытуемых, где 17 испытуемым предъявлялось данное условие. Этот пример может быть с тем же успехом представлен в терминах интраиндивидуального эксперимента, как он первоначально излагался. Рассмотрение эксперимента как межгруппового мы делаем только для того, чтобы связать наш анализ с тематикой данной главы.

 

 

Рис. 4.4. Частотное распределение средних значений времени реакции на световой (условие А) и звуковой (условие Б) сигналы. Ось абсцисс — средние значения времени реакции (в мс), ось ординат — частота. Сплошная линия — световой сигнал, пунктирная — звуковой

 

Видно, что в данном случае различия между условиями более отчетливы, чем в эксперименте с испанским языком, т. е. перекрытие между распределениями меньше. Было бы хорошо иметь количественную меру различия вместо таких неопределенных терминов, как «кажется», «очевидно» и т. д. Такая количественная мера давала бы информацию, насколько сильна связь между независимой и зависимой переменными.

 

Вычисление Ω2

 

Мы можем получить численную величину силы связи, вычислив ω2 (ω — малая греческая буква омега; мы называем ω2 омегой в квадрате). По существу, ω2 — один из параметров генеральной совокупности, о которых рассказывалось в статистическом приложении к главе 1. Его полное описание можно найти в работе Хейса (1973).

 

 

Рис. 4.5. Объединенное частотное распределение средних значений Семени реакции. Ось абсцисс — средние значения времени реакции (в мс). Ось ординат — частота

 

Наше вычисление с использованием данных по выборке испытуемых дает оценку ω2. Мы будем называть ее est ω2.

 

Давайте построим новый график результатов эксперимента по измерению времени реакции. Однако теперь мы не будем делать различий между тем, какое из двух условий — А (свет) или Б (тон) — было использовано. Как видно на рис. 4.5, это комбинированное распределение несколько более растянуто, чем каждое из отдельных распределений для света и тона. Чем больше исходные распределения отличаются друг от друга, тем больше будет растянуто комбинированное распределение.

 

Если бы мы смогли провести бесконечный эксперимент и при этом получили бы распределения, показанные на рис. 4.4 и 4.5, мы могли бы вычислить ω2 прямо из параметра σ̅2X следующим образом:

(4.1)

Однако поскольку наши данные получены только по одной выборке испытуемых, а не в бесконечном эксперименте, мы должны оценивать ω2 по статистике S2X:

(4.2)

Квадрат стандартного отклонения распределения называется дисперсией.

 

Числитель этой формулы дает разность между дисперсиями комбинированного распределения и отдельного распределения, в нашем случае любого из условий А или Б. Делением этой разности на дисперсию комбинированного распределения мы придаем ей форму пропорции. Она отвечает на вопрос, на какую часть уменьшается дисперсия показателей при переходе от комбинированного распределения к отдельному.

 

Производя вычисления, нет необходимости сначала вычислять SX и затем возводить его в квадрат, чтобы получить S2X. Вспомните (из формулы 2.2):

Поэтому

(4.3)

В статистическом приложении к главе 3 мы вычислили ∑х2 для условия А (свет) и условия Б (тон):

Используем эти величины для нахождения S2отд. Согласно Хейсу (с. 418), среднее по S2A и S2Б дает величину S2отд при допущении равенства «истинных» дисперсий двух наборов:

(4.4)

Поэтому

Такое же вычисление производится для комбинированного распределения:

Подставляя эти величины в формулу 4.2, получаем

Это показывает сильную связь между независимой и зависимой переменными. Даже значение 0,20 уже достаточно существенно. Значение никогда не может превысить 1; однако эта величина достигается редко. В то же время вычисление для эксперимента с испанским языком дает

Это очень слабая связь между независимой и зависимой переменными.

 

Применения Ω2

 

Обратите внимание, что для S2отд необходимо допускать равенство истинных дисперсий для двух условий. В эксперименте по измерению времени реакции это допущение было приемлемым, поскольку дисперсии для двух условий довольно близки по величине. Это справедливо и для эксперимента с испанским языком. Однако для эксперимента с информацией о ценах (см. табл. 4.1) условие В давало значительно меньшее стандартное отклонение (особенно для времени выбора покупки), чем другие условия. Три дисперсии (квадраты стандартных отклонений) были равны 100, 92 и 1,2 для условий А, Б и В. При столь значительном различии прямого способа вычисления ω2 нет. И здесь дело не в том, что число условий равно трем, а не двум. Если значения дисперсии близки, то величина ω2 может быть вычислена для любого числа условий с использованием S2отд как среднего значения для всех условий. Приводившаяся процедура вычисления ω2 может быть использована как для интраиндивидуальных, так и для межгрупповых данных. Дисперсия — это то, что относится к пробам, а не к испытуемым.

Интерпретация Ω2

 

Мы можем рассматривать ω2 как индикатор величины, на которую уменьшается неопределенность за счет того, что нам известно экспериментальное условие. В эксперименте по измерению времени реакции мы кое-что знаем о среднем показателе для каждого отдельного испытуемого благодаря тому, что знаем экспериментальное условие. Но в пределах каждого условия показатели варьируют, т.е. как-то распределены. Наша неопределенность измеряется дисперсией этого распределения. Если мы не знаем условия, предъявлявшегося испытуемому, наша неопределенность увеличивается: дисперсия комбинированного распределения больше, чем дисперсия для отдельного условия.

 

Таким образом, зная, какое из условий предъявляется испытуемому, мы уменьшаем неопределенность. Как уже говорилось, деление этого уменьшения на уменьшаемую дисперсию (S2комб) превращает ответ в отношение. Тем самым ω2 сообщает нам часть, на которую уменьшается неопределенность при знании экспериментального условия. Это и есть мера воздействия на поведение независимой переменной.

Задача: Вычислите est ω2 для эксперимента, сравнивающего условие В и Г, с 18 испытуемыми в каждой группе:

 

∑x2в=4700; ∑x2г=4900; ∑x2комб=15,000.

 

Ответ: est ω2=0,34.

 

 



Поделиться:


Последнее изменение этой страницы: 2016-06-06; просмотров: 322; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 52.15.112.69 (0.144 с.)