Положительная и отрицательная корреляция 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Положительная и отрицательная корреляция



Взаимосвязь между временем, посвященным занятиям, и оценками является примером положительной корреляции. Приведенные ниже данные, полученные в ходе гипотетического исследования восьми студентов, говорят о наличии положительной корреляции. В данном случае первой переменной является время, операционально определенное как количество часов в неделю, потраченных на учебу, а второй — средний балл (СБ), варьирующийся от 0,0 до 4,0.

 

  Время, потраченное на учебу СБ
Студент 1   3,3
Студент 2   2,9
Студент 3   3,2
Студент 4   3,2
Студент 5   1,9
Студент 6   2,4
Студент 7   3,7
Студент 8   2,5

Значительное время, потраченное на учебу (42 часа), связано с высоким средним баллом (3,3), а самое малое время (16 часов) — с низким баллом (1,9).

Примером отрицательной корреляции может быть взаимосвязь между бесполезно потраченным временем и средним баллом. Бесполезно потраченное время можно операционально определить как количество часов в неделю, потраченное на определенные занятия, например на игру в видеоигры, просмотр телесериалов или игру в гольф (конечно, эти виды деятельности можно назвать и «терапией»). Ниже приведены гипотетические данные для других восьми студентов. На этот раз вы увидите обратную взаимосвязь между количеством часов в неделю, потраченных впустую, и средним баллом:

 

  Время, потраченное на учебу СБ
Студент 1   1,8
Студент 2   3,0
Студент 3   2,2
Студент 4   2,9
Студент 5   3,7
Студент 6   3,0
Студент 7   2,4
Студент 8   3,4

Обратите внимание, что при отрицательной корреляции переменные имеют обратную взаимосвязь: большое количество потраченного зря времени (42) связано с низким средним баллом (1,8), а небольшое (16) — с более высоким (3,7).

Силу корреляции показывает особая величина описательной статистики, носящая название «коэффициент корреляции». Коэффициент корреляции равен-1,00 в случае прямой отрицательной корреляции, 0,00 при отсутствии взаимосвязи и +1,00 при полной положительной корреляции. Наиболее распространенным коэффициентом корреляции является пирсоново г (о нем упоминалось во вставке 9.1), названное так в честь британского ученого, соперничающего в известности с сэром Рональдом Фишером. Пирсоново г вычисляется для данных, полученных с помощью интервальной шкалы или шкалы отношений. В случае других шкал измерений рассматриваются другие виды корреляции. К примеру, для порядковых данных (т. е. упорядоченных) вычисляется «ро» Спирмена. В приложении С показано, как вычислять пирсоново г.

Так же как среднее арифметическое и стандартное отклонение, коэффициент корреляции является величиной описательной статистики. В ходе заключительного анализа определяется, является ли конкретная корреляция значимо большей (или меньшей) нуля. Таким образом, для корреляционных исследований нулевая гипотеза (Н0) говорит, что действительное значение г равно 0 (т. е. нет никаких взаимосвязей), а альтернативная гипотеза (Н,) — что г№ 0. Отвергнуть нулевую гипотезу — значит решить, что между двумя переменными существует значимая взаимосвязь. В приложении С показано, как определить, является ли корреляция статистически значимой.

График рассеяния

Силу корреляции можно обнаружить, рассмотрев современную версию построенной Гальтоном таблицы (рис. 9.1) — график рассеяния. Он является графическим отображением взаимосвязи, на которую указывает корреляция. Как показано на рис. 9.2, в случае полной положительной (9.2, а) или полной отрицательной (9.2, б) корреляции точки образуют прямую линию, а нулевая корреляция дает график рассеяния (9.2, в), точки которого распределены случайным образом. По сравнению с относительно слабой корреляцией (9.2, гид) точки сравнительно сильной расположены ближе друг к другу (9.2, ж и з). В целом, по мере ослабления корреляции точки на графике рассеяния все больше удаляются от диагонали, связывающей точки при полной корреляции, равной +1,00 или -1,00.

На рис. 9.3 показано, как по набору данных создается график рассеяния, а на рис. 9.4 приведены графики рассеяния для гипотетических примеров со средними баллами. Они отображают сильную положительную корреляцию между временем, потраченным на учебу, и средним баллом, а также сильную отрицательную корреляцию между бесполезно потраченным временем и средним баллом. Значения коэффициента корреляции равны +0,88 и -0,89 соответственно. Преподаватель может попросить вас проверить эти значения пирсонова г с помощью процедуры, приведенной в приложении С.




 

Допущение линейности

До сих пор изучаемые нами графики рассеяния состояли из точек, несколько отклоняющихся от прямой линии, которая образуется при полной корреляции со значениями -1,00 или +1,00. Однако не все взаимосвязи линейны, а вычисление пирсонова г для нелинейного случая не поможет выявить природу такой взаимосвязи. На рис. 9.5 показан гипотетический пример, отражающий одно известное психологическое открытие: взаимосвязь между возбуждением и выполнением задания. Сложные задания выполняются хорошо при среднем уровне возбуждения, но гораздо хуже при очень низком или очень высоком (см., например, Anderson, 1990). При очень низком уровне возбуждения у человека недостаточно сил, чтобы работать над заданием, а очень высокое возбуждение мешает эффективной обработке информации, требующейся для выполнения работы. Из графика рассеяния видно, что точки ложатся вдоль определенной кривой, но при попытке применить линейную корреляционную процедуру вы получите, что г равно нулю или очень близко к нему. Анализ криволинейных взаимосвязей, подобных изображенной на рис. 9.5, проводится особыми методами, рассмотрение которых не входит в задачу данной книги.

Ограничение диапазона

При проведении корреляционного исследования важно учитывать людей, оценки которых попадают в широкий диапазон. Ограничение диапазона одной или обеих переменных снижает корреляцию. Подобный эффект показан на рис. 9.6. Предположим, вы изучаете взаимосвязь между оценками SA Т (американский школьный тест проверки способностей) и успеваемостью в колледже (последняя оценивается по средним баллам, полученным первокурсниками в конце года). На рис. 9.6, а показано, каким может быть график рассеяния при исследовании 25 студентов. Коэффициент корреляции равен +0,70. Допустим далее, что вы решили изучить эту взаимосвязь на примере студентов, получивших 1200 и более баллов по тесту SAT На рис. 9.6, б выделены точки графика рассеяния для таких студентов — как показано на рис. 9.6, в, по ним можно построить отдельный график. Если вы теперь сравните рис. 9.6, а и 9.6, в, вам станет ясно, что для 9.6, в корреляция ниже. Действительно, она падает до +0,26.

Этот пример имеет интересное следствие для колледжей, которые не учитывают студентов, чьи суммарные оценки теста SAT меньше 1200 баллов. Различные исследования (например, Schrader, 1971) показали, что общая корреляция между оценками SATn баллами, полученными в конце первого курса, равная приблизительно +4,0, является статистически значимой, но не высокой. Корреляцию находили, используя студентов с самыми разными оценками теста SAT. Если диапазон оценок SAT ограничен 1200 баллами и выше, то корреляция заметно снижается. Существуют особые процедуры для «коррекции» корреляции с учетом проблемы ограничения, но необходимо осознавать, что ограничение диапазона непосредственно влияет на возможность строить предположения о дальнейших событиях. Учебные заведения, проводящие строгий отбор и отсеивающие абитуриентов с результатами теста 5!А Г ниже 1200 баллов, без сомнения получат хороших студентов, но их возможность предсказать учебную успеваемость на основании оценок SAT будет не такой высокой, как у заведений, не предъявляющих таких высоких требо-

ваний к абитуриентам. В вузах, имеющих меньше ограничений по отбору студентов, корреляция оценок SAТп академической успеваемости будет выше, чем в учебных заведениях со строгими ограничениями.

Коэффициент детерминации — г2

Довольно легко неверно понять смысл конкретного значения пирсонова г. Если оно равняется +0,70, то взаимосвязь действительно является относительно сильной, но студенты иногда думают, что +0,70 каким-то образом связано с 70%, и считают, что в таком случае взаимосвязь установлена на 70%. Это неверно. Для интерпретации значения корреляции гораздо правильнее использовать коэффициент детерминации (г 2). Он находится возведением в квадрат пирсонова г, а поэтому вне зависимости от типа корреляции (положительной или отрицательной) его значение никогда не бывает отрицательным. Данный коэффициент формально определяется как степень изменчивости одной переменной корреляции, вызванная изменчивостью другой переменной. Поясним это на конкретном примере.

Предположим, вы проводите исследование, в ходе которого у 100 участников измеряется уровень эмоциональной депрессии и средний балл. Вы проверяете вза-

имосвязь между двумя переменными и обнаруживаете отрицательную корреляцию: чем выше уровень депрессии, тем ниже средний балл, и наоборот, чем слабеедепрессия тем выше средний балл. Рассмотрим два значения корреляции, которыемогут быть получены в результате этого исследования, 1,00 и -0,50. Коэффициент детерминации будет равен 1,00 и 0,25 соответственно. Чтобы понять смыслэтих значений, для начала обратим внимание на то, что средний балл у 100 изучаемых людей, скорее всего, будет варьироваться от 0,0 до 4,0. Как исследователи, мыхотим выяснить причину такой изменчивости — почему один человек получает 3,8балла, а другой 2,4 и т. д. Другими словами, мы хотим узнать, что вызывает индивидуальные различия в средних баллах? В действительности, причиной этомуможет быть несколько факторов: учебные привычки, общий уровень интеллекта,эмоциональная устойчивость, склонность к выбору легких предметов для изучения и т. д. Как показывают оценки теста на депрессию, в нашем гипотетическомисследовании изучается один из этих факторов — эмоциональная устойчивость. Нпоказывает, насколько изменчивость средних баллов может быть связана непосредственно с депрессией. В первом случае, когда г = -1,00, а г2 = 1,00, мы можемприйти к выводу, что 100% изменчивости средних баллов связана с изменчивостьюоценок депрессии. Следовательно, можно сказать, что 100% различий между средними баллами (3,8 и 2,4 и др.) вызваны депрессией. В реальном исследовании такой результат, конечно, невозможно получить. Во втором случае, когда г = -0,5,а г2 = 0,25, только одна четверть (25%) изменчивости средних баллов будет связанас депрессией. Остальные 75% связаны с другими факторами, подобными перечисленным выше. Говоря кратко, коэффициент детерминации лучше характеризуетсилу отношений, чем пирсоново г.



Поделиться:


Последнее изменение этой страницы: 2017-02-17; просмотров: 693; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.118.1.158 (0.009 с.)