Регрессионный анализ: построение предположений 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Регрессионный анализ: построение предположений



Как показано в приведенном выше примере, важнейшей особенностью корреляционных исследований является возможность при наличии сильной корреляции строить предположения о будущем поведении. Корреляция между двумя переменными дает возможность на основании значений одной из них предсказать значения другой. Это несложно показать на примере со средними баллами. Если вы знаете, что время, посвященное учебе, и средний балл коррелируют, и я скажу вам, что некто занимается 45 часов в неделю, вы сможете безошибочно предсказать относительно высокий средний балл для такого студента. Аналогично высокий средний балл позволит вам предсказать время, уделяемое учебе. Как вы узнаете позднее в этой главе, корреляционные исследования обеспечивают базу для построения предположений по результатам психологических тестов. Построение предположений на основании корреляционных исследований называется регрессионным анализом.

На рис. 9.7 представлен график рассеяния для: а) времени, посвященного учебе и среднего балла и б) бесполезно потраченного времени и среднего балла, но на этот раз на каждом графике отображена линия регрессии, которая используется для построения предположений. Линию регрессии также называют «оптимальной линией»: она представляет собой наилучший из возможных способов обобщения точек графика рассеяния. Это значит, что абсолютные значения расстояний по вертикали между каждой точкой графика и линией регрессии минимальны.

 



Рис. 9.7. Графики рассеяния с линиями регрессии

Линия регрессии рассчитывается по той же формуле, по которой в школе вы строили прямую по заданным координатам X и Y.

У = а + ЬХ,

где а — это точка, в которой прямая пересекает ось У (т. е. отрезок, отсекаемый на оси У), а Ъ — это угол наклона прямой, или ее относительная крутизна. X — это известная величина, a Y — величина, которую вы пытаетесь предсказать. Зная 1) силу корреляции и 2) стандартное отклонение для коррелирующих переменных, можно вычислить величину Ь, а зная 1) значение b и 2) средние значения коррелирующих переменных, можно найти а. В приложении С на конкретном примере показано, как вычислять эти значения и подставлять их в уравнение регрессии. В регрессионном анализе для предсказания значения Y (например, среднего балла) на основании значения X (например, времени, посвященного учебе) используется уравнение регрессии. Y иногда называют критериальной переменной, а X — предик-торной переменной. Однако для построения точных предположений корреляция должна быть значительно выше нуля. Чем выше корреляция, тем ближе будут точки графика рассеяния к линии регрессии и тем больше будет уверенность в том, что ваши предположения верны. Таким образом, отмеченная ранее проблема ограничения диапазона, которая снижает корреляцию, также снижает достоверность предсказаний.

Из рис. 9.7 также видно, как строить предположения с помощью линии регрессии. Поскольку между временем, отведенным на учебу, и средним баллом существует взаимосвязь, можно спросить, какой средний балл стоит ожидать у студента, который проводит за учебой по 40 часов в неделю. Чтобы представить процесс наглядно, проведем пунктирную линию от оси Хк линии регрессии, а затем повернем влево на 90° и проведем линию до пересечения с осью У. Значение точки на оси У и будет предполагаемым значением (помните, что правильность предположения зависит от силы корреляции). Таким образом, по времени учебы, равному 40 часам, можно предсказать средний балл, равный 3,5, а по бесполезно потраченным 40 часам — средний балл чуть выше 2,1. С помощью формулы регрессии можно вычислить более точные значения: 3,48 и 2,13 соответственно, и сделать более точные предсказания. Еще раз см. приложение С.

Будьте уверены, что регрессионный анализ применяется в большинстве исследований, о которых вы узнаете из средств массовой информации. К примеру, вам может встретиться отчет об исследовании «факторов риска для инфаркта», в котором на основании значимой корреляции, скажем между курением и сердечными заболеваниями, сделан вывод, что у людей, злоупотребляющих курением, больше вероятность развития сердечно-сосудистых заболеваний, чем у некурящих. Это значит, что курение является основанием для предсказания развития болезней сердца. На основании другого исследования, посвященного изучению «портрета жестокого супруга (супруги)», может быть сделан вывод о том, что вероятность появления подобного поведения увеличивается, если виновник — безработный. Это следует из наличия корреляции между безработицей и склонностью к оскорбительному поведению. На основании наличия корреляции с помощью регрессионного анализа, зная первое, можно сделать предположение насчет второго.

Последнее замечание по поводу регрессионного анализа касается и практической, и этической сторон дела. Предположения могут распространяться только на тех людей, чьи оценки попадают в диапазон, на котором основана корреляция. Например, если уравнение регрессии, предсказывающее хорошую успеваемость в колледже, основано на исследовании, проведенном с участием белых испытуемых, живущих в провинции, принадлежащих к среднему классу и имеющих оценки, варьирующиеся от 1000 до 1400, то на основании этого уравнения нельзя предсказать успеваемость других абитуриентов, не принадлежащих к данной популяции.

Интерпретация корреляций

Корреляционные исследования являются мощным инструментом, дающим возможность предсказывать будущие события. Однако необходимо очень внимательно подходить к интерпретации результатов таких исследований. Обнаружение корреляции между двумя переменными не позволяет сделать вывод, что одна переменная является причиной появления другой. К сожалению, недостаток понимания этого общего правила приводит к тому, что в корреляционных исследованиях люди разбираются хуже всего. В новостях нередко описываются корреляционные исследования, и некритичным читателям сообщают, что одна из взаимосвязанных переменных является причиной другой. Например, было проведено огромное ко-

личество исследований, показавших, что определенный вид облысения является признаком будущего сердечного заболевания. В одном из них (Lotufo, Chae, Ajani, Hennekens, & Manson, 1999) исследователи опросили более 22 000 врачей и обнаружили, что у людей с коронарной болезнью часто наблюдается облысение макушки головы (гораздо чаще, чем облысение передней части головы или общее выпадение волос). В большинстве отчетов в средствах массовой информации было указано на отсутствие причинно-следственной связи, но некритичные читатели вполне могли решить, что облысение — это верный признак будущего инфаркта. Я не знаю, увеличилось ли количество операций по трансплантации волос после того, как был опубликован отчет об этом исследовании, но все те, кто думают, что, потратив деньги на трасплантант, они избавятся от риска получить инфаркт, являются жертвами ложной интерпретации корреляционного исследования.

Если в подобном образе мысли вы усматриваете проблему, то у вас уже есть чувство, которое я стараюсь в вас развить. Как вы помните из главы 1, одна из моих задач состоит в том, чтобы помочь вам стать более критичными потребителями информации. В публикуемых описаниях медицинских и психологических корреляционных исследований довольно часто встречаются ложные выводы и знание того, как правильно интерпретировать корреляционные исследования, поможет вам адекватно отнестись к таким работам.



Поделиться:


Последнее изменение этой страницы: 2017-02-17; просмотров: 292; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.222.115.120 (0.005 с.)