Линейный регрессионный анализ в SPSS 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Линейный регрессионный анализ в SPSS



Регрессионный анализ служит для выявления влияния одной или нескольких независимых переменных на одну зависимую переменную. С точки зрения чистоты статистических расчетов в регрессионном анализе могут участвовать лишь метрические, т.е. количественные, переменные (см. подраздел 2.3 «Типы шкал измерения переменных»). Однако в некоторых учебниках по SPSS указывается, что в регрессионном анализе могут участвовать как метрические, так и порядковые переменные.

Дихотомические переменные (имеющие только два значения: высокий/низкий, близкий/далекий и т.п.) могут рассматриваться как метрические. В случае необходимости использовать в регрессионном анализе номинальные переменные их следует разложить на дихотомические переменные (см. подраздел 2.2 «Виды кодировки данных»).

Регрессионный анализ позволяет не только сделать вывод о существовании взаимосвязи между исследуемыми переменными, но и дать математическое описание зависимости межд5 ними.

Современные методы статистического анализа позволяют давать математическое описание зависимости переменных, выраженных в функциях различных видов. Техника регрессионного анализа, позволяющая выявлять и описывать взаимосвязи в виде линейных функций, называется линейным регрессионным анализом (см. подраздел 1.2 «Основные виды статистического анализа»).

Для выявления и описания линейной зависимости между объектом исследования (зависимой переменной) и одним фактором, возможно влияющим на него (независимой переменной), используется простая линей чая регрессия. Регрессионная модель (регрессионное уравнение) в этом случае имеет вид

у = а — Ьх,

где у — зависимая переменная;
х — независимая переменная;
а — свободный член (константа);
b — коэффициент регрессии.

Для выявления и описания линейной зависимости между объектом исследования (зависимой переменной) и несколькими факторами, возможно на него влияющими (независимыми переменными), используется множественная линейная регрессия. Регрессионная модель (регрессионное уравнение) в этом случае имеет вид

Результатом регрессионного анализа является регрессионная модель (регрессионное уравнение), а именно — определение свободного члена (а) и коэффициентов регрессии (b).

Также в ходе регрессионного анализа определяются стандартизированные коэффициенты регрессии (Beta). Данные коэффициенты позволяют судить о значении соответствующих независимых переменных (х), т.е. о степени влияния на зависимую переменную (у).

Результатом регрессионного анализа является не только регрессионная модель, но также расчет ряда показателей, характеризующих статистическую значимость и практическую применимость построенной модели. Среди таких показателей в качестве основных можно выделить:

Коэффициент детерминации (R) — является характеристикой общей силы линейной связи между переменными в регрессионной модели. Значения коэффициента находятся в интервале от нуля до единицы. Чем ближе значение коэффициента к единице, тем плотнее линейная взаимосвязь, описанная в регрессионной модели. В общем случае он должен превышать 0,5.

Коэффициент R-квадрат (R Square) — показывает, какая доля совокупной вариации в зависимой переменной описывается независимой переменной. Значения коэффициента лежат в интервале от нуля до единицы. Как правило, данный показатель должен превышать 0,5. Если он равен 0,5, это говорит о том, чго регрессионная модель описывает 50% случаев, т.е. она справедлива только для 50% исходных данных. Важной частью регрессионного анализа является анализ остатков, т.е. отклонений наблюдаемых значений от теоретически ожидаемых. Остатки должны появляться случайно (не систематически) и подчиняться случайному распределению. Проверка наличия систематических связей между остатками может быть произведена при помощи теста Дарбина—Уотсона (Durbin— Watson) на автокорреляцию. Этот тест позволяет рассчитать коэффициент, значение которого варьирует от 0 до 4. Если значение данного коэффициента близко к 2, это означает, что автокорреляция отсутствует.

Линейный регрессионный анализ проводится в SPSS с помощью меню «Analyze > Regression > Linear...» (рис. 4.1).

После выбора меню, представленного на рис. 4.1, открывается диалоговое окно «Линейная регрессия», при помощи которого формируется задание на проведение анализа в SPSS. Набор команд данного задания обусловливается тем, какой именно вид линейной регрессии используется — простая или множественная линейная регрессия.

ПРОСТАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ

4.1.1. ПОСТАНОВКА ЦЕЛИ ИССЛЕДОВАНИЯ И ПРЕДСТАВЛЕНИЕ ИСХОДНЫХ ДАННЫХ В SPSS

Как отмечалось ранее, простая линейная регрессия используется дчя выявления и описания линейной зависимости между двумя исследуемыми переменными — зависимой и независимой.

Например, следует определить, в какой зависимости находятся такие переменные, как сумма общих расходов туристов на проведение отпуска и сумма, уплачиваемая туристами за проживание в отеле или пансионе (включая обслуживание) (рис. 4.2).

Для анализа используются данные опроса туристов, отдыхающих в курортной зоне «Баварский лес». Для анализа из всех вопросов анкеты выбраны два:

Вопрос № 45: «Какую сумму денег Вы тратите в целом на отдых?»

Вопрос № 47: «Какую сумму денег Вы тратите во время отдыха на проживание в гостинице/пансионе (включая обслуживание)?»

При занесении информации по ответам на данные вопросы в файл данных SPSS была использована двойная запись переменных (см. подраздел 2.2 «Виды кодировки данных»). Каждый из этих вопросов представлен в файле данных SPSS в виде двух переменных (рис. 4.3).

Вопрос № 45 представлен в виде двух переменных с именами «q_45_1» и «q_45_2» и одинаковыми метками «Общие расходы на отдых». Вопрос № 47 представлен в виде двух переменных с именами «q_47_1» и «q_47_2» и одинаковыми метками «Расходы на проживание».Переменные с именами «q_45_l» и «q_47_l» являются номинальными. Значення меток этих переменных имеют числовые коды («1» — «сумма в евро», «98» — «не знаю», «99» — «нет данных»). Они указывают на то, назвал ли респондент точную сумму в качестве ответа на поставленный вопрос или нет.

Переменные с именами «q_45_2» и «q_47_2» являются метрическими. В столбце «Values» таблицы «Свойства переменных» отсутствуют значения меток переменных (см. рис 4.3). Значения этих переменных выражаются в конкретных денежных суммах и отображаются в столбцах «q_45__ I» и «q_47_2» таблицы «Значения переменных» (рис. 4.4).

 

Фрагмент таблицы «Значения переменных» файла данных SPSS, представленный на рис. 4.4, содержит информацию о расходах респондентов во время отдыха. Респондент в строке 2194 потратил на отдых в целом 2200 евро, на оплату гостиницы/ пансиона — 800 евро. Респондент в строке 2197 потратил на отдых в целом 1400 евро, а на оплату гостиницы/пансиона — 300 евро и т.д.

Преимуществом простой линейной регрессии является возможность представить результаты анализа графически. Регрессионное уравнение, представляющее собой линейную функцию с одной переменной, может быть представлено в виде линейного графика в двухмерной системе координат.

Линейный регрессионный анализ применяется для графического прогнозирования поведения одной переменной в зависимости от изменения другой. Как правило, целью регрессионного анализа в данном случае является построение тренда, т.е. линейного графика, отображающего зависимость между переменными.

Исходя из полученного уравнения регрессии можно предсказать, каким будет значение одной переменной при изменении другой. В рассматриваемом примере регрессионная модель позволит спрогнозировать, как будут расти (уменьшаться) общие расходы на проведение отпуска при увеличении (уменьшении) расходов на проживание, включая обслуживание.

 



Поделиться:


Последнее изменение этой страницы: 2016-04-08; просмотров: 612; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.237.46.120 (0.018 с.)