Оценка выбора дискриминационных переменных 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Оценка выбора дискриминационных переменных



Оценка выбора дискриминационных переменных представляет собой первый этап интерпретации результатов дискриминантного анализа. Представление результатов анализа начинается с обзора действительных и пропущенных значений, который выводится на экран компьютера в виде таблицы «Анализ обработанных наблюдений» (табл. 7.1).

В нашем примере число респондентов, принявших участие в опросе (Total), составляет 6396; из этих данных только 1023 анкеты являются действительными (Valid), т.е. только эти наблюдения используются при расчетах для построения дискриминантной функции. Данные по остальным респондентам исключены из анализа (Excluded) в виду отсутствия данных по ответам на нужные вопросы.

Число респондентов, не давших информации о том, посещают л и они дискотеки, составляет 4711. Как отмечалось ранее при построении дискриминантной функции, данные по этим респондентам не используются. Однако эти респонденты участвуют в классификации на основании построенной дискриминантной модели (см. далее табл. 7.12 и 7.13).

Число респондентов, не давших информацию о себе хотя бы по одному из нужных социально-демографических признаков, составляет 146. Число респондентов, не давших информации о том, посещают ли они дискотеки, и одновременно не давших информацию о себе хотя бы по одному из нужных социально-демо- графических признаков, составляет 516.

После обзора действительных и пропущенных значений на экран компьютера выводится таблица «Статистические показатели в группах», которая содержит данные о средних значениях (Mean) дискриминационных переменных в каждой из исследуемых групп. Эти показатели дают общее представление о том, являются ли дискриминационные переменные отличительными признаками исследуемых групп (табл. 7.2).

 

 

Таблица 7.2

Group Statistics

      Valid N listwise)
Посещение д искотек Mean Std. Deviation Unweighted Weighted
Да Пол 1,42 ,496   88,000
Возраст 35,81 12,985   88,000
Образование 6,97 13,026   88,000
Доход семьи 5,99 2,307   88,000
Нет Пол 1,46 ,498   935,000
Возраст 51,31 12,920   935,000
Образование 5,56 10,346   93b, 000
Доход семьи 6,43 1,854   935,000
Всего Пол 1,45 ,498   1023,000
Возраст 49,98 13,632   1023,000
Образование 5,68 10,603   1023,000
Доход семьи 6,39 1,899   1023,000

N - число действительных наблюдений.

Изданных, представленных в табл. 7.2, видно, что средний возраст туристов, посещающих дискотеки, составляет около 36 лет, а средний возраст туристов, не посещающих дискотеки, составляет примерно 51 год. Средний возраст всех опрошенных респондентов составляет примерно 50 лет.

Переменная «возраст» является метрической. С точки зрения статистики только метрические переменные могут участвовать в дискриминантном анализа в качестве независимых переменных, поскольку только для них можно рассчитать среднее значение и стандартное отклонение (см. подраздел 2.3 «Типы шкал измерения переменных»).Статистические показатели в группах

Переменная «пол» является дихотомической. Расчет такого показателя, как «средний пол», является абсурдным. Однако дихотомические переменные могут рассматриваться как метрические. Если бы метки переменной «пол» имели числовые коды не «1»(мужчины)/«2»(женщины), а «0»(мужчины)/«1»(женщины), то средние значения этой переменной для исследуемых групп были бы не 1,42/1,46, а 0,42/0,46. Это означает, что доля женщин среди туристов, посещающих дискотеки, составляет 42%, а среди туристов, не посещающих дискотеки, — 46%.

Переменные «образование» и «доход семьи» являются порядковыми, т.е. они разделяют туристов на категории по уровню образования и дохода семьи. Средние значения этих переменных не имеют никакого смысла, поскольку представляют лишь средние значения порядковых номеров категорий, указанных респондентами.

Из данных, представленных в табл. 7.2, можно сделать вывод, что уровень образования туристов, посещающих дискотеки, несколько выше уровня образования туристов, не посещающих дискотеки (6,97 > 5,56).

Что касается уровня дохода семьи, то можно сказать, что он несколько ниже у туристов, посещающих дискотеки, по сравнению с туристами, не посещающими дискотеки (5,99 < 6,43).

Неравенство средних значения заявленных дискриминационных переменных (пол, возраст, образование, доход семьи) в группах туристов, посещающих и не посещающих дискотеки, не доказывает, что данные переменные являются отличительными признаками исследуемых групп. Их можно считать отличительными признаками только в том случае, если будет доказана статистическая значимость различий их средних значена. в исследуемых группах (см. раздел 3 «Сравнение средних величин в SPSS»). Для этого проводится тест на равенство средних значений в группах (табл. 7.3).

Таблица 7.3 Тест на равенство средних значений в группах

Tests of Equality of Group Means

  Wills' Lambda* F dfl df2 Sig.
Пол 1,000 ,451     ,502
Возраст ,898 115,751     ,000
Образование ,990 1,412     ,235
Доход семьи ,996 4,313     ,038

 

Для проведения теста на равенство средних значени i в группах в качестве тестовой величины используется лямбда Уилкса (Wilks' Lambda) [3] . Основной результат теста определяется с помощью величины «Significance» («Значимость»), Если значение «Significance» меньше 0,05, это означает, что различия между средними значениями дискриминационных переменных в исследуемых группах являются статистически значимыми (см. раздел 3 «Сравнение средних величин в SPSS»).

В рассматриваемом примере значение «Significance» не превышает 0,05 только для двух заявленных дискриминационных переменных: «возраст» (0,000) и «доход семьи» (0,038). Это означает, что туристы, посещающие и не посещающие дискотеки, отличаются по возрасту и доходу семьи, поэтому переменные «возраст» и «доход семьи» могут выступать в качестве дискриминационных переменных.

Значение величины «Sign ficance» для переменных «пол» (0,502) и «образование» (0,235) (см. табл. 7.3) превышает 0,05. Это означает, что между группами туристов, посещающих и не посещающих дискотеки, не существует достаточно четкого различия по половой структуре и уровню образования туристов.

Переменные «пол» и «образование» не обладают дискриминирующими (разделительными) свойствами и не могут выступать в качестве дискриминационных переменных. Они должны быть исключены из дискриминантной модели.

В случае необходимости изменения состава дискриминационных переменных следует заново сформировать задание на проведение дискриминантного анализа. Для этого следует повторить все операции, описанные в подразделе 7.2 «Команды SPSS на выполнение дискриминантного анализа», изменив лишь список независимых переменных (Independents) в диалоговом окне «Дискриминантный анализ» (см. подраздел 7.2, рис. 7.5).

Таблица 7.4 Тест на равенство средних значений в группах

Tests of Equality of Group Means

  Wills1 Lambda F dfl df2 Sig.
Возраст ,898 115,751     ,000
Доход семьи ,996 4,313     ,038

После изменения задания на выполнение дискриминантного анализа изменяются результаты. В рассматриваемом примере после исключения переменных «пол» и «образование» из состава дискриминационных переменных число действительных значений осталось без изменений — 1023 (см. табл. 7.1). Значения величины «Sig nificance» при проведении теста на равенство средних значений в группах для переменных «возраст» и «доход семьи» также остались без изменений (табл. 7.3 и 7.4).

После того как доказано наличие дикриминирующих (разделительных) особенностей переменных «возраст» и «доход семьи», следует также доказать, что они являются действительно независимыми. Значения этих переменных не должны обусловливать друг друга. Следует доказать, что доход семьи не находится в прямой зависимости от возраста туриста. Для этого рассчитывается коэффициент корреляции, характеризующий связь между исследуемыми переменными (табл. 7.5).



Поделиться:


Читайте также:




Последнее изменение этой страницы: 2016-04-08; просмотров: 333; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.221.129.19 (0.006 с.)