Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь FAQ Написать работу КАТЕГОРИИ: АрхеологияБиология Генетика География Информатика История Логика Маркетинг Математика Менеджмент Механика Педагогика Религия Социология Технологии Физика Философия Финансы Химия Экология ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Оценка выбора дискриминационных переменныхСодержание книги
Поиск на нашем сайте
Оценка выбора дискриминационных переменных представляет собой первый этап интерпретации результатов дискриминантного анализа. Представление результатов анализа начинается с обзора действительных и пропущенных значений, который выводится на экран компьютера в виде таблицы «Анализ обработанных наблюдений» (табл. 7.1). В нашем примере число респондентов, принявших участие в опросе (Total), составляет 6396; из этих данных только 1023 анкеты являются действительными (Valid), т.е. только эти наблюдения используются при расчетах для построения дискриминантной функции. Данные по остальным респондентам исключены из анализа (Excluded) в виду отсутствия данных по ответам на нужные вопросы. Число респондентов, не давших информации о том, посещают л и они дискотеки, составляет 4711. Как отмечалось ранее при построении дискриминантной функции, данные по этим респондентам не используются. Однако эти респонденты участвуют в классификации на основании построенной дискриминантной модели (см. далее табл. 7.12 и 7.13). Число респондентов, не давших информацию о себе хотя бы по одному из нужных социально-демографических признаков, составляет 146. Число респондентов, не давших информации о том, посещают ли они дискотеки, и одновременно не давших информацию о себе хотя бы по одному из нужных социально-демо- графических признаков, составляет 516. После обзора действительных и пропущенных значений на экран компьютера выводится таблица «Статистические показатели в группах», которая содержит данные о средних значениях (Mean) дискриминационных переменных в каждой из исследуемых групп. Эти показатели дают общее представление о том, являются ли дискриминационные переменные отличительными признаками исследуемых групп (табл. 7.2).
Таблица 7.2 Group Statistics
|
N - число действительных наблюдений. |
Изданных, представленных в табл. 7.2, видно, что средний возраст туристов, посещающих дискотеки, составляет около 36 лет, а средний возраст туристов, не посещающих дискотеки, составляет примерно 51 год. Средний возраст всех опрошенных респондентов составляет примерно 50 лет.
Переменная «возраст» является метрической. С точки зрения статистики только метрические переменные могут участвовать в дискриминантном анализа в качестве независимых переменных, поскольку только для них можно рассчитать среднее значение и стандартное отклонение (см. подраздел 2.3 «Типы шкал измерения переменных»).Статистические показатели в группах
Переменная «пол» является дихотомической. Расчет такого показателя, как «средний пол», является абсурдным. Однако дихотомические переменные могут рассматриваться как метрические. Если бы метки переменной «пол» имели числовые коды не «1»(мужчины)/«2»(женщины), а «0»(мужчины)/«1»(женщины), то средние значения этой переменной для исследуемых групп были бы не 1,42/1,46, а 0,42/0,46. Это означает, что доля женщин среди туристов, посещающих дискотеки, составляет 42%, а среди туристов, не посещающих дискотеки, — 46%.
Переменные «образование» и «доход семьи» являются порядковыми, т.е. они разделяют туристов на категории по уровню образования и дохода семьи. Средние значения этих переменных не имеют никакого смысла, поскольку представляют лишь средние значения порядковых номеров категорий, указанных респондентами.
Из данных, представленных в табл. 7.2, можно сделать вывод, что уровень образования туристов, посещающих дискотеки, несколько выше уровня образования туристов, не посещающих дискотеки (6,97 > 5,56).
Что касается уровня дохода семьи, то можно сказать, что он несколько ниже у туристов, посещающих дискотеки, по сравнению с туристами, не посещающими дискотеки (5,99 < 6,43).
Неравенство средних значения заявленных дискриминационных переменных (пол, возраст, образование, доход семьи) в группах туристов, посещающих и не посещающих дискотеки, не доказывает, что данные переменные являются отличительными признаками исследуемых групп. Их можно считать отличительными признаками только в том случае, если будет доказана статистическая значимость различий их средних значена. в исследуемых группах (см. раздел 3 «Сравнение средних величин в SPSS»). Для этого проводится тест на равенство средних значений в группах (табл. 7.3).
Таблица 7.3 Тест на равенство средних значений в группах
Tests of Equality of Group Means
Wills' Lambda* | F | dfl | df2 | Sig. | |
Пол | 1,000 | ,451 | ,502 | ||
Возраст | ,898 | 115,751 | ,000 | ||
Образование | ,990 | 1,412 | ,235 | ||
Доход семьи | ,996 | 4,313 | ,038 |
Для проведения теста на равенство средних значени i в группах в качестве тестовой величины используется лямбда Уилкса (Wilks' Lambda) [3] . Основной результат теста определяется с помощью величины «Significance» («Значимость»), Если значение «Significance» меньше 0,05, это означает, что различия между средними значениями дискриминационных переменных в исследуемых группах являются статистически значимыми (см. раздел 3 «Сравнение средних величин в SPSS»).
В рассматриваемом примере значение «Significance» не превышает 0,05 только для двух заявленных дискриминационных переменных: «возраст» (0,000) и «доход семьи» (0,038). Это означает, что туристы, посещающие и не посещающие дискотеки, отличаются по возрасту и доходу семьи, поэтому переменные «возраст» и «доход семьи» могут выступать в качестве дискриминационных переменных.
Значение величины «Sign ficance» для переменных «пол» (0,502) и «образование» (0,235) (см. табл. 7.3) превышает 0,05. Это означает, что между группами туристов, посещающих и не посещающих дискотеки, не существует достаточно четкого различия по половой структуре и уровню образования туристов.
Переменные «пол» и «образование» не обладают дискриминирующими (разделительными) свойствами и не могут выступать в качестве дискриминационных переменных. Они должны быть исключены из дискриминантной модели.
В случае необходимости изменения состава дискриминационных переменных следует заново сформировать задание на проведение дискриминантного анализа. Для этого следует повторить все операции, описанные в подразделе 7.2 «Команды SPSS на выполнение дискриминантного анализа», изменив лишь список независимых переменных (Independents) в диалоговом окне «Дискриминантный анализ» (см. подраздел 7.2, рис. 7.5).
Таблица 7.4 Тест на равенство средних значений в группах Tests of Equality of Group Means
|
После изменения задания на выполнение дискриминантного анализа изменяются результаты. В рассматриваемом примере после исключения переменных «пол» и «образование» из состава дискриминационных переменных число действительных значений осталось без изменений — 1023 (см. табл. 7.1). Значения величины «Sig nificance» при проведении теста на равенство средних значений в группах для переменных «возраст» и «доход семьи» также остались без изменений (табл. 7.3 и 7.4).
После того как доказано наличие дикриминирующих (разделительных) особенностей переменных «возраст» и «доход семьи», следует также доказать, что они являются действительно независимыми. Значения этих переменных не должны обусловливать друг друга. Следует доказать, что доход семьи не находится в прямой зависимости от возраста туриста. Для этого рассчитывается коэффициент корреляции, характеризующий связь между исследуемыми переменными (табл. 7.5).
| Поделиться: |
Познавательные статьи:
Последнее изменение этой страницы: 2016-04-08; просмотров: 362; Нарушение авторского права страницы; Мы поможем в написании вашей работы!
infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.144.252.58 (0.012 с.)