Определение точности прогнозов на основе построенhoй дискриминантной модели 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Определение точности прогнозов на основе построенhoй дискриминантной модели



Точность прогнозов на основе построенной дискриминантной модели оценивается по результатам классификации, т.е. распределения объектов исследования (туристов) по исследуемым группам (посещающие и не посещающие дискотеки).

В табл. 7.12 представлены результаты классификации отдельно по каждому наблюдению, т.е. по каждому респонденту, принявшему участие в опросе и предоставившему информацию о своем возрасте и доходе семьи. Поскольку число респондентов слишком велико, в табл. 7.12 представлены только 20 наблюдений, первых по списку, — как было указано при формировании задания на проведение дискриминантного анализа (см. рис. 7.8).

В столбце «Actual Group» (см. табл. 7.12) указывается фактическая принадлежность респондента к одной из исследуемых групп. Так, первый по списку респондент не посещает дискотеки («2»). Остальные респонденты не ответили на вопрос, посещают ли они дискотеки, поэтому в столбце «Actual Group» стоит отметка «ип- grouped» («Несгруппированное наблюдение»). Такое большое число несгруппированных наблюдений не должно удивлять. Из 6396 респондентов, принявших участие в опросе, 4717 туристов, указав свой возраст и доход семьи, не дали информации о том, посещают ли они дискотеки.

В столбце «Predicted Group» указывается прогнозируемая принадлежность респондента к одной из исследуемых групп, определяемая на основе построенной дискриминантной модели. Если прогнозируемая принадлежность к группе не совпадает с фактической, ее значение отмечается двумя звездочками (**).

В столбце «Р (G = g\D = d)» табл. 7.12 указывается вероятность, с которой конкретный респондент может быть причислен к прогнозируемой группе. В столбце «Discriminant Scores» указывается значение дискриминантной функции.

Например, значение дискриминантной функции для первого респондента составляет -3,327. Согласно построенной дискриминантной модели этот респондент с вероятностью 97,2% может быть причислен к группе туристов, посещающих дискотеки, в действительности же он не посещает дискотеки.

К сожалению, из-за большого числа несгруппированных наблюдений табл. 7.12 не показывает, сколько представленных результатов классификации из 20 являются ошибочными. В результате по данным этой таблицы нельзя составить даже приблизительного представления о точности прогнозов на основе построенной дискриминантной модели.

Точность прогнозов на основе построенной дискриминантной модели определяется из данных сводной таблицы результатов классификации, т.е. причисления объектов исследования к одной из исследуемых групп (табл. 7.13).

 

Из данных табл. 7.13 «Результаты классификации» видно, что исследуемая группа туристов, посещающих дискотеки, состоит фактически из 88 человек. Согласно построенной дискриминантной модели 62 туриста из 88 были корректно причислены к этой группе, а 26 — по ошибке причислены к группе туристов, не посещающих дискотеки. Итак, корректные результаты классификации составили 70,5%, а ошибочные — 29,5%.

По данным этой же таблицы исследуемая группа туристов, не посещающих дискотеки, состоит фактически их 935 человек. Согласно построенной дискриминантной модели 686 туристов из 935 были корректно причислены к этой группе, а 249 — по ошибке причислены к группе туристов, посещающих дискотеки. Итого корректные результаты классификации составили 73,4%, а ошибочные — 26,6%.

В иелом корректные результаты классификации составили 73,1%, т.е. в 73,1% случаев фактическая принадлежность!уриста к группе посещающих или не посещающих дискотеки совпадает с прогнозируемой, определенной на основе построенной дискриминантной модели. Это дает возможность сделать вывод, что точность прогнозов, сделанных на основе построенной дискриминантной модели составляет примерно 73%.

КОНТРОЛЬНЫЕ ВОПРОСЫ

Назовите цель проведения и возможности использования результатов дискриминантного анализа.

Как выглядит математическое описание дискриминантной модели?

Какие требования предъявляются к переменным, участвующим в дискриминантном анализе, относительно типов шкал измерения переменных?

Какие задачи решаются в ходе проведения дискриминантного анализа?

Каким образом и с какой целью выявляется наличие дискриминирующих свойств у переменных, выбранных в качестве независимых (дискриминационных) переменных дискриминантной модели?

Как можно интерпретировать результаты теста на равенство средних величин в группах, проводимого в ходе процедуры дискриминантного анализа, если значение «Significance» («Значимость») для определенной дискриминационной переменной составляет 0,637?

Что характеризует и с какой целью рассчитывается коэффициент корреляции между дискриминационными переменными? Как можно интерпретировать результаты таких расчетов, если значение коэффициента корреляции между двумя дискриминирующими переменными составляет 0,52?

Что характеризует и для чего рассчитывается коэффициент корреляции между расчетными значениями дискриминантной функции и реальной принадлежностью респондента к определенной группе? Как можно интерпретировать результаты, если значение этого коэффициента составляет 0,485?

Для чего в ходе проведения дискриминантного анализа рассчитывается показатель Лямбда Уилкса, как следует интерпретировать результаты, если значение величины «Significance» («Значимость») при расчете этого показателя составляет 0,02?

Для чего служат стандартизированные и нестандартизированные коэффициенты дискриминантной функции? Как следует интерпретировать результаты, если значения стандартизированных коэффициентов составляют: для дискриминационной переменной «1» — 0,692; дпя дискриминационной переменной «2» — 0,346?

Что характеризует расстояние между средними значениями и распределение дискриминантной функции в исследуемых группах?

Что представляет собой сводная таблица результатов классификации, выводимая в SPSS на экран компьютера среди результатов дискриминантного анализа, какие выводы можно сделать на основе данных этой таблицы?


ЗАКЛЮЧЕНИЕ

В странах с развитой рыночной экономикой, в частности в Германии, где темпы роста рынков отдельных товаров и услуг незначительны или рост вообще отсутствует, конкурирующие фирмы работают в условиях жесткой борьбы за потребителя. Для достижения успеха в этой борьбе активно используется весь спектр современных технологий маркетинговых исследований, в том числе предполагающих обработку информации при помощи статистических методов анализа.

Современные маркетологи должны владеть знаниями в области статистического анализа и навыками работы с соответствующими программными продуктами, наиболее популярным из которых в Европе является программа SPSS.

В Германии такие знания являются обязательными для студентов, обучающихся по специальности «Маркетинг». Все дипломные проекты и диссертационные исследования, которые защищаются по этой специальности, как правило, предполагают анализ информации с использованием программного пакета SPSS.

Пособие предназначено для российских студентов, обучающихся по специальности «Маркетинг», а также для всех желающих самостоятельно освоить основы статистического анализа в маркетинговых исследованиях.

Данная работа представляет лишь небольшую часть возможностей, предоставляемых пользователям SPSS. В частности, были рассмотрены не все методы статистического анализа, часто применяемые на практике, такие, как, например, многофакторный и многомерный дисперсионный анализ, логистическая регрессия и др. Для ознакомления с этим материалом рекомендуется использовать источники, указанные в списке литературы.

СПИСОК ЛИТЕРАТУРЫ

Бююль Ахам, Цефель Петер. SPSS: Искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей: Пер. с нем. СПб.: ДиаСофтЮП, 2002.

Гмурман В.Е. Теория вероятностей и математическая статистика: Учеб. пособие для вузов. 9-е изд. М.: Высшая школа, 2003.

Плис А.И., Слиеина Н.А. Практикум по прикладной статистике в среде SPSS: Учеб. пособие. В 2-х ч. Ч. 1. Классические процедуры статистики. М.: Финансы и статистика, 2004.

Таганов Д. Н. SPSS: Статистический анализ в маркетинговых исследованиях. СПб.: Питер, 2005.

Янкевич B.C., Безрукова Н.Л. Маркетинг в гостиничной индустрии и туризме: российский и международный опьгг/ Под ред. B.C. Янкевича. М.: Финансы и статистика, 2003.

Backhaus Klaus, Erichson Bemd, P/inke Wulff, Weiber Rolf. Multivariate analysemethoden. E ne anwendungsor entierte Einfu'irung. 9 Auflage. Berlin: Springer, 2000.

Brosius Felix, SPSS 11. Fundierte Einfuhrung in SPSS und Stati;t.k. Bonn: mitp-Verlag, 2002.

BiihlAchim, Zdfel Peter. SPSS 11. Einfuhrung in die moderne Datenanalyse unter Windows. Munchen: Pearson Studium, 2002.

Jassen Jiirgen, Laatz Wilfried. Statistische Datenanalyse mit SPSS fur Windows. Eine anwendungsorientierte E nfuhrung in das Basissystem und das Modul exakte Tests. Berlin: Springer, 2003.

Schmalen Helmut. Grundlagen und Probleme der Betribswirtschaf. 12 Auflage. Stuttgard: Schaffer- Poeschel Verlag, 2002.

Wittenberg Reinhard. Datenanalyse mit SPSS fur Windows. Stuttgart: Lucius& Lucius, 2003.


Учебное издание

Гертруда Моосмюллер,

Наталья Николаевна Ребик

МАРКЕТИНГОВЫЕ ИССЛЕДОВАНИЯ

С SPSS

УЧЕБНОЕ ПОСОБИЕ

Редактор JI. Е. Миронова Корректор Л. С. Куликова Компьютерная верстка О.В. Савостиной

Подписано в печать 23.06.2006. Формат 60x88/16. Бумага офсетная. Гарнитура Newton. Печать офсетная. Усл. печ. л. 9,8. Уч.-изд. л. 9,51. Доп. тираж 1500 экз. Заказ № 9484.

Издательский Дом «ИНФРА-М» 127282, Москва, ул. Полярная, д. 31 в. Тел.: (495) 380-05-40, 380-05-43. Факс: (495) 363-92-12.

E-mail: books@infra-m.ru http://www.infra-m.ru

Отпечатано с готовых диапозитивов в ОАО ордена «Знак Почета» «Смоленская областная типография им. В. И. Смирнова». 214000, г. Смоленск, проспект им. Ю. Гагарина, 2


[1] Тест Ливина (Levene's Test) — тест на равенсгво дисперсий в исследуемых группах. Дисперсия характеризует рассеяние значений переменной вокруг ее среднего значения. При сравнении средних величин в исследуемых группах необходимо принимать во внимание равенство или неравенство дисперсий.

Тест Ливина проверяет исходную (нулевую) гипотезу: «Дисперсии в исследуемых группах равны». Результат теста Ливина определяется значением показателя Significance («Значимость»). Если значение Significance не превышает 0,05, это означает, что вероятность ошибки при отклонении нулевой гипотезы составляет менее 5% (т.е. ниже допустимого уровня при доверительном интервале 95%). В этом случае исходная гипотеза может быть отклонена, т.е. она неверна. Значение Significance менее 0,05 доказы­вает ошибочность исходной гипотезы и статистическую значимость раз­личия дисперсий в исследуемых группах.

[2] Тест Дарбина—Уэтсона (Durbin— Watson Test) — тест на автокорреляцию. Автокорреляция выражается в наличии систематических связей между остатками.

В соответствии с теорией статистики уравнение простой регрессии (регрессионная модель) имеет вид у = а + bх + е,

где e — остатки (отклонения наблюдаемых значений от теоретически ожидаемых).

Остатки должны появляться случайно, т.е. не систематически. Для проверки этого условия проводится тест Дарбина—Уотсона. В ходе проведения этого тес га рассчитывается коэффициент, значение которого лежит в диапазоне от 0 до 4. Если значение коэффициента близко к среднему (т.е. к 2), это означает, что автокорреляция отсутствует, т.е. остатки появляются случайным образом.

[3] Лямбда Уилкса (Wilks' Lambda) — это критерий, используемый при прове­дении теста на предмет того, значимо ли различаются между собой сред­ние значения дискриминантной функции в исследуемых группах.

Построенная дискриминантная модель (дискриминантная функция) должна отражать четкое разделение исследуемых групп. Для оценки чет­кости этого разделения проводится тест с помощью критерия Лямбда Уилкса. В качестве исходной гипотезы выступает утверждение: «Средние значения дискриминантной функции в исследуемых группах равны». Верность исходной гипотезы определяется значением показателя «Significance». Если значение «Significance» не превышает 0,05, это означает, что вероятность ошибки при отклонении нулевой гипотезы состав­ляет менее 5% (т.е. ниже допустимого уровня при доверительном интер­вале 95%). В этом случае исходная гипотеза может быть отклонена, т.е. она неверна. Значение «Significance» менее 0,05 доказывает ошибочность ис­ходной гипотезы и статистическую значимость различия средних значе­ний дискриминантной функции в исследуемых группах.



Поделиться:


Последнее изменение этой страницы: 2016-04-08; просмотров: 310; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.222.179.186 (0.024 с.)