Кнопки вікна результатів кластеризації методом k-середніх 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Кнопки вікна результатів кластеризації методом k-середніх



Summary: Cluster means & Euclidean distances Середні значення змінних у кластерах і Евклідові відстані між кластерами
Analysis of variance Аналіз варіації
Graph of means Графік середніх
Descriptive statistics for each cluster Основні характеристики кластерів
Members of each cluster & distances Елементи, що ввійшли в кластери і відстані елементів до центрів кластерів

 

Рис. 27. Графік середніх значень показників для кластерів

 

До основних характеристик кожного кластера належать наступні: середнє значення, стандартне відхилення та варіація для кожного показника (змінної) в кожному кластері. Тут також зазначається кількість елементів, що ввійшли в кожен кластер.

На рис. 28 наведені регіони, що об’єдналися в окремі кластери, й Евклідові відстані від них до центрів кластерів.

 

Рис. 28. Елементи кластерів, отриманих методом k-середніх

 

Завдання. Самостійно порівняйте результати кластеризації ієрархічним методом і методом k-середніх. Проведіть класифікацію ієрархічним методом, задавши інші поєднання алгоритму і міри відстані. Проведіть класифікацію методом k-середніх, задавши інші початкові умови вибору центрів кластерів. Порівняйте отримані результати. Поясніть, чому при різних початкових умовах класифікації отримані кластери мають різний склад. Ознайомтеся з іншими можливостями модуля Кластерного аналізу.

Класифікація на основі дискримінантної функції

Модуль Дискримінантний аналіз використовується у випадку, коли маємо групи об’єктів і перед нами стоїть завдання віднесення нового об’єкта до якоїсь групи та коли необхідно встановити правила віднесення об’єкта до певної групи. Розглянемо приклад.

Нехай, підприємства характеризуються наступними економічними показниками: х1 – продуктивність праці, х2 – питома вага робітників у складі промислово-виробничого персоналу, х3 – коефіцієнт змінності устаткування (змін), х4 – питома вага втрат від браку (%), х5 – фондовіддача активної частини основних виробничих фондів. Значення вказаних показників для 20 підприємств наведені у табл. 9. Зверніть увагу, що 17 підприємств уже розкласифіковані на дві групи, а три підприємства необхідно віднести до певної групи.

Таблиця 9

Вихідні дані для аналізу

№ п/п х1 х2 х3 х4 х5 група
  9,26 0,78 1,37 0,23 1,45 а
  9,38 0,75 1,49 0,39 1,3 а
  12,11 0,68 1,44 0,43 1,37 а
  10,81 0,7 1,42 0,18 1,65 а
  9,35 0,62 1,35 0,15 1,91 а
  9,87 0,76 1,39 0,34 1,68 а
  9,12 0,71 1,27 0,09 1,89 а
  5,49 0,74 1,1 0,05 1,02 b
  6,61 0,72 1,23 0,48 0,88 b
  4,32 0,68 1,39 0,41 0,62 b
  7,37 0,77 1,38 0,62 1,09 b
  6,64 0,77 1,35 0,5 1,32 b
  5,52 0,72 1,24 1,2 0,68 b
  9,37 0,79 1,4 0,21 2,3 а
  5,68 0,71 1,28 0,66 1,43 b
  5,22 0,79 1,33 0,74 1,82 b
  10,02 0,76 1,22 0,32 2,62 а
             
  8,17 0,73 1,16 0,38 1,94 ?
  6,3 0,73 1,25 0,21 2,06 ?
  8,72 0,79 1,41 0,45 2,22 ?

 

Запустити програму Statistica. Сформувати таблицю вихідних даних. Зауважимо, що в таблицю вихідних даних необхідно додати кілька рядків без даних (вони призначені для об’єктів, які потрібно віднести до певного класу). На панелі інструментів Statistics або в меню Statistics вибрати функцію Discriminant AnalysisДискримінантний аналіз. У стартовому вікні Дискримінантного аналізу потрібно обрати групувальний показник – Grouping (у нашому випадку – „група”) і незалежні змінні – Independent (рис. 29). У цьому ж вікні можна зробити додаткові установки.

 

Рис. 29. Стартове вікно Дискримінантного аналізу

 

Натиснувши кнопку ОК, одержимо вікно результатів (рис. 30).

 

Рис. 30. Вікно результатів дискримінантного аналізу

В інформаційній частині вікна міститься наступна інформація: кількість змінних у моделі, значення лямбди Уілкса, значення критерію Фішера для апроксимації. У функціональній частині вікна є ряд кнопок для всебічного перегляду результатів.

Натиснувши кнопку Classification functionsКласифікаційні функції, одержимо коефіцієнти дискримінантних функцій для двох груп (рис. 31). Угорі в таблиці вказана ймовірність віднесення підприємства до тієї чи іншої групи.

 

Рис. 31. Коефіцієнти дискримінантних функцій

 

Ініціювавши кнопку Classification matrix, одержимо матрицю класифікацій, у якій зазначено кількість спостережень у кожній групі й імовірність попадання спостережень у групи (рис. 32). Зверніть увагу на цю матрицю. У стовпці Percent Correct указаний процент правильної класифікації об’єктів. У рядках матриці вказана спостережувана класифікація підприємств, а у стовпцях – отримана за побудованими дискримінантними функціями. З матриці видно, що у цьому прикладі не спостерігається випадків неправильної класифікації.

 

Рис. 32. Матриця класифікацій

 

Класифікацію елементів можна одержати, натиснувши на кнопку Classification of cases. Якщо у стовпці Cases не виявиться елементів, позначених „зірочкою”, то це свідчить про коректну класифікацію і гарну апроксимацію дискримінантних функцій.

Для того, щоб класифікувати нові об’єкти (підприємства), НЕ ЗАКРИВАЮЧИ АНАЛІЗ, вводимо у вихідну таблицю значення тих об’єктів, які потрібно віднести до певної групи. Потім у вікні аналізу результатів ініціюємо кнопку Posterior ProbabilitiesАпостеріорні ймовірності. В результаті одержимо таблицю класифікацій, за якою визначаємо, у який клас увійшли нові об’єкти (рис. 33). Так підприємства 18 і 20 увійшли в групу а, а підприємство 19 – у групу b. (Дивіться значення ймовірності попадання об'єкта в ту або іншу групу. Для якої групи ймовірність вища, до тієї групи і відноситься об'єкт).

 

Рис. 33. Апостеріорні ймовірності

 

Завдання. Самостійно ознайомтеся з іншими можливостями модуля Дискримінантного аналізу. Проведіть покроковий дискримінантний аналіз, змінюючи початкові установки. Порівняйте результати, отримані різними методами.


 

РЕКОМЕНДОВАНА ЛІТЕРАТУРА

 

Основна література

Боровиков В. П. Популярное введение в программу STATISTICA. – М.: КомпьютерПресс, 1998. – 268 с.

Боровиков В. П. STATISTICA – статистический анализ и обработка данных в среде Windows / В. П. Боровиков, И. П. Боровиков. – 2-е изд. Стереотип. – М.: Информ.-изд. дом «Филинъ», 1998. – 608 с.

Дубров А. М. Многомерные статистические методы: Учебник / А. М. Дубров, В. С. Мхитарян, Л. И. Трошин. – М.: Финансы и статистика, 2000. – 352 с.

Єріна А. М. Статистичне моделювання та прогнозування: Навч. посібник. – К.: КНЕУ, 2001. – 172 с.

 

Додаткова література

Багатовимірний статистичний аналіз / П. О. Іваненко, І. В. Семеняк, В. В. Іванов. – Харків: Вид. „Основа”, 1992. – 144 с.

Гирко В. Л. Многомерный статистический анализ. – М.: Статистика, 1988. – 320 с.

Дюран Н. Кластерный аналіз / Н. Дюран, П. Оделл. – М.: Статистика, 1977. – 128 с.

Єгоршин О. О. Методи багатовимірного статистичного аналізу: Навч. Посібник / О. О. Єгоршин, А. М. Зосімов, В. С. Пономаренко. – К.: ІЗМН, 1998. – 208 с.

Мандель И. Д. Кластерный анализ. – М.: Финансы и статистика, 1988. – 176 с.


 

Навчальне видання

Методичні рекомендації до виконання практичних завдань на ПЕОМ з курсу „Комплексний статистичний аналіз” для студентів спеціальності 7.050110 денної форми навчання

 

 

Укладач Конюшенко Ірина Григорівна

 

 

Відповідальний за випуск Сєрова І. А.

 

Редактор Гончаренко Т. О.

Коректор Флорінська О. Ю.

 

 

План 2004 р., Поз. № 273

Підп. до друку Формат 60×90 1/16.

Папір TATRA. Друк офсетний.

Ум.-друк. арк. 2,5. Обл.-вид. арк.

Тираж прим. Зам. № Безкоштовно

Свідоцтво про внесення до Державного реєстру суб’єктів видавничої справи ДК №481 від 13.06.2001 р.

Видавець і виготівник – видавництво ХДЕУ, 61001, м. Харків, пр. Леніна, 9а.



Поделиться:


Последнее изменение этой страницы: 2016-09-05; просмотров: 238; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.226.254.255 (0.016 с.)