Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь КАТЕГОРИИ: АрхеологияБиология Генетика География Информатика История Логика Маркетинг Математика Менеджмент Механика Педагогика Религия Социология Технологии Физика Философия Финансы Химия Экология ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Проведение кластерного анализа
В пакете «Stadia»
В пакете Stadia метод кластерного анализа позволяет: – строить дерево классификации n объектов посредством иерархического объединения их в группы или кластеры все более высокой общности на основе критерия минимума расстояния в пространстве m переменных, описывающих объекты; – находить разбиение некоторого множества объектов на заданное число компактных кластеров. Заметим, что кластерный анализ не содержит вычислительного механизма проверки гипотезы об адекватности получаемых классификаций. Исходные данные представляют в виде матрицы размером m·n., содержащую информацию одного из следующих трех типов: – измерение значений m переменных для n объектов; – квадратная (m=n) матрица расстояний между парами объектов; – квадратная (m=n) матрица близостей всех пар n объектов. В матрице близостей или расстояний может быть заполнена лишь нижняя левая половина (т. е поддиагональные элементы), а верхняя половина заполнена нулями. После запуска процедуры (Q =кластерный) в типовом бланке «Анализ переменных» нужно выбрать для анализа переменные из электронной таблицы, или же все переменные. Далее выбором из меню «Исходные данные» необходимо указать тип исходных данных: прямоугольная матрица, переменные (столбцы) и объекты (строки) или же квадратная матрица взаимных расстояний или близостей между всеми парами объектов. Если исходные представляют собой значение m переменных для n объектов, то далее из меню «Метрика вычисления расстояний» необходимо выбрать метод вычисления расстояния между объектами в многомерном пространстве. После этого из появившегося меню «Объединяющая» выбирают стратегию объединения (ближайшего соседа, дальнего соседа и т.д). В случае объединяющего метода задается вопрос о необходимости вывода диагональной матрицы расстояний между объектами, в которой строки будут соответствовать объектам (i=2,…, m), а столбцы – объектам от 1 до i – 1. Далее производится выдача последовательности кластеров возрастающей общности с указанием номеров входящих в кластеры объектов и расстояние, на уровне которого произошло объединение каждого кластера. После этого строится дендрограмма – дерево объединения кластеров с порядковыми номерами объектов по горизонтальной оси и со шкалой расстояний по вертикальной оси.
Заметим, что в случае выбора дивизионной стратегии необходимо указать число кластеров, на которые желательно разбить множество объектов в соответствующем меню, причем окончательное количество кластеров может получиться меньше этого числа, если затребованного разбиения для этих данных невозможно. Пример. Провести классификацию 6 объектов, каждый из которых характеризуется двумя признаками.
Для выполнения задания проделайте следующие пункты: 1. Откройте чистый рабочий лист в пакете Stadia. 2. Заполните таблицу на этом листе (без «Номер объекта», далее по столбцам). 3. Выполните команды: Статист=F9, среди многомерных методов выбрать Q – кластерный. 4. В появившемся окне «Анализ переменных» выбрать все. В окне «Исходные данные» выбрать «Переменные объекты». В окне «Метрика вычисления расстояний» выбрать «1 - Эвклид» после этого в меню «Объединяющие» выбрать «Ближайшего соседа». Вывод графиков проекции отменить. В итоге получаем результаты: КЛАСТЕРНЫЙ АНАЛИЗ. Файл: klastan.std Эвклид+Ближ.сосед
Таблица расстояний (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (2) 2,236 (3) 3 1,414 (4) 5,099 5 6,403 (5) 6,083 5,831 7,211 1 (6) 5,831 6,403 7,81 2 2,236
К л а с т е р ы: (список объектов) -> расстояние (5,4) --> 1 (3,2) --> 1,414 (6,5,4) --> 2 (3,1,2) --> 2,236 (6,3,1,2,5,4) --> 5
|
||||||||||||||||||||||||||
Последнее изменение этой страницы: 2021-12-15; просмотров: 74; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.224.39.32 (0.005 с.) |