Вывод результатов и их анализ. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Вывод результатов и их анализ.



Информационная часть диалогового окна Joining Results Discriminant Function Analisis Results (результаты анализа кластерных функций) сообщает, что:

-Number of variables-число переменных;

-Number of cases - число наблюдений;

-Missing data were casewise deleted - осуществлена классификация наблюдений или переменных (зависит от уровня параметра в строке Cluster в предыдущем окне настройки.)

-Amalgation (joing) rule - правило объединения кластеров (название иерархического агломеративного метода, заданного в строке Amalgation rules, а в предыдущем окне настрйки);

-Distanсe.metric is - Метрика расстояния (зависит от установки в строке Distance measure в предыдущем окне настройки.

Пользователь может вызвать на экран горизонтальную и вертикальную диаграмму (Horizontal hierachical plot или Vertical icicle plot) (рис.4).

 

Рис.4. Древовидная кластеризация

 

Чтобы вернуться в окно, содержащее другие результаты кластерного анализа, необходимо щелкнуть по Continue.

Щелчком мыши можно раскрыть строку Amalgamation schedule, содержащую протокол объединения кластеров. Рис.5

 

Рис.5. Протокол объединения кластеров

В заголовке указан иерархический агломеративный метод и метрика расстояния. Таблица может занимать несколько окон.

Следующей в окне результатов идет кнопка Graph of amalgamation schedule. После щелчка, раскрывается окно, содержащее ступенчатое, графическое изображение изменений расстояний при объединении кластеров рис.6.

 

Рис.6. Графическое изображение изменений расстояний при объединении кластеров

Вернемся в основное окно результатов и классификации. Для просмотра же матрицы расстояний необходимо осуществить щелчок на строке Distance matrix (рис.7).

 

Рис.7. Матрица расстояний

Порядок выполнения работы

3.1. В качестве объекта исследования рассматриваются несколько серверов предприятия N.

3.2. Ознакомление с данными, приведенными в таблице (для варианта указанного преподавателем):

3.2.1. Запустите программу STATISTICA.

3.2.2. В появившемся меню выберите пункт «Basic Statistics and Tables».

3.2.3. Откройте файл Lab_х.STA - меню «File», пункт «Open Data...»

3.2.4. В появившейся таблице в столбцах показаны месяцы (TIME_xx), в течение которых велся мониторинг информационной безопасности на предприятии N. 

3.3. Провести расчет величины математического ожидания, дисперсии, минимального и максимального значения количества атак для различных типов атак, отчётных периодов (месяцев) и серверов.

3.3.1. Для столбцов:

Выделите таблицу. В меню “Edit” выберите “Block Stats/Columns” à “Mean” – математическое ожидание. проделайте то же самое для “SD's” - дисперсия, “Max's” - максимальное значение, “Min's” - минимальное значение.

3.3.2. Для строк:

Проделайте то же самое и для “Block Stats/Rows”, только при этом следунт выделять не все поле данных, а сначала для колонок атак, а затем для колонок месяцев. Для появившихся колонок выберите правильный формат предоставления данных.

3.4. Построение графиков отдельных видов атак и нескольких типов атак с использованием гистограмм. Построение графиков закона распределения использования трафика.

Для построения двумерных графиков необходимо воспользоваться в меню “Graphs” пунктами “Stats 2D Graphs” à “Histograms” и “Stats 2D Graphs” à “Bar/Column Plots…”.

Для построения трёхмерных графиков необходимо воспользоваться в меню “Graphs” пунктом “Stats 2D Sequential Graphs” à “Raw Data Plots…”.

3.5. Кластерный анализ

Необходимо произвести обработку данных методом древовидной кластеризации с использованием Евклидового расстояния и методом одиночной связи. Произвести повторную кластеризацию используя другие меры расстояния и правила объединения. Сравнить результаты.

3.5.1. Объединение (древовидная кластеризация)

В диалоговом окне Clustering Method или в меню Analysis выбрать пункт Joining (tree clustering). В появившемся диалоговом окне Clustering Analysis: Joining (tree clustering) необходимо настроить следующие параметры:

Variables. После нажатия этой кнопки появиться диалоговое окно, содержащее список всех столбцов таблицы. Необходимо выбрать столбцы, значения которых будут анализироваться.

Input Data. Выпадающий список позволяет выбрать тип анализируемых данных из двух значений:

-Raw Data. Анализируются столбцы таблицы, выбранные в пункте Variables.

(т.е. возможен анализ как по времени, так и по типам атак).

-Distance Matrix. Анализируется готовая матрица расстояний, в отличие от предыдущего значения, где матрица расстояний формируется на основе выбранных столбцов.

Необходимо установить Raw Data. 

Cluster. Выпадающий список позволяет выбрать расположение анализируемых данных из двух значений:

-Variables (columns). Производиться кластеризация объектов для выбранных столбцов.

-Cases (rows). Производиться кластеризация объектов для выбранных строк.

- Amalgamation (linkage) Rules. Выпадающий список позволяет выбрать правила объединения или связи анализируемых данных из значений, описанных выше.

Distance Measures. Выпадающий список позволяет выбрать меры расстояния анализируемых данных из значений, описанных выше.

3.5.2. Двувходовое объединение

Необходимо произвести кластеризацию данных методом двухвходового объединения для значения коэффициента преобразования равному 0. Произвести повторную кластеризацию, используя другие коэффициенты преобразования (Threshold Value). Сравнить результаты.

В диалоговом окне Clustering Method или в меню Analysis выбрать пункт Two-way joining. В появившемся диалоговом окне Clustering Analysis: Two-way joining необходимо настроить следующие параметры:

Variables. После нажатия этой кнопки появиться диалоговое окно, содержащее список всех столбцов таблицы. Необходимо выбрать столбцы, значения которых будут анализироваться.

Threshold Value. В этой области выбирается коэффициент масштаба, на который делятся меры расстояния между объектами в кластерах. Можно выбрать следующие значения:

-User Defined. Значение коэффициента масштаба устанавливается пользователем.

-Computed from data. Значение коэффициента масштаба определяется массивом данных автоматически.

Содержание отчета

Отчёт должен содержать:

4.1. Таблицы с результатами статистической обработки данных (математическое ожидание, дисперсия и т.д.);

4.2. Графики изменения числа атак во времени (скриншоты);

4.3. Дендрограммы, полученные с помощью кластерного анализа (скриншоты).


ЛАБОРАТОРНАЯ РАБОТА 2



Поделиться:


Последнее изменение этой страницы: 2020-12-09; просмотров: 158; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.144.252.140 (0.007 с.)