Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву

Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

Главная Избранные Случайная статья Познавательные Новые добавления Обратная связь FAQ

Поняття класифікації, задача класифікації

⇐ ПредыдущаяСтр 5 из 5

Під терміном класифікація розум розподіл предметів за заг. класами згідно най б. суттєвих ознак, які притаманні предметам даного типу і які відрізняють їх від предметів інших типів. Класиф провод за наступними правилами:

1. в одній класиф. викор. Одна основа; 2. об’єм класу = сумі об’ємів підкласів коли і підкласи пересікаються; 3. поділ на підкласи пр неперервно.

Виявлення природного розподілу вихідних спостережень і розбиття на чіткі групи: кластери, таксони.

Типізація – сукупність даних і об’єктів розбив. на порівняно велику областей групув. так щоб елементи однієї області знах. один від одного на невеликій відстані; в кластері дані про близькість. Класиф. об’єктів можна пров. за допомогою якісних, кількісних і інших ознак. Викор-ся формальні мат. Методи розбиття на класи є експериментальним метод, при якому розб. на класи проводять спеціалісти з однієї області, використовуючи проф. знання, доск.

Кластерний аналіз – це сукупність методів, але розбиття спостер. на однорідні групи. Техніка класиф. викор. в різних областях.

Задачі класт. аналізу є 2-х видів:

за об’ємом – класиф. відносно невеликих за об’ємом сукупностей;

класиф. великих об’ємів багатовимірних спостережень.

Задачі класиф. ділять за типом апріорної інф-ції: 1. кількість класів задана; 2. кількість класів невідана і її треба визнач.; 3. кількість класів непотрібна.

Дерева – агломеративне та дивизивне

Основні поняття кластерного аналізу; застосування

Виділяють 3 основні кластерні процедури:

1. ієрархія алгоритмів ідомезивні;

2. паралельна процедура за допомогою ітераційних алгоритмів;

3. послідовні процедури з малою кількістю спостережень.

Кластер – накопичення, група елементів, які хар-ся деякою заг. властивістю, методи їх знаходження і є кластер ний аналіз.

Таксон – систематизована група б-я категорії, методи їх знаходження назив. чисельною таксономією.

Матричний простір – пара (х,d), яка склад-ся з деякої множини елементів простору Хі і відстані d.

Функція відстані – однозначна, невідємна, дійсна ф-ція для якої викон-ся аксіоми: 1. d(xu, xs)≥0; 2. d(xu, xs)=0 – максимальна близькість елементів з самим собою, коли xu=xs; 3. d(xu, xs)= d(xs, xu,) – симетрія; 4. d(xu, xs)≤ d(xu, xz)+ d(xz, xs).

Міра подібності - однозначна, невідємна, дійсна ф-я Г(xu, xs), яка визначена для б-я xs, якщо виконується аксіома: а). 0≤ r(xu, xs)<1, б-я xu≠xs; б). r(xu, xs)=1, xu=xs; в). r(xu, xs)= r(xs, xu), г). d(xs, xv)>d(xu, xs) =>r(xz, xv)≤ r(xu, xs).

Типи відстаней і мір подібностей

В ієрархічних схемах групування об’єктів найбільш розповсюдженою формою графічного зображення є дендограма і її двовимірним аналогом дендограф. Одновимірний граф для зображення із заданої множини. Об’єкти розміщені за ієрархічними рівнями так щоб підкреслити їх взаємну подібність на основі вимірювань. 0бєднання елементів групи має зміст в умовах високого ступеня подібності між ними. Компактне групування свідчить про силу зв’язків між об’єктами, компоненти на слабку залежність. Вітки дерева хар-ють ієрархічний порядок об’єктів але не відображають ієрархічну залежність між об’єктами. Дворим. дендограма що описує залежність як в середені так і зовні.

Агломеративна кластерна процедура пов’язана з обчисленням міри між всіма парами об’єктів і обєдн. на кожному кроці тієї пари для якої досягається min і max даних ф-й. Кластиризація здійснюється шляхом обєднаня спочатку роз’єднаних к об’єктів.

Дивизивна кластерна процедура. пов’язана з обчисленням мір залежності між парами об’єктів і виділенням на кожному кроці тієї пари об’єктів для якої досягається min max даних ф-й. Кластер. здійснюється шляхом розбиття однієї групи об’єктів.

Однорідною назив. сукуп. елементів якої формують під дією основних причин і умов а їх закони розподілу мають просту структуру.

Неоднорідна- коли її різні елементи формуються під впливом різних причин і умов, або якщо вона представляється у вигляді обєднання деякої кількості однорідних сукупностей з більш простою структурою законів елементів.

Оцінювальні індекси кластерного аналізу: а) величина зовнішнього критерію значимості-процент спів падання передбачених експертів з результатами процедур кластрног аналізу; б) в якості внутрішнього критерію значимості допускається кофенетичний коефіцієнт кореляції; в) міра відтворення- спеціальний коефіцієнт кореляції.

Коефіцієнт подібності чи відмінності між і-ми спостереженнями діляться на 3 типи:

dr (xut,xst)=();коеф. відстані

-де r додатне ціле число а m- кількість змінних. Коли r =1- манхетська відстань; r =2- томсономічна.

Коефіцієнти асоціативності

r(xut,xst)= коеф. асоціативності

призначені для оцінювання подібності иіж парами багатовимірних спостережень що описуються деякими значеннями у вигляді війкового коду. В коеф. асоціативності представляються коеф. загальної подібності.

S- набув від [0;1] подібність між станами ознак xu,xw;

W- вага, що приписана даній ознаці.

Коефіцієнт кореляції до добутку стандартних відхилень:

r = .

Приклади відстаней

Наведемо ф-ї відст. і мір.:

2. Зважена Евклідова відстань.

3. - звичайна відстань Махаланобіса

4. Зважена відстань Махаланобіса

5. Хемінгова відстань: .

6.Евристичні міри віддаленості – вони не є метриками через недотримання аксіом.

Дискримінант ний аналіз.

Методи дискр. аналізу виробл. деякі виріш. правила, що дозв. віднести запропоновані об’єкти до заданих класів. Вирішальні правила можуть бути стр. у вигляді ймов. (метод Баєса); простих функ. класиф. як у лін. дискр. анал. Фішера. Дискримін. ф-цій; у вигляді деяких характеристик; у вигляді ваг і зміщень нейронів.

Нехай А₁, А₂ множина к об’єктів для простоти будемо розглядати два об’єкти причому кожному об’єкту поставимо у відпов. α=(α1, α2, … α_n);η=(η1, η2, … η_n);

Будемо вважати, що для кожної величини відомі певні параметри Q₁=Q₂. В більшості випадків під Q₁ і Q₂розуміють багат. вибірок об’ємом n₁ і n₂ відпов. із А елементів x_t={ x_t₁, x_t₂, …, x_tm}; y_t={ y_t₁, y_t₂, …, y_tm} a Є А1, А2.

Треба прим. вирішальне правило, яке дозв. віднос. об’єкти. Позначимо результат двовим. спостер. через Z={ z_t₁, z_t₂, …, z_tm}; вирішальне правило заклечатись в тому, що спостер. Z_t віднос. до того, що весь n-вимірний простір, в якому результат представл. буде розд. на 2 області на і R_2;причому якщо результат поп. в R₁прийм. рішення про його належ. до А1, а якщо в R₂то до А2. Звичайно не викл. помилки, рішення про належн. об’єкта з А до А1 є помилк. і насправді позн. вартість встрат через С(А1/А2) та С(А2/А1). Припустимо, що ці об’єкти змішані у відпов. співвідн. а Є А2~q2$ a Є A1~q1.

Q1+q2=1; як ймов. події яка,що взятий об’єкт буде належ. до А1.

⇐ Предыдущая 1 2 3 45

Читайте также:

Алгоритмические операторы Matlab

Конструирование и порядок расчёта дорожной одежды

Исследования учёных: почему помогают молитвы?

Почему терпят неудачу многие предприниматели?

Последнее изменение этой страницы: 2016-09-18; просмотров: 329; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.15.197.123 (0.007 с.)