Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Исследование правильности построения продукционных правил

Поиск

Возьмем небольшую обучающую выборку (табл. 4.1), рассмотренную Р.Куинланом в работе [4].

Таблица 4.1 Обучающая выборка

 

Outlook (Погода) Temperature (Температура) Humidity (Влажность) Wind (Ветер) Play ball? (Играть в мяч?)
  sunny hot high weak No
  sunny hot high strong No
  overcast hot high weak Yes
  rain mild high weak Yes
  rain cool normal weak Yes
  rain cool normal strong No
  overcast cool normal strong Yes
  sunny mild high weak No
  sunny cool normal weak Yes
  rain mild normal weak Yes
  sunny mild normal strong Yes
  overcast mild high strong Yes
  overcast hot normal weak Yes
  rain mild high strong No

 

В данной обучающей выборке объекты характеризуются значениями 5 признаков – Outlook, Temperature, Humidity, Wind, Play ball. Последний атрибут является целевым, он определяет два возможных класса (yes,no). Для начала построим набор продукционных правил с помощью алгоритма CN2 и сравним полученный результат с деревом из работы Р. Куинлана. Так как дерево может быть представлено в виде набора продукционных правил, мы сможем оценить эффективность разработанного алгоритма CN2.

Однозначного сходства полученных в результате обучения продукционных правил с правилами из алгоритма ID3 добиться не получилось, в силу того, что в алгоритме CN2 выбор очередного примера SEED, а также , имеет «случайный» характер, что значительно влияет на полученные продукционные правила.

На рисунке 4.1 представлены продукционные правила, полученные с помощью алгоритма CN2 и дерево решений из статьи Р. Куинлана.

а)

 

б)

 

 

Рис. 4.1 Полученные продукционные правила (а – программная реализация, б – из статьи Р.Куинлана)

 

Так как на рисунке 4.1 изображены две разные модели представления правил, для удобства преобразуем дерево решений в набор продукционных правил:

 

1) Если Outlook= Sunny & Humidity = High, то Play Ball = false

2) Если Outlook= Sunny & Humidity = Normal, то Play Ball = true

3) Если Outlook= Overcast, то Play Ball = true

4) Если Outlook= Rain & Wind = Strong, то Play Ball = false

5) Если Outlook= Rain & Wind = Weak, то Play Ball = false

 

Преобразованные правила из дерева решений ID3 имеют сходство с правилами, полученными с помощью алгоритма CN2, что говорит о корректной работе реализованного алгоритма.

 

4.2. Оценка точности классификации примеров(с помощью алгоритма CN2)

В этом разделе мы изложим результаты экспериментов на данных задач монахов. Далее задачи монахов будут обозначены как Monk 1, Monk 2 и Monk 3.

Результат классификации в задаче MONK1(CN2)

Первая задача монахов состоит в том, чтобы в результате обучения получить классифицирующее правило, которое позволяет отнести понятие к какому-либо классу. Целевое понятие может быть представлено как простое выражение: [ x2 = 1] Ú [ x 4 = x 5] Þ M1, которое можно интерпретировать следующим образом: «если для неизвестного объекта атрибут x 2 принимает значение 1 или атрибуты x 4 и x 5 принимают одинаковое значение (неважно, какое именно), то вне зависимости от значений других атрибутов следует классифицировать этот объект как принадлежащий понятию M 1». В данном случае для оценки ошибки классификации был применен метод «обучения и проверки». Обучающее множество состояло из 124 примеров (62 положительных и 62 отрицательных), что составляет 30% от полного пространства примеров (432 объекта). Множество тестовых примеров включало все возможные примеры (216 положительных и столько же отрицательных). Каждый объект характеризуется шестью условными атрибутами (области значений которых дискретны и включают малое число

значений) и одним решающим атрибутом (с двумя классами решения).

Рис.4.2 Результат обучения для набора данных MONK1.

Была произведена серия опытов на различных экзаменационных наборах примеров, результаты классификации приведены ниже:

Рис.4.3 Результаты опытов задачи MONK1.



Поделиться:


Последнее изменение этой страницы: 2016-08-10; просмотров: 222; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.135.206.25 (0.007 с.)