Особенности аргументированного обучения 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Особенности аргументированного обучения



 

Обычно машинное обучение состоит из этапов:

· Выбор обучающего множества.

· Поиск предсказывающих (продукционных) правил.

В ABCN2 методе добавляется еще один этап: аргументирования примеров обучения. Каждый пример представляет собой вектор значений атрибутов. Исходя из этого, аргументы используются для того, чтобы объяснить, почему пример обучения относится, именно, к данному классу (аргументы, выступающие за принадлежность примера к классу, называются положительными аргументами) или не должен относится к классу

(аргументы, выступающие против принадлежности примера к классу, называются отрицательными аргументами).

Рассмотрим пример связанный с выдачей кредита. Пусть есть набор примеров, в каком случае можно выдавать кредит и в каком - нельзя. Предсказывающими атрибутами здесь являются:

· Имя (имя заемщика).

· РегулярностьВыплат [да, нет] (да - заемщик регулярно погашал кредит, нет - не регулярно).

· Достаток [высокий, низкий] (уровень достатка).

· ЦветВолос [блондин, шатен].

Целевой или предсказываемый атрибут в этом примере - ВыдачаКредита - принимает два значения: {да – кредит был выдан, нет – отказ в выдачи кредита}. Обучающее множество приведено в табл.2.1

 

Таблица 2.1 Обучающее множество.

Имя РегулярностьВыплат Достаток ЦветВолос Выдача Кредита
Браун Нет Высокий Блондин Да
Грей Нет Низкий Шатен нет
Вайт Да Низкий Блондин Да

Использование обычного алгоритма обучения приведет к получению следующего правила:

Если ЦветВолос = блондин то ВыдачаКредита = Да

С одной стороны, такое правило является правильным, потому что оно покрывает два из трех примеров. С другой стороны, полученное правило не представляет никакой значимости для финансового эксперта (цвет волос не может быть определяющим в решении выдачи кредита). Посмотрим, что изменится, если ввести аргументы для примеров обучения. Пусть, эксперт проаргументировал пример с выдачей кредита Брауну: Браун получил кредит, потому что Достаток = высокий. С помощью аргументированного обучения получим правило:

Если Достаток = высокий то ВыдачаКредита = Да

Данное правило объясняет, почему Браун получил кредит: кредит был выдан, потому что Браун имеет высокий достаток. Основная мотивация использовать аргументы в обучении состоит из двух преимуществ:

· Причины (аргументы) налагают ограничения на множество гипотез, что ведет к уменьшению зоны поиска.

· Полученные правила имеют высокую значимость (на этапе прогнозирования класса) для эксперта.

Первое преимущество, использования аргументов, позволяет путем уменьшения всех возможных гипотез сократить время поиска продукционных правил. Кроме того, уменьшение количества рассматриваемых гипотез избавляет от возможности комбинаторного взрыва. Второе преимущество, в том, что в отличие от многих методов обучения, мы получаем правила, которые объясняют принадлежность примера определенному классу. Указанные аргументы позволяют получать гипотезы, которые представлены терминами эксперта.

 

2.5.2 Аргументирование примеров

 

Пример E из выборки обучения, используемый в алгоритме CN2, представляет пару (A,C), где A - это вектор значений атрибутов, С – это класс принадлежности примера. Атрибут может иметь дискретный или непрерывный тип. В алгоритме ABCN2 кроме примеров используемых в СN2 добавляются аргументированные примеры. Аргументированный пример AE представляет тройку:

AE = (A, C, Arguments),

где A - это вектор значений атрибутов, С – это класс принадлежности примера, Arguments – это множества аргументов ,…, , где представляет собой одну из форм:

C потому что Reasons, или С несмотря на Reasons.

Первая форма – используется, когда аргументы являются положительными для примера, вторая – отрицательными. Reasons = & &… - представляет собой конъюнкцию причин ( ,…, ), выступающих за или против принадлежности примера классу С, где - это часть положительного или отрицательного аргумента. Каждая причина может быть представлена в одной из пяти форм:

· X = – означает, что значение атрибута X является причиной того, что пример принадлежит классу. Данная форма допускается только для атрибутов с дискретным типом.

· X > (или X >= )– означает, что значение атрибута Х выше (больше либо равно) порогового значения класса.

· X < (или X <= )– означает, что значение атрибута Х меньше (меньше либо равно) порогового значения класса.

· X > (или X >=) – означает, что значение атрибута достаточно высокое (больше либо равно) порога для того, чтобы отнести выбранный пример классу. Данная форма используется, если неизвестно пороговое значение.

· X < (или X <=) – означает, что значение атрибута достаточно низкое (меньше либо равно) порога для того, чтобы отнести выбранный пример классу. Данная форма используется, если неизвестно пороговое значение.

Например, аргументом эксперта в выдачи кредита господину Брауну может быть: Браун получил кредит, потому что он имеет высокий достаток (Достаток = высокий). Отрицательным аргументом может быть: Браун получил кредит, несмотря на то, что нерегулярно оплачивал предыдущий кредит. Пример с Брауном с учетом аргументов:

({ РегулярностьВыплат = нет, Достаток = высокий, ЦветВолос = блондин },

ВыдачаКредита = да,

{ ВыдачаКредита = да потому что Достаток = высокий,

ВыдачаКредита = да несмотря на РегулярностьВыплат = нет }),

где вектор значений атрибутов A = { РегулярностьВыплат = нет, Достаток = высокий, ЦветВолос = блондин }, класс С = (ВыдачаКредита = да), аргументы Arguments = { ВыдачаКредита = да потому что Достаток = высокий, ВыдачаКредита =да несмотря на РегулярностьВыплат = нет }.

Аргументы, указанные экспертом для примера с господином Брауном, накладывают ограничения на формируемые правила. В алгоритме ABCN2, правила имеют вид:

Если Условие то Класс,

где условие представляет собой конъюнкцию из простых условий, так называемых селекторов. Селектор образован в виде имени атрибута и его значения, например ЦветВолос = блондин, имени атрибута и порогового значения, например Цена > 3000. Необходимо учитывать ряд требований для формирования условий для правил:

· Если причина ri имеет одну из следующих форм: “ X = ”,” X > ”,

X < ” (“ X >= ” или ” X <= ”), точно такие же селекторы должны использоваться в условиях для формируемых правил.

· Если причина имеет одну из следующих форм: ” X >” (или “ X <”,

X <=”, “ X >=”), тогда формируемые условия для правил должны содержать селекторы ” X > ” (или “ X < ”, “ X <= ”, “ X >= ”), где – пороговое значение для атрибута.

Аргументированные правила должны соответствовать ряду требований:

· Все условия в правиле R должны быть истинны для примера E.

· Правило R должно содержать хотя бы один положительный аргумент примера E.

· Правило R не должно содержать отрицательных аргументов.

Обратимся вновь к примеру с выдачей кредита Брауну. Браун имеет высокий достаток (Достаток = высокий) – аргумент, почему выдан кредит. Браун получил кредит, несмотря на нерегулярные выплаты за прошлые кредиты (РегулярностьВыплат = нет). Сформируем все возможные правила, которые будут покрывать этот пример:

· Если ЦветВолос = блондин то ВыдачаКредита = да

· Если РегулярностьВыплат = нет и ЦветВолос = блондин то ВыдачаКредита = да

· Если РегулярностьВыплат = нет и Достаток = высокий то ВыдачаКредита = да

· Если ЦветВолос = блондин и Достаток = высокий то ВыдачаКредита = да

Все четыре правила покрывают пример. Первое правило не является аргументированным, потому что не содержит положительных аргументов. По той же причине, второе правило не является аргументированным, кроме того, оно содержит отрицательный аргумент (РегулярностьВыплат = нет). Правило 3 тоже не является аргументированным, так как содержит отрицательный аргумент (РегулярностьВыплат = нет), несмотря на наличие положительного аргумента (Достаток = высокий). Только последнее правило является аргументированным, так как содержит положительный аргумент (Достаток = высокий) и не содержит отрицательных аргументов.



Поделиться:


Последнее изменение этой страницы: 2016-08-10; просмотров: 196; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.12.166.76 (0.012 с.)