ТОП 10:

Представление нечетких знаний в ИС.



Для количественного описания знаний предметной области использование традиционного математического аппарата (теория множеств, булева алгебра и др.) оказалось не вполне адекватным, т.к. многие объекты и понятия характеризуются такими отношениями, для которых трудно определить численную характеристику. Эти отношения обычно размыты и не могут быть однознач­но интерпретированы, однако содержат важную информацию (например, «сильный», «красивый», «высокий», «кислый» т.п.).

Кроме того, при принятии решений некоторые высказывания не могут быть интерпретиро­ваны как полностью истинные или ложные. Су­ществуют знания, достоверность которых выражается некоторой вероятностью.

Для решения таких проблем в начале 70-х американский ма­тематик Лотфи Задепредложил формальный аппарат нечеткой алгебры и нечеткой логики (fuzzy logic). Это направление получило широкое рас­пространение в задачах искусственного интеллекта, распознавания образов, классификации реальных объектов.

Вычисления на основе нечеткой логики получили название мягкие вычисления(soft computing).

Одно из главных понятий в нечеткой логике — понятие лингвисти­ческой переменной.

Лингвистическая переменная (ЛП) — это переменная, значение которой определяется набором словесных характеристик некоторого свойства, образующих нечеткое множество (fuzzy set).

Например, ЛП «рост» задается множеством:

«рост» = {карликовый, низкий, средний, высокий, очень высокий}.

 

Нечеткое множество, характеризующее ЛП, определяется на некото­ром базовомнаборе значений или базовой числовой шкале, имеющей размер­ность. При этом значение ЛП определяется как нечеткое множество.

Нечеткое множество в свою очередь определяется через некоторую базовую шкалу В и функцию принадлежности m(x), хÎВ.

Допускается и такое математическое описание:

,

где хi - значение базовой шкалы.

Функция принадлежности определяет субъективную степень уверенности эксперта в том, что данное конкретное значение базовой шкалы соответствует определяемому нечеткому множеству. Это отличает ее от вероятности.

Например, для двух экспертов определение нечеткого множества «Высокая» для ЛП «Цена ПК» в условных единицах может существенно отличаться в зависимости от социального и финансового положения.

1 эксперт = {50/1 + 25/0.8 + 10/0.6 + 5/0.4}

2 эксперт = (25/1 + 10/0.7 + 5/0.5}

Пример 9.1

Опишем ЛП «Возраст». Определим нечеткое множество:

В = {младенческий, детский, юный, молодой, зрелый, преклонный, старческий).

Для ЛП «возраст» базовая шкала — это числовая шкала от 0 до 120, обозначающая количество прожитых лет, а функция принадлежности определяет, насколько мы уверены в том, что данное количество лет можно отнести к данной категории возраста.

Построим шкалу:

Например, определить значение нечеткого множества «Младенческий возраст» можно так:

«младенческий» =

Ребенок до полугода здесь с высокой степенью уверенности относится к младенцам (m=1). Дети до четырех лет причисляются к младенцам тоже, но с меньшей степенью уверенности (0.5< m <0.9), а в десять лет ребенка называют так только в очень редких случаях. Та­ким образом, нечеткие множества позволяют при определении понятия учитывать субъективные мнения отдельных индивидуумов.

 

Над нечеткими множествами возможны операции нечеткой логики:

max{m(x1), m(x2)}

Возможно применение операций из теории вероятности:

m(x) = m(x1)+ m(x2)+ m(x1)* m(x2)

Вводятся специальные операторы, называемые квантификаторами, которые усиливают или ослабляют свойства нечеткого множества:

Например, если задано нечеткое множество «Старческий возраст»:

А = ,

то понятие «Очень старческий возраст» определяется:

,

то есть «Оченьстарческий возраст» равен:

con(A) = A2 =

Тема 10.

Инженерия знаний.

Поле знаний.

В процессе проектирования БЗ, эксперт взаимодействует с инженером по знаниям с целью извлечения знаний, их структурирования, где важную роль играет стратегия получения знаний.

Поле знаний – это условное неформальное описание основных понятий и взаимосвязей предметной области, выявленных из системы знаний эксперта в виде графа, диаграммы, таблицы или текста.

Поле знаний (ПЗ) является концептуальной моделью предметной области и формируется на стадии структурирования при разработке ЭС.

Описание ПЗ дается на некотором языке, который является связующим звеном между естественным языком и формальным языком математики.

Требования, предъявляемые к языку описания ПЗ:

1) Однозначность понятий и высказываний.

2) Заимствованные термины из предметной области должны сохранять свой смысл.

3) Язык должен быть символьным или графическим.

На стадии структурирования описание ПЗ переносится на какой-либо язык представления знаний, выбор которого зависит от структуры ПЗ.

Существует 3 основных подхода к выбору языков описания знаний:

1 – использование уникальных языков, разработанных для конкретной предметной области (SSL, язык К-схем);

2 – использование языков классификации знаний (языки Вилкинса и Далгарно);

3 – использование логико-конструктивных языков, разработанных в семиотике (науке об универсальном методе познания).

Методы третьего подхода не нашли применения в естественных науках в силу жесткой структуры знаний. В искусственном интеллекте знания нечеткие, поэтому эти методы и языки могут применяться.

Язык семиотического моделирования является наиболее лучшим приближением к универсальному языку инженерии знаний.

Необходимо учитывать, что при формировании ПЗ главной является правильная передача структуры предметной области. Тогда ПЗ является некоторой семиотической моделью, в которой рассматриваются 3 аспекта:

1 - синтаксис;

2 - семантика;

3 - прагматика.

Синтаксис задает набор правил построения языковых конструкций.

Семантика показывает связи между элементами языка.

Прагматика задает отношения между объектами предметной области и их пользователями.

1) Синтаксис ПЗ представляется моделью, описываемой с помощью множеств:

Pz = {In, Out, M},

где In – структура входных данных;

Out – структура выходных данных;

М – модель предметной области.

M = {Sk, Sf},

где Sk – концептуальная структура (показывает взаимосвязь элементов);

Sf – функциональная структура (моделирует рассуждения эксперта в процессе принятия решения).

2) Семантика ПЗ зависит от особенностей предметной области и обладает полиморфизмом, т.е. одни и те же операторы языка могут иметь различные значения для разных задач.

Семантика рассматривается на двух уровнях:

1 – ПЗ есть модель знаний эксперта некоторой предметной области;

2 – ПЗ есть модель самих знаний, не зависимых от эксперта. В данном случае ПЗ формируется в результате 4-х этапов извлечения знаний:

1. Визуальное восприятие и интерпретация экспертом некоторой ситуации в предметной области, происходящей в памяти эксперта Vi;

2. Вербальное объяснение рассуждений эксперта в виде текста или речи Ti/Ci.

3. Восприятие и интерпретация сообщений инженером по знаниям Mi.

4. Кодирование и вербальное описание модели представления знаний на языке описания ПЗ – Pz.

Цепочка Vi®Ti/Ci®Mi®Pz называется «испорченный телефон».

Семантическая составляющая ПЗ является чисто субъективной. Это – БЗ эксперта в понимании инженера по знаниям.

3) Прагматика ПЗ рассматривается на уровне анализа технологии предметной области, используя которые инженер по знаниям может описать ПЗ. Т.о., это – программные средства формирования ПЗ.

 

Для моделирования ПЗ можно использовать:

1. Традиционные CASE-средства (Rational Rose, ERWin).

2. Специальные программы (VICONT, Axon, Idea Processor).

Т.о., учитывая знания психологии, можно рассматривать ПЗ в виде пирамиды. В пирамиде знаний каждый уровень служит для восхождения на новую ступень обобщения знаний о предметной области.

Пирамида знаний отражает глубину опыта эксперта. Восхождение по ступеням к вершине пирамиды соответствует уменьшению размерности семантического пространства памяти и увеличению опыта эксперта.

Есть другая модель описания ПЗ – сфера знаний. Здесь поверхность сферы определяет знания и опыт в соответствие с текущим опытом эксперта (радиусом сферы).

Увеличение радиуса сферы влечет увеличение объема семантической памяти. Т.о., эксперт выходит на новый уровень познания предметной области, т.е. способен усвоить и получить знания, которые ранее были недоступны.

 

Стратегии получения знаний.

Процесс получения знаний, т.е. передача знаний эксперта в БЗ экспертной системы является ключевым вопросом формирования поля знаний.

Стратегии формирования знаний:

1) Приобретение знаний(Knowledge, Aquisition). Эксперт вводит знания в БЗ ЭС с помощью специальной программы, жестко задающей структуры данных в соответствии с моделью представления знаний, заложенных в ЭС.

2) Извлечение знаний (Extraction).

3) Установление знаний (Elicitation).

В двух последних стратегиях происходит взаимодействие эксперта и инженера по знаниям.

Извлечение знаний является самым сложным вопросом в разработке ЭС.

Основные проблемы, возникающие при извлечении знаний:

1 – Упрощение представлений инженера по знаниям уровня знаний эксперта.

2 – Неудачно выбранный метод извлечения знаний, не соответствующий структуре данной предметной области.

3 – Неправильно выбранный язык представления знаний.

4 – Терминологические несоответствия.

5 – Отсутствие целостной системы знаний.

6 – Неумение наладить контакт с экспертом.

Для успешного извлечения знаний инженер по знаниям должен хорошо владеть рядом наук:

ü системным анализом;

ü математической логикой;

ü когнитивной психологией;

ü искусственным интеллектом.

Согласно Платону, мышление человека диалогично, поэтому диалог эксперта и инженера по знаниям является самой лучшей формой извлечения знаний, хотя в ряде случаев эксперт не общается с инженером по знаниям, а работает с программой ввода знаний (Tetresias – программа заполнения БЗ, MYCIN, EMYCIN, разработанные на основе продукционной модели представления знаний).

4) Формирование знаний. Эта стратегия характеризует разработку моделей, методов и алгоритмов обучения ЭС (Mashine Learning) – процесс анализа данных и выявления закономерностей предметной области.

Основные области применения Mashine Learning:

- прогнозирование, расшифровка языков;

- методы обучения распознаванию образов;

- индуктивный вывод правил и фактов.

Существует 2 основных подхода к обучению:

1 – алгебраический, основанный на дополнении исходных эвристических алгоритмов какими-либо алгебраическими операциями, характеризующими объект, и построении алгоритмов классификации новых объектов.

2 – обучение на примерах (Case-based Reasoning). Здесь знания являются описанием множества примеров из предметной области.

Существуют новые стратегии извлечения знаний:

1) Понимание знаний (Data Mining).

2) Исследование знаний (Knowledge Discovery).

 







Последнее изменение этой страницы: 2017-02-10; Нарушение авторского права страницы

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.226.243.36 (0.008 с.)