Критерий смыслового соответствия (КСС) 
";


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Критерий смыслового соответствия (КСС)



КСС есть пара (слайд 7):

КСС = < b*, k c >

где b* есть мера формальной релевантности, или мера близости (способ исчисления близости) поисковых образов документа и запроса,

k c - пороговое значение меры близости, при превышении которого документ признается формально релевантным соответствующему запросу.

В задачах информационного поиска различают формальную и истинную релевантность.

Формальная релевантность – соответствие документа запросу с точки зрения АИПС.

Истинная релевантность – соответствие документа запросу с точки зрения пользователя.

Данное определение КСС, хотя и не отвечает полностью применяемым в АИПС критериям, тем не менее, позволяет описать такие возможности, как сужение или расширение поискового запроса. Это достигается, соответственно, увеличением или уменьшением порога релевантности k c.

Известны, например, следующие меры формальной релевантности (слайд 8):

- скалярное произведениевекторов ПОЗ и ПОД:

                                                                   

- мера Танимото (нормированное скалярное произведение):

                                            

- мера косинуса угла векторов ПОЗ и ПОД:

                                                                

 

Поиск документов состоит в построении матрицы поискового пространства, где  определяется по одному из выражений меры формальной релевантности.

Множество формально релевантных запросу документов составляют такие документы, для которых .

 

5.6. Логическая структура документальной АИПС.

База данных документальной ИПС IRBIS - это именованная совокупность массива документов и структурированных справочников, обеспечивающих эффективность поиска. Логическая структура БД документальной ИПС IRBIS представлена на слайде 9.

Документ базы данных как структурированная форма представления информации в общем случае определяется своим уникальным (в массиве документов БД) идентификатором и составом полей.

Поле как часть документа представляет собой однозначно идентифицируемый в информационном массиве фрагмент, для которого определены тип, имя и характер обработки.

Слово как фрагмент поля, выделяемый по некоторым формальным (заданным в схеме представления документа) правилам, является единицей информации в операциях поиска.

Схема базы данных (документа) определяет логическую связь именования, физического размещения и наполнения полей, образующих документ, а также стратегию поиска. Особенностью этой реализации является логическая независимость схемы. Для одной базы данных может быть определено несколько разных схем, причем они в принципе равноправны, и в то же время одна и та же схема может быть использована для определения документов в нескольких БД.

При этом представление всех или отдельных документов БД может быть доопределено контекстно средствами разметки. Использование встраиваемых определений структуры позволяет ввести «самоопределяемые» форматы представления документов. Это обеспечивает практически неограниченную гибкость при организации хранения коллекций разнородных документов, хотя и создает проблемы согласованного использования материала (из-за возможности различной интерпретации определений).

В схеме документ определяется совокупностью описаний отдельных полей, для каждого из которых задается:

- идентификация материала в базе данных, обеспечивающая пользователю доступ средствами документального поиска;

- представление материала при вводе и выводе (формат и длина поля, размещение и оформление материала при отображении и т. д.);

- спецификация стратегии документального поиска (прямое сканирование записей или использование инвертированных поисковых справочников). Для полей, специфицированных как ключевые, т. е. имеющих поисковые справочники, дополнительно определяются правила формирования дескрипторов (заданием списков символов-разделителей слов и списков стоп-слов).

Таким образом, можно сказать, что документальная БД имеет постреляционную модель данных.

 



Поделиться:


Последнее изменение этой страницы: 2021-12-07; просмотров: 63; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.144.205.223 (0.005 с.)