Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Структура гипертекстовой ИПС

Поиск

1. Подсистема отображения документов и связей (гиперссылок)

2. Подсистема по навигациям (гиперссылкам)

3. Гипертекстовая база документов

4. Подсистема формирования связей (гиперссылок)

Подсистема отображения документов и связей базируется на отображении документов в текстовых редакторах с дополнительными приемами отображения в тексте гиперссылок.

Подсистема навигации по связям реализует специальный интерфейс перехода по гиперссылкам. Для навигации в гипертекстовом документе для каждой гиперссылки хранится адрес расположения соответствующего документа или фрагмента.

Гипертекстовые базы. По принципу формирования и управления гипертекстовые базы делятся на децентрализованные (открытые) и локально сосредоточенные (замкнутые).

Гипертекстовая база данных

Замкнутая Открытая
Документы находятся в едином локально – сосредоточенном и централизованно управляемом хранилище, образующем замкнутую семантическую сеть документов производится в месте расположения такой локальной базы Документы находятся в любых узлах информационной среды, ограничивающейся файловой структурой одного компьютера, ЛВС или ГВС (локально вычислительная сеть, глобальная вычислительная сеть). База совместно строится и поддерживается всеми пользователями. При определенных протоколах об установлении и поддержании связей – гиперссылок такие базы представляют единый развивающийся по определенным законам организм

 

Важной проблемой для гипертекстовых баз является соблюдение двух принципов:

1. Целостность данных, выражаемая следующим принципом – для каждой гиперссылки должен существовать адресат, т.е. отсутствуют оборванные, ведущие в никуда связи.

В замкнутых ГБД (гипертекстовых базах данных) обеспечивается созданием и ведением единого централизованного реестра гиперссылок, при удалении документов по нему находят имеющиеся в других документах ссылки на удаляемый и аннулируют их.

В открытых ввиду отсутствия централизованного реестра при удалении документа отвечающий за него пользователь не может знать, имеются ли в других документах ссылки на удаляемую страницу, что может привести к оборванным связям.

2. Согласованность данных, заключающаяся в поддержании адекватности семантики гиперссылок, т.е. должна обеспечиваться устойчивость смысловых ассоциаций по гиперссылкам.

В замкнутых заключается в запрете изменения содержания документов после внесения их в гипертекстовую базу (т.к. закладываемая в гиперссылку смысловая ассоциация может нарушиться при изменении документа, на который идет отсылка).

В открытых определяется «время жизни» гиперссылок, в течении которого гипертекстовые публикации не могут быть изменены.

Формирование связей документов в гипертекстовых ИПС

Подходы к формированию связей документов:

1. Ручной

2. Автоматизированный

2.1. Полнотекстовая технология

2.2. Технология ключевых слов

2.2.1. Взвешенный словарь ключевых терминов

2.2.2. Классификационная рубрикация предметной области

Ручной подход. Формирование смысловых связей человеком: связи устанавливаются на основе многоаспектного многокритериального анализа содержания документа, что не под силу никаким автоматизированным формальным или эвристическим алгоритмам. многоаспектного многокритериального анализа содержания документа, что не под силу никаким автоматизированным формальным или эвристическим алгоритмам. Недостатки: ограничение по скорости, памяти, требуется высокая квалификация.

Автоматизированный подход. В основе автоматизации формирования гиперссылок лежит использование принципов поиска релевантных по смыслу документов, применяемых при индексировании. Есть две основные технологии:

ü Текстология ключевых слов

ü Полнотекстовые технологии

Технология ключевых слов

Взвешенный словарь ключевых терминов Классификационная рубрика предметной области
Предварительно создается для предметной области. При вводе нового документа, он индексируется по словарю и формируется поисковый образ документа (ПОД), который сравнивается с ПОД ранее введенных документов. При превышении определенного порога сходства задаются гиперссылки на эти документы Также создается предварительно. С каждой рубрикой связывается набор ключевых терминов или их сочетаний. На основе входного индексирования производится соотнесение водимого документа с определенной рубрикой, что определяется установку гиперсвязей с соответствующей группой документов

 

Полнотекстовые технологии по сути аналогичны технологиям ключевых слов с учетом более широкого текстового базиса индексирования

 

23.10.2012

Стратегия поиска в ИПС

Простой способ повысить релевантность выдаваемых ИПС документов – использование в запросе логических операторов AND, OR, NOT.

Главный недостаток – плохая масштабируемость, так применение оператора AND может сильно сузить выдачу, а оператора OR – сильно расширить.

Процедура поиска должна включать коррекцию запроса.

Формулирование запроса
Поиск
Просмотр результатов поиска
Окончание поиска
Коррекция запроса

 

 


Способы коррекции:

ü Пользователь может сузить или расширить область поиска, перейдя к более специфичными или, наоборот, общими терминами, а также используя родственные понятия. Такая коррекция происходит достаточно плавно, в случае поиска по нескольким терминам

ü Если пользователь знает точно релевантные документы, то, не найдя их в списке, он должен расширить область поиска

ü Пользователь помечает определенные документы из выданных как наиболее точно отвечающие его потребностям, и на основании их анализа системой информационного поиска происходит коррекция запроса. В этом случае ИПС помимо терминов, заданных в первоначальном запросе, ищет термины, встречающиеся в помеченных документах.



Поделиться:


Последнее изменение этой страницы: 2020-10-24; просмотров: 124; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.15.3.17 (0.007 с.)