Тема: Виды информационно – поисковых систем 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Тема: Виды информационно – поисковых систем



Тема: Виды информационно – поисковых систем

ИПС – это информационная система с единым хранилищем единичных элементов данных и с развитым инструментарием их поиска и отбора.

По виду единичных элементов данных ИПС делятся на:

1. Фактографические

2. Документальные

Фактографические ПС – это системы в которых единичным элементом данных является запись, образуемая конечной совокупностью полей – атрибутов (в базе данных это столбцы).

Недостатки фактографических ПС:

· Требуются изначально структурированные данные

· Дополнительное время

Документальные ПС – это системы в которых единичным элементом данных является документ, не структурированный на более мелкие элементы. Это могут быть текстовые, звуковые, графические файлы. Основная задача документальных ИПС – это предоставление пользователю документов, которые соответствуют его информационным потребностям.

Информационная потребность – это осознанное понимание различия индивидуального знания от знаний, накопленных обществом.

Пертинентность – это соответствие найденных документов информационным потребностям пользователя.

Особенности реализации хранилища документов и механизмов поиска

В зависимости от этих особенностей ИПС делятся:

1. Системы на основе индексирования

2. Семантически – навигационные системы

В семантически – навигационных системах создаются навигационные конструкции, соответствующие смысловым связям между различными документами или отдельными фрагментами одного документа. Такие конструкции реализуют семантическую семантическую сеть в базе документов. Поиск осуществляется путем явной навигации по смысловым отсылкам между документами. В настоящее время такой подход реализуется в гипертекстовых ИПС (пример www).

В системы на основе индексирования исходные документы помещаются в базу без дополнительного преобразования, но смысловое содержание каждого документа отображается в некоторое поисковое пространство.

Процесс индексирования заключается в присвоении каждому документу некоторого индекса координаты в поисковом пространстве.

Индексирование – описание содержания документа посредством формализованного информационного языка.

Поисковым образом документа ПОД называется формализованное описание индекса документа.

Поисковым образом запроса ПОЗ к базе документа называется выражение пользователем своих информационных потребностей средствами и языком поискового пространства.

На примере поисковых системе в интернете ПОД и ПОЗ это поиск по ключевым словам. ИПС в интернете с помощью специальных программ – роботов просматривают весь интеренет и по каждому сайту (документу) собирает множество ключевых слов. Это и есть индексирование интернета. ПОД – это ключевые слова и адреса соответствующих сайтов. Внутри ИПС типа Рамблер или Яндекс хранится множество этих ПОД – это и есть поисковое пространство.

Пользователь обычно пишет несколько ключевых слов – это и есть поисковый образ запроса ПОЗ. В поисковом пространстве документа ПОД ищутся соответствующие запросу ПОЗ полностью или частично. Степень этого соответствия и есть релевантность. Релевантностью называется соответствие найденных документов запросу пользователя.

10.09.2012

Информационное оповещение

Поисковый профиль пользователя ППП – это отображение в поисковом пространстве информационных потребностей пользователя.

ИПС по мере поступление и индексирования новых документов сравнивает их ПОД с имеющимся ППП и принимает решение о соответствующем оповещении.

Технология ключевых слов

Взвешенный словарь ключевых терминов Классификационная рубрика предметной области
Предварительно создается для предметной области. При вводе нового документа, он индексируется по словарю и формируется поисковый образ документа (ПОД), который сравнивается с ПОД ранее введенных документов. При превышении определенного порога сходства задаются гиперссылки на эти документы Также создается предварительно. С каждой рубрикой связывается набор ключевых терминов или их сочетаний. На основе входного индексирования производится соотнесение водимого документа с определенной рубрикой, что определяется установку гиперсвязей с соответствующей группой документов

 

Полнотекстовые технологии по сути аналогичны технологиям ключевых слов с учетом более широкого текстового базиса индексирования

 

23.10.2012

Стратегия поиска в ИПС

Простой способ повысить релевантность выдаваемых ИПС документов – использование в запросе логических операторов AND, OR, NOT.

Главный недостаток – плохая масштабируемость, так применение оператора AND может сильно сузить выдачу, а оператора OR – сильно расширить.

Процедура поиска должна включать коррекцию запроса.

Формулирование запроса
Поиск
Просмотр результатов поиска
Окончание поиска
Коррекция запроса

 

 


Способы коррекции:

ü Пользователь может сузить или расширить область поиска, перейдя к более специфичными или, наоборот, общими терминами, а также используя родственные понятия. Такая коррекция происходит достаточно плавно, в случае поиска по нескольким терминам

ü Если пользователь знает точно релевантные документы, то, не найдя их в списке, он должен расширить область поиска

ü Пользователь помечает определенные документы из выданных как наиболее точно отвечающие его потребностям, и на основании их анализа системой информационного поиска происходит коррекция запроса. В этом случае ИПС помимо терминов, заданных в первоначальном запросе, ищет термины, встречающиеся в помеченных документах.

Требования к правовым ИПС

ü Прямые контакты с основными организациями – источниками нормативных актов

ü Высокая степень достоверности нормативных актов и полнота нормативной базы

ü Высокий уровень универсальности (обеспечение документальной поддержки по всем разделам законодательства)

ü Наличие развитого системного аппарата поиска информации

ü Возможность формирования индивидуальных архивов, а также поддержки нормативной базы конкретной организации

ü Использование современного пользовательского интерфейса на базе Windows – приложений

ü Развитые средства доставки информации конечному пользователю

ü Высокий уровень поддержки

 

Формы представления поисковой информации в поисковых системах

Форма представления поисковой информации
Реферат
Полномасштабный текст документа
На экране
Трердая копия (на принтере)
Звуковой образ
Видеообраз
Адрес дальнейшего пользования

 

 


Основные задачи, принципиально значимые для пользователя:

ü Максимальное приближение диалога пользователя с программой к непосредственному диалогу с самим законодателем

ü Исключение возможности формирования безрезультатных запросов

ü Создание автоматизированного рабочего места для полного цикла работы профессионала с правовой информацией

Консультант Плюс, Кодекс, Гарант являются информационно – поисковыми системами. У них большая база данных по федеральному законодательству РФ, законодательству Москвы, Санкт – Петербурга, международным правовым актам и т.д.

В Консультанте для составления запроса используется Карточка реквизитов, в которй пользователь должен заполнить реквизиты тех полей, по которым будет производиться поиск.

Тема: Виды информационно – поисковых систем

ИПС – это информационная система с единым хранилищем единичных элементов данных и с развитым инструментарием их поиска и отбора.

По виду единичных элементов данных ИПС делятся на:

1. Фактографические

2. Документальные

Фактографические ПС – это системы в которых единичным элементом данных является запись, образуемая конечной совокупностью полей – атрибутов (в базе данных это столбцы).

Недостатки фактографических ПС:

· Требуются изначально структурированные данные

· Дополнительное время

Документальные ПС – это системы в которых единичным элементом данных является документ, не структурированный на более мелкие элементы. Это могут быть текстовые, звуковые, графические файлы. Основная задача документальных ИПС – это предоставление пользователю документов, которые соответствуют его информационным потребностям.

Информационная потребность – это осознанное понимание различия индивидуального знания от знаний, накопленных обществом.

Пертинентность – это соответствие найденных документов информационным потребностям пользователя.



Поделиться:


Последнее изменение этой страницы: 2020-10-24; просмотров: 291; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.15.10.137 (0.015 с.)