Поисковые технологии информационных систем 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Поисковые технологии информационных систем



По используемым поисковым технологиям ИС можно разбить на 4 категории:

1. Тематические каталоги;

2. Специализированные каталоги (онлайновые справочники);

3. Поисковые машины (полнотекстовый поиск);

Средства метапоиска.

В Интернете ИПС размещается на одном или нескольких серверах. В ИПС собирается, индексируется и регистрируется информация о документах, имеющихся в обслуживаемой системой группе веб-серверов. В документах индексируются все значащие слова или только слова из заголовков.

Тематические каталоги предусматривают обработку документов и отнесение их к одной из нескольких категорий, перечень которых заранее задан. Фактически это индексирование на основе классификации. Индексирование может проводиться автоматически или вручную с помощью специалистов, просматривающих популярные веб-узлы и составляющих краткое описание документов-резюме (ключевые слова, аннотация, реферат).

Специализированные каталоги или справочники создаются по отдельным отраслям и темам, по новостям, по городам, по адресам электронной почты и т. п.

Поисковые машины (самое развитое средство поиска в Интернете) реализуют технологию полнотекстового поиска. Индексируются тексты, расположенные на опрашиваемых серверах. Индекс может содержать информацию о нескольких миллионах документов. Например, в индексе популярной ИПС "AltaVista" более 56 млн. URL- адресов.

При использовании средств метапоиска запрос осуществляется одновременно несколькими поисковыми системами. Результат поиска объединяется в общий, упорядоченный по степени релевантности список. Каждая система обрабатывает только часть узлов сети, что позволяет расширить базу поиска. К подобному классу можно отнести и "персональные программы поиска", позволяющие формировать свои собственные инструменты метапоиска (например, автоматически опрашивать часто посещаемые узлы).

Базы информационных данных могут содержать практически любые виды информации, в том числе в любой комбинации. Информационный поиск осуществляется как по существующим в полнотекстовых ЭИР терминам, так и по специальным элементам, входящим в состав ИПЯ. Для формирования запросов используются специальные информационно-поисковые языки.

ИПС внутри найденной выборки обычно пытаются расположить документы в порядке их "релевантности", то есть близости к введенному пользователем запросу. Критериев такой близости много и выявление близких "по смыслу" к запросу документов не решает проблемы получения информации при отсутствии релевантного документа. Подобная ситуация достаточно тривиальна, в том числе и потому, что пользователь зачастую ищет документ, который сам собирается написать. Следует отметить, что в результате проведенного поиска пользователь может получить как релевантные, пертинентные, так и нерелевантные и непертинентные подмассивы данных.

ИПС фактически являются системами информационного обеспечения и представляют собой базы и банки данных. В качестве объекта в них выступает индивид, организация, отрасль, регион и т.п. Субъектом информационного обеспечения является специалист-информатик, любой потребитель информации.

Примеры поисковых систем и сервисов.

Современная страница истории электронных систем начинается с 1989 года публичным представлением агентством Intralex программного комплекса «Юридическая справочно-информационная система», а с 1990 года появлением систем «Кодекс», «Гарант», «Консультант Плюс».

Отличительные особенности представления информации в информационно-справочных системах от интернета заключаются в следующем:

— все документы в системах представлены не разрозненно (отдельно исходный документ, отдельно все изменения и редакции), а комплексно: сами тексты документов включают все изменения, гиперссылки на нормативную базу, сведения о действии и т.д., то есть применительно к системам речь идет о «живых» интерактивных электронных текстах документов;

— документы из информационно-справочной системы отличаются максимальной достоверностью, законностью, аутентичностью и актуальностью.

    Возможности ИПС

  • интеллектуальный поиск — поиск по свободно сформулированному запросу т.е. (слову, фразе, дате принятия, номеру и т. д.).
  • атрибутный поиск — поиск по общим или специализированным атрибутам.

Общие атрибуты — атрибуты, присущие большинству документов (поиск по тексту, наименование, вид документа, принявший орган, номер, дата принятия, актуальность).

Компьютерный вид документа по атрибутам включает в себя:

- тип файла: по расширению (*.txt; *.doc, *.jepg, *.mp3, *.ppt, *xls, …),

- по виду документа (текстовый, табличный, БД, презентация, аудио, графика, инженерная графика, видео, системные файлы…).

Специализированные атрибуты — атрибуты, свойственные данному виду документа.



Поделиться:


Последнее изменение этой страницы: 2021-05-12; просмотров: 104; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.219.126.197 (0.009 с.)