Эволюция поисковых систем в Интернете. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Эволюция поисковых систем в Интернете.



Первое поколение (примерно 1995÷1997 гг.). Поддержка исключительно информационных запросов. Работа с текстовыми данными. Применение частоты терминов и векторных моделей. появились поисковая система Archie, решавшая задачу локализации ресурсов на FTP-сервере, и система Gopher, упрощающая доступ к различным сетевым ресурсам. В апреле 1994 года появилась поисковая система Yahoo! (David Filo, Jerry Yang), представлявшая каталог с возможностями поиска, автоматизация процесса сбора и классификации. Эта система может подключаться к другим поисковым машинам.

Второе поколение (начало с 1998 г.). Использование гиперссылочного анализа. Поддержка информационных и навигационных запросов.

Третье поколение (с начала XXI века). Стремление использовать всевозможные источники данных для ответа на вопрос «какая потребность скрыта в запросе пользователя?». Возможность поддержки всех трёх типов запросов. Семантический анализ. Большее внимание к потребности пользователя, чем к содержанию его запроса. Привлечение различных контекстов. Развитая система помощи пользователю (подсказки, обратная связь и др.). Интеграция поиска и анализа текста.

По способу организации такие ИПС делятся на классификационные (рубрикаторы) и словарные.

 

Рубрикаторами (классификаторами) называют поисковые системы, в которых используется иерархическая (древовидная) организация информации. При поиске информации пользователь просматривает тематические рубрики, постепенно сужая поле поиска (например, если необходимо найти значение какого-то слова, то сначала в классификаторе нужно найти словарь, а затем в нём найти нужное слово).

 

Словарные поисковые системы представляют собой мощные автоматические программно-аппаратные комплексы. С их помощью просматривается (сканируется) информация в Интернете. В специальные справочники-индексы заносятся данные о местонахождении той или иной информации. В ответ на запрос осуществляется поиск в соответствии со строкой запроса. В результате пользователю предлагаются те адреса (URL), на которых в момент сканирования найдены искомые слово или группа слов. Выбрав любой из предложенных адресов-ссылок, можно перейти к найденному документу.

Большинство современных поисковых систем являются смешанными.

 

Летом 1996 года в Интернете появилась поисковая информационная система Я ndex (языковой индекс, «Yet Another Index». «I» = «Я»). Осенью 1997 годаоткрыт Yandex. ru иреализован естественно-языковой интерфейс.

 

С 1998 года в Интернете работает информационно-поисковая система Google (Sergey Brin, Larry Page – Stanford Univ.). В ней используются алгоритм ранжирования PageRank, оптимизация архитектуры системы, масштабирование и распараллеливание (Linux-кластеры), восстановление текста документа без обращения к его оригиналу в Интернете.

 

Метапоисковые системы.

Метапоисковые системы дают возможность пользователю одновременно в едином пользовательском интерфейсе, используя индексы обычных поисковых систем, работать с несколькими БД. Зачастую эти системы не позволяют реализовать все возможности отдельных поисковых систем, но в большинстве своем они обладают существенными быстродействием и степенью охвата Веб-пространства, что определяет их всё более возрастающие значение и популярность.

Метапоиск позволяет посылать запросы одновременно нескольким поисковым системам, каталогам и др. Полученные результаты собираются и объединяются в общем списке. К достоинствам такого поиска относят больший охват индексируемой части Интернета и увеличение эффективности

 

Контрольные вопросы

1. Назовите три этапа эволюции поисковых Веб-систем.

5. Как работают в Интернете ИПС для отбора и ранжирования веб-страниц?

6. Что представляют собойсловарные поисковые системы?

10. В чем смысл метапоисковых систем и как они работают?

 



Поделиться:


Последнее изменение этой страницы: 2021-04-04; просмотров: 42; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.191.13.255 (0.006 с.)