ТОП 10:

Поисковые машины или поисковые указатели.



Поисковые машины устроены несколько иначе. По сути – это сервер с огромной базой данных URL-адресов, который автоматически обращается к страницам WWW по всем этим адресам, изучает содержимое этих страниц, формирует и прописывает ключевые слова со страниц в свою базу данных (индексирует страницы). Более того, этот сервер обращается по всем встречаемым на страницах ссылкам, поэтому при подобной работе поисковая машина в конечном результате теоретически может обойти все сайты Интернет. Для сбора сведений о ресурсах поисковая машина использует специальные программы, которых называют червяками, пауками, спайдерами, краулерами и т.п.

Некоторые зарубежные поисковые машины:

Fast Search (www.alltheweb.com) – одна из мощнейших поисковых машин на сегодняшний день. Скорость поиска системы составляет доли секунды и нет рекламы. Малоизвестна, т.к. была открыта сравнительно недавно, в 1999 г.

Alta Vista (www.altavista.com),

Google(www.google.com) – возможен поиск на русском языке,

Northern Light(www.northernlight.com.)

Российские поисковые машины:

Рамблер(www.rambler.ru),

Апорт2000 (www.aport.ru),

Яндекс(www.yandex.ru),

Lupa.ru (www.lupa.ru).

Классификационно-рейтинговые системы.

Классификатор похож на каталог, но в отличие от каталога перед ним не ставится задача собрать как можно больше информации о ресурсах сети. По каждой из категорий, входящих в классификатор, представляются лучшие сайты, а дальше работает счетчик. Выбрав интересующую тему, пользователь получает список Web-узлов, посвященных данной теме, и рейтинг их популярности, которая измеряется в количестве посещений за последние сутки. Рейтинг – это сортировка ссылок в порядке их посещаемости.

Есть некоторые Web-узлы, специализирующиеся на ведении рейтингов:

«Рамблер Тор 100» (www.rambler.ru) -самый крупный классификатор в России,

http://dir.spylog.ru

 

Лабораторная работа №4.

Поисковые системы Интернета.

1. На панели Адрес введите: www.susanin.net

2. Используя гиперссылки начало/справочная информация найдите какой-нибудь телефонный справочник.

3. На сайте www.ru найдите закон о наследстве, используя Политика и право/Право и выбрав подходящий Web-сайт. Зафиксируйте результат поиска

4. Загрузите поисковый указатель Рамблер. Также найдите закон о наследстве, используя кнопку Поиск. Зафиксируйте результат поиска.

5. Сравните результаты поиска на поисковой машине Рамблер и в поисковом каталоге www.ru.

6. На панели Адрес введите: www.mavicanet.ru

7. Используя каталог/Государство и право/международные отношения/международная журналистика просмотрите сайт Международного пресс-клуба.

8. Изучите «Рамблер Тор 100». Просмотрите Рейтинг/ Экспертиза на www.rambler.ru.

Приемы поиска информации.

Несмотря на то, что интерфейс всех поисковых систем различен, все они имеют два общих элемента – это строка ввода запроса пользователя, и кнопка Поиск. Если на основной странице поисковой системы есть тематический каталог, то нужно определиться с тематикой поиска, это значительно ограничит пространство поиска и ускорит работу поисковой системы.

Поиск по одному ключевому слову прост, но приводит к формированию огромного списка страниц, полезную информацию здесь найти трудно.

Гораздо эффективнее поиск по нескольким словам, но здесь важную роль играет связь между словами, которая помогает системе обрабатывать эту группу слов. Для эффективного поиска по нескольким ключевым словам нам нужны специальные команды, которые позволяют связать отдельные слова между собой. Эти команды в поисковых системах образуют язык запросов. В нем всего несколько команд, и освоить его по инструкции, имеющейся на сервере поисковой системы довольно просто. Каждая поисковая машина использует свой язык запросов, поэтому при использовании разных поисковых систем надо знать особенности каждой. Но есть общий принцип, согласно которому все команды можно разделить на три группы:

- команды простого поиска,

- команды расширенного поиска,

- команды специального поиска.

Рассмотрим приемы формирования запросов на примере поисковой машины Апорт2000 (www.aport.ru).

Средства простого поиска.

1. Поиск группы слов. Большинство российских поисковых систем, как и поисковая машина Апорт, воспринимает группу слов так, как будто между ними стоит союз И. Например, лица в розыске.

2. Поиск словоформ. В большинстве случаев Апорт позволяет находить разные словоформы, например, запрос допрос несовершеннолетнего можно было сформулировать несовершеннолетний допрос.

3. Поиск точных форм. Иногда нужно от словоформ отказаться. Допустим нас интересует слово престол, а не престольный и не первопрестольный. В этом случае Апорт использует восклицательный знак, например: !престол.

4. Роль заглавных букв. Для большинства поисковых систем заглавные буквы воспринимаются буквально. Так, например поиск по словам укажет только на те страницы, где встречаются слова Красная Шапочка. А поиск по запросу красная шапочка укажет на страницы, где встречаются слова Красная Шапочка, и Красная шапочка, и красная Шапочка, и красная шапочка.

5. Значение подстановочных символов. Апорт позволяет использовать символ * вместо любого количества символов до конца слова. Например, если нужны документы, в которые входят слова Татарская республика и , то можно использовать только: республика Татарс*.

6. Учет зарегистрированных слов. Зарегистрированными словами (стоп-словами) считаются те, которые не учитываются при поиске. Обычно к ним относятся все слова, которые меньше 4 символов – предлоги, союзы, местоимения, артикли и т.д. Так, например в запросе все о юристах будет учитываться только слово юристах и его словоформы. В специализированных поисковых системах к зарегистрированным могут относиться слова, характерные для этих систем. Например, если поисковая система ориентирована на поиск книг, то вероятнее всего слово книга в ней при обработке запроса не будет учитываться.

7. Средства контекстного поиска. Взятая в кавычки фраза ищется буквально, то есть так как она написана, без словоформ. Это очень полезный вид поиска.

Средства расширенного поиска.

В расширенном поиске кроме ключевых слов, можно использовать простейшие логические операторы и логические скобки.

1. Оператор И (AND,&,+). С помощью этого оператора объединяются 2 или более слов. В поисковой система Апорт можно этим оператором не пользоваться, т.к. в ней списки слов и так воспринимаются, как будто между ними стоит оператор И. Но так бывает не всегда ( например Alta Vista по умолчанию считает, что ключевые слова связаны соотношением ИЛИ).

2. Оператор ИЛИ (OR,|). Этот оператор обеспечивает поиск по любому из слов группы, например образование ИЛИ обучение.

3. Логические скобки. Скобки необходимы, когда важен порядок действия логических операторов, например, Ломоносов ИЛИ(Михаил И Васильевич).

4. Оператор НЕТ (-,NOT). Этот оператор употребляется, когда из результатов поиска нужно исключить какое-либо ключевое слово. Например, по запросу допрос NOT несовершеннолетний, будут возвращены документы, где есть слово допрос, но нет слова несовершеннолетний.

5. Поиск с указанием расстояния. Этот вид поиска позволяет указать, на каком расстоянии друг от друга могут располагаться слова в документе. Например, сл5(приостановление следствия). В данном случае оба слова должны принадлежать одной группе, длиной не более 5 слов.

 

В Таблице 2. приведены логические операторы для некоторых поисковых машин.


 

Оператор Действие Rambler Yandex Aport
И Ищет страницы со Словом1 и Словом2 Слово1 AND Слово2 Слово1 & Слово2 Слово1 Слово2 (пробел)   Слово1 AND Слово2; Слово1 & Слово2; Слово1 Слово2 (пробел); +Слово1 + Слово2   Слово1 AND Слово2; Слово1 & Слово2; Слово1 Слово2 (пробел); +Слово1 + Слово2; Слово1 И Слово2  
ИЛИ Ищет страницы со Словом1 или Словом2 Слово1 OR Слово2 Слово1 | Слово2 Слово1 OR Слово2 Слово1 | Слово2 Слово1 OR Слово2 Слово1 | Слово2 Слово1 ИЛИ Слово2  
НЕТ Ищет страницы, в которых нетСлова NOT Слово; ! Слово NOT Слово; -Слово; ~Слово   NOT Слово; -Слово НЕТ Слово  

Таблица 2.







Последнее изменение этой страницы: 2016-09-13; Нарушение авторского права страницы

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.236.8.46 (0.007 с.)