Практическое занятие № 10. Поиск информации в сети Интернет


 

1. Цель занятия:

- ознакомиться с работой поисковых служб сети Интернет, освоить технологию поиска.

 

2. Перечень необходимых средств обучения (оборудование, материалы)

– технические средства обучения: персональные компьютеры, локальная сеть, коммутатор для подключения в сети Internet, макет системного блока, мультимедиа-проектор, принтер, сканер.

 

Используемое программное обеспечение:

- Microsoft Windows XP/7

- OpenOffice.org

- Антивирус Касперского 6.0

- Браузер Internet Explorer

 

3. Основные теоретические положения

Поиск информации в Интернете осуществляется с помощью специальных программ, обрабатывающих запросы — информационно-поисковых систем (ИПС). Существует несколько моделей, на которых основана работа поисковых систем, но исторически две модели приобрели наибольшую популярность — это поисковые каталоги и поисковые указатели.

Поисковые каталоги устроены по тому же принципу, что и тематические каталоги крупных библиотек. Они обычно представляют собой иерархические гипертекстовые меню с пунктами и подпунктами, определяющими тематику сайтов, адреса которых содержатся в данном каталоге, с постепенным, от уровня к уровню, уточнением темы. Поисковые каталоги создаются вручную. Высококвалифицированные редакторы лично просматривают информационное пространство WWW, отбирают то, что по их мнению представляет общественный интерес, и заносят в каталог.

Основной проблемой поисковых каталогов является чрезвычайно низкий коэффициент охвата ресурсов WWW. Чтобы многократно увеличить коэффициент охвата ресурсов Web, из процесса наполнения базы данных поисковой системы необходимо исключить человеческий фактор — работа должна быть автоматизирована.

  • Автоматическую каталогизацию Web-ресурсов и удовлетворение запросов клиентов выполняют поисковые указатели. Работу поискового указателя можно условно разделить на три этапа:
  • сбор первичной базы данных. Для сканирования информационного пространства WWW используются специальные агентские программы — черви, задача которых состоит в поиске неизвестных ресурсов и регистрация их в базе данных;
  • индексация базы данных — первичная обработка с целью оптимизации поиска. На этапе индексации создаются специализированные документы — собственно поисковые указатели;
  • рафинирование результирующего списка. На этом этапе создается список ссылок, который будет передан пользователю в качестве результирующего. Рафинирование результирующего списка заключается в фильтрации и ранжировании результатов поиска. Под фильтрацией понимается отсев ссылок, которые нецелесообразно выдавать пользователю (например, проверяется наличие дубликатов). Ранжирование заключается в создании специального порядка представления результирующего списка (по количеству ключевых слов, сопутствующих слов и др.).

В России наиболее крупными и популярными поисковыми указателями являются:

  • «Яndex» (www.yandex.ru)
  • «Pамблер» (www.rambler.ru)
  • «Google» (www.google.ru)

Каждая поисковая система – это большая база ключевых слов, связанных с Web-страницами, на которых они встретились. Для поиска адреса сервера с интересующей вас информацией надо ввести в поле поисковой системы ключевое слово, несколько слов или фразу. Тем самым вы посылаете поисковой системе запрос. Результаты поиска выдаются в виде списка адресов Web-страниц, на которых встретились эти слова.
Как правило, поисковые системы состоят из трех частей: робота, индекса и программы обработки запроса.

Робот (Spider, Robot или Bot) - это программа, которая посещает веб-страницы и считывает (полностью или частично) их содержимое. Роботы поисковых систем различаются индивидуальной схемой анализа содержимого веб-страницы.

Индекс - это хранилище данных, в котором сосредоточены копии всех посещенных роботами страниц. Индексы в каждой поисковой системе различаются по объему и способу организации хранимой информации. Базы данных ведущих поисковых машин хранят сведения о десятках миллионов документов, а объемы их индекса составляют сотни гигабайт. Индексы периодически обновляются и дополняются, поэтому результаты работы одной поисковой машины с одним и тем же запросом могут различаться, если поиск производился в разное время.

Программа обработки запроса - это программа, которая в соответствии с запросом пользователя «просматривает» индекс на предмет наличия нужной информации и возвращает ссылки на найденные документы.

Множество ссылок на выходе системы распределяется программой в порядке убывания от наибольшей степени соответствия ссылки запросу к наименьшей.

У нас наиболее распространенными поисковыми системами являются:

Рамблер (www.rambler.ru);
Яндекс (www.yandex.ru);
ТУТ.

За рубежом поисковых систем гораздо больше. Самыми популярными являются:
Alta Vista (www.altavista.com);
Fast Search (www.alltheweb.com);
Northern Light (www.northernlight.com).
Яндекс является пожалуй наилучшей поисковой системой в российском Интернете. Эта база данных содержит около 200 000 серверов и до 30 миллионов документов, которые система просматривает в течение нескольких секунд. На примере этой системы покажем как осуществляется поиск информации.

Поиск информации задается введением ключевого слова в специальную рамку и нажатием кнопки «Найти», справа от рамки.

Результаты поиска появляются в течение нескольких секунд, причем ранжированные по значимости – наиболее важные документы размещаются в начале списка. При этом ранг найденного документа определяется тем, в каком месте документа находится ключевое слово (в заглавии документа важнее, чем в любом другом месте) и числом упоминаний ключевого слова (чем больше упоминаний, тем ранг выше).

Таким образом, сайты, расположенные на первых местах в списке, являются ведущими не с содержательной точки зрения, а практически, по отношению к частоте упоминания ключевого слова. В связи с этим, не следует ограничиваться просмотром первого десятка предложенных поисковой системой сайтов.

Содержательную часть сайта можно косвенно оценить по краткому его описанию, размещаемому Поисковой системой под адресом Сайта. Некоторые недобросовестные авторы сайтов, для того, чтобы повысить вероятность появления своей Web-страницы на первых местах Поисковой системы, умышленно включают в документ бессмысленные повторы ключевого слова. Но как только поисковая система обнаруживает такой «замусоренный» документ, она автоматически исключает его из своей базы данных.
Даже ранжированный список документов, предлагаемый поисковой системой в ответ на ключевую фразу или слово, может оказаться практически необозримым. В связи с этим в Яндекс (как и других мощных Поисковых Машинах) предоставлена возможность в рамках первого списка, выбрать документы, которые точнее отражают цель поиска, то есть уточнить или улучшить результаты поиска. Например, на ключевое слово список из 34 899 Веб-страниц. После ввода в команду «Искать в найденном» уточняющего ключевого слова список сокращается до 750 страниц, а после ввода в эту команду еще одного уточняющего слова этот список сокращается до 130 Веб-страниц.


Поиск по рубрикатору поисковой системы

Поисковые каталоги представляют собой систематизированную коллекцию (подборку) ссылок на другие ресурсы Интернета. Ссылки организованы в виде тематического рубрикатора, npeдставляющего собой иерархическую структуру, перемещаясь по которой, можно найти нужную информацию.
Приведем в качестве примера структуру поискового интернет-каталога Яндекс.
Это каталог общего назначения, так как в нем представлены ссылки на ресурсы Интернета практически по всем возможным направлениям. В этом каталоге выделены следующие темы:
Каждая тема включает множество подразделов, а они, в свою очередь, содержат рубрики и т. д.

Предположим, вы готовите мероприятие ко Дню победы и хотите найти в Интернете слова известной военной песни Булата Окуджавы «Вы слышите, грохочут сапоги». Поиск можно организовать следующим образом:

 

Яндекс > Каталог > Культура и искусство > Музыка > Авторская песня
Такой способ поиска является достаточно быстрым и эффективным. В конце вам предлагается всего несколько ссылок, среди которых есть ссылки на сайты с песнями известных бардов. Остается только найти на сайте архив с текстами песен Б. Окуджавы и выбрать в нем нужный текст.

 

Другой пример. Предположим, вы собираетесь приобрести мобильный телефон и хотите сравнить характеристики аппаратов разных фирм. Поиск мог бы вестись по следующим рубрикам каталога:

Яндекс > Каталог > Компьютеры и связь > Мобильная связь > Мобильные телефоны
Получив ограниченное количество ссылок, можно достаточно оперативно их просмотреть и выбрать телефон, исследовав характеристики по фирмам и модификациям аппаратов.

 

 

Поиск по ключевым словам

Большинство поисковых машин имеют возможность поиска по ключевым словам. Это один из самых распространенных видов поиска. Для поиска по ключевым словам необходимо ввести в специальном окне слово или несколько слов, которые следует искать, и щелкнуть на кнопке Найти.

Поисковая система найдет в своей базе и покажет документы, содержащие эти слова. Таких документов может оказаться множество, но много в данном случае не обязательно означает хорошо.

Проведем несколько экспериментов с любой из поисковых систем. Предположим, что мы решили завести аквариум и нас интересует любая информация по данной теме. На первый взгляд самое простое — это поиск по слову «аквариум». Проверим это, например, в поисковой системе Яндекс. Результатом поиска будет огромное количество страниц - огромное количество ссылок. Причем, если посмотреть внимательнее, среди них окажутся сайты, упоминающие группу Б. Гребенщикова «Аквариум», торговые центры и неформальные объединения с таким же названием, и многое другое, не имеющее отношения к аквариумным рыбкам.

Нетрудно догадаться, что такой поиск не может удовлетворить даже непритязательного пользователя. Слишком много времени придется потратить на то, чтобы отобрать среди всех предложенных документов те, что касаются нужного нам предмета, и уж тем более на то, чтобы ознакомиться с их содержимым.

Можно сразу сделать вывод, что вести поиск по одному слову, как правило, нецелесообразно, ведь по одному слову очень сложно определить тему, которой посвящен документ, веб-страница или сайт. Исключение составляют редкие слова и термины, которые практически никогда не используются вне своей тематической области.
Имея определенный набор наиболее употребительных терминов в нужной области, можно использовать расширенный поиск. На рис. показано окно расширенного поиска в поисковой системе Яндекс. В этом режиме возможности языка запросов реализованы в виде формы. Подобный сервис, включающий словарные фильтры, предлагается почти всеми поисковыми системами.

Попробуем уточнить условия поиска и введем словосочетание «аквариумные рыбки». Количество ссылок уменьшится более чем в 20 раз. Этот результат нас устраивает больше, но все равно среди предложенных ссылок могут встретиться, например, русские сувенирные наборы спичечных этикеток с изображениями рыбок, и коллекции заставок для Рабочего стола компьютера, и каталоги аквариумных рыбок с фотографиями, и магазины аквариумных аксессуаров. Очевидно, что следует продолжить движение в направлении уточнения условий поиска.

Для того чтобы сделать поиск более продуктивным, во всех поисковых системах существует специальный язык формирования запросов со своим синтаксисом. Эти языки во многом похожи. Изучить их все достаточно сложно, но любая поисковая машина имеет справочную систему, которая позволит вам освоить нужный язык.


Правила формирования запросов в поисковой системе Яндекс

Приведем несколько простых правил формирования запроса в поисковой системе Яндекс. Ключевые слова в запросе следует писать строчными (маленькими) буквами.

Это обеспечит поиск всех ключевых слов, а не только тех, которые начинаются с прописной буквы. При поиске учитываются все формы слова по правилам русского языка, независимо от формы слова в запросе. Например, если в запросе было указано слово «знаю», то условию поиска будут удовлетворять и слова «знаем», «знаете» и т. п.
Для поиска устойчивого словосочетания следует заключить слова в кавычки.
Например, «фарфоровая посуда».

Для поиска по точной словоформе перед словом надо поставить восклицательный знак. Например, для поиска слова «сентябрь» в родительном падеже следует написать «!сентября».

Для поиска внутри одного предложения слова в запросе разделяют пробелом или знаком &.Например, «приключенческий роман» или «приключенческий&роман». Несколько набранных в запросе слов, разделенных пробелами, означают, что все они должны входить в одно предложение искомого документа.

Если вы хотите, чтобы были отобраны только те документы, в которых встретилось каждое слово, указанное в запросе, поставьте перед каждым из них знак плюс «+». Если вы, наоборот, хотите исключить какие-либо слова из результата поиска, поставьте перед этим словом минус «-». Знаки « + » и «-» надо писать через пробел от предыдущего и слитно со следующим словом. Например, по запросу «Волга -автомобиль» будут найдены документы, в которых есть слово «Волга» и нет слова «автомобиль».
При поиске синонимов или близких по значению слов между словами можно поставить вертикальную черту «|». Например, по запросу «ребенок | малыш | младенец» будут найдены документы с любым из этих слов.

Вместо одного слова в запросе можно подставить целое выражение. Для этого его надо взять в скобки. Например, «(ребенок | малыш | дети | младенец) +(уход | воспитание)».
Знак«~» (тильда) позволяет найти документы с предложением, содержащим первое слово, но не содержащим второе.

Например, по запросу «книги ~ магазин» будут найдены все документы, содержащие слово «книги», рядом с которым (в пределах предложения) нет слова «магазин».

Если оператор повторяется один раз (например, & или ~), поиск производится в пределах предложения. Двойной оператор (&&,~~ ) задает поиск в пределах документа. Например, по запросу «рак ~~ астрология» будут найдены документы со словом «рак», не относящиеся к астрологии.

Вернемся к примеру с аквариумными рыбками. После прочтения нескольких предлагаемых поисковой системой документов становится понятно, что поиск информации в Интернете следует начинать не с выбора аквариумных рыбок. Аквариум - сложная биологическая система, создание и поддержание которой требует специальных знаний, времени и серьезных капиталовложений.

На основании полученной информации человек, производящий поиск в Интернете, может кардинально изменить стратегию дальнейшего поиска, приняв решение изучить специальную литературу, относящуюся к исследуемому вопросу.

Для поиска литературы или полнотекстовых документов возможен следующий запрос:
«+(аквариум | аквариумист | аквариумистика) +начинающим +(советы | литература) +(статья | тезис | полнотекстовый) -(цена | магазин | доставка | каталог)».

После обработки запроса поисковой машиной результат оказался весьма успешным. Уже первые ссылки приводят к искомым документам.

 

Практические рекомендации по поиску:

  • Постарайтесь понять смысл вопроса. Возможно, ответ вам уже известен. Чтобы найти правильный URL страницы, ищите одновременно ключевые слова из вопроса и известный вам ответ.
  • Число документов, полученных в результате поиска, может быть огромно. Поэтому решающее значение для оптимального поиска информации имеет правильный набор ключевых слов. Описание того, как составлять эффективные запросы, дается в самих поисковых ресурсах. Как правило, любая поисковая система имеет раздел, где обсуждаются подобные вопросы.
  • Проверяйте орфографию в написании слова.
  • Используйте синонимы, если список найденных страниц слишком мал.
  • Ищите больше, чем по одному слову. Максимально сужайте предмет поиска.
  • Не начинайте обычные слова с прописной буквы, кроме имен собственных.
  • Используйте ссылку "найти похожие документы", если один из найденных документов наиболее близок к искомому.
  • Чтобы исключить документы, где встречается определенное слово, поставьте перед ним знак минус. И наоборот, если это слово наиболее важно - знак плюс.
  • При необходимости используйте язык запросов, чтобы сделать запрос более точным.
  • Обратите внимание, что контекст документа уже может содержать ответ, т.е. не потребуется заходить в сам документ.
  • Для ускорения поиска отключите загрузку картинок в браузере или пользуйтесь облегченными версиями поисковых систем. Например, Ya.ru.

 

4. Содержание заданий

Задание 1. Освоение элементарных приемов поиска информации в сети Интернет.
Цель задания:Изучение интерфейса, назначения и особенностей поисковых WWW-серверов. Разъяснение понятия «запрос», отличие запроса от вопроса.

 

Задание: Организуйте поиск, заполните таблицу и прокомментируйте результаты поиска:

 

Таблица 10.1 Результаты поиска

Ключевая фраза Результаты поиска
Yandex Google
информационные технологии в образовании    
     
"информационные технологии в образовании"    
педагогические технологии личностно-ориентированного обучения    
  • Дополните таблицу самостоятельно построенными запросами.
  • Познакомьтесь с избранными документами и оцените их релевантность (смысловое соответствие результатов поиска указанному запросу). Организуйте поиск интересующей Вас информации и внесите результаты в таблицу.
  • Сравнить результаты поиска (только первые блоки) всех серверов и прокомментировать их.
    Примечание. Для многократного дублирования одного и того же запроса (и «чистоты» эксперимента), необходимо воспользоваться буфером обмена Windows.
    При анализе интерфейса поисковых WWW-серверов обратить внимание не только на окна запросов и кнопку Пуск (Старт, Начать, Искать, Go и т.д.), но и на ссылки о помощи (Помощь, Help, Как искать, Как сформировать запрос и т.д.).

 

Задание 2. Поиск образовательных сайтов.

Цель задания: Освоение приёмов поиска информации через каталоги и применения средств простого поиска.

Задание:
Найти сайты физико-математических школ с помощью тематического поискового каталога.

Поиск в каталоге LIST.RU.

  • Запустить обозреватель MS Internet Explorer.
  • Ввести адрес http://www.list.ru в адресную строку обозревателя.
  • В списке категорий перейти последовательно по следующим ссылкам Образование - Наука - Школы - Физико-математические школы:

В результате мы получили список 20 физико-математических школ (Данные на 11 марта 2003 года. Ваши результаты могут быть несколько другими, поскольку информация в Интернет меняется очень быстро). Каждая строка списка – гипертекстовая ссылка, перейдя по которой, можно просмотреть заинтересовавший вас школьный сайт.

 

Задание 3. Освоение приемов поиска в различных поисковых системах.

Цель задания: Освоение приёмов поиска информации с помощью поисковой машины, формирование группы слов для организации простого поиска.

 

Задание:

Найти информацию о том, кто является министром образования и науки РФ в настоящее время и его биографию с помощью поисковой системы Google.Ru.

Порядок выполнения.

  • Запустить браузер.
  • В адресной строке набрать адрес поисковой системы http://www.google.ru и инициализировать процесс загрузки ресурса.
  • В интерфейсе начальной страницы поисковой системы Google.Ru найти форму для поиска и строку ввода запроса..
  • Инициализировать процесс поиска в поисковой системе, нажав на кнопку Поиск в Goоgle.
  • Просмотреть результаты поиска и найти среди них наиболее подходящие (релевантные) вашему запросу.

 

Задание 4. Поиск нормативных документов.

Цель задания:Освоение приёмов поиска информации с помощью поисковой машины, изучение особенностей поиска нормативного документа.

 

Задание: Найти Правила оформления блок-схем алгоритмов в соответствии с ГОСТ10.002-80 ЕСПД. Порядок выполнения:

Для проведения поиска документа воспользуемся, например, поисковой машиной Яndex.ru. В группу ключевых слов запроса необходимо включить значимые по смыслу слова и исключить стоп-слова (под значимыми понимают те слова, которые несут основную смысловую нагрузку документа; стоп-слова – слова не несущие смысловой нагрузки). Словосочетание «Правила оформления» можно отбросить, т. к. они встречаются в большинстве нормативных образовательных документов.

  1. Запустить обозреватель MS Internet Explorer.
  2. В адресной строке набрать адрес поисковой системы http://www.yandex.ru и инициализировать процесс загрузки ресурса.
  3. В строку поиска введите запрос.
  4. Нажмите клавишу Enter или щёлкните мышью на кнопку Найти.
  5. Открыть найденный документ.

 

Задание 5. Поиск графической информации.

Цель задания:Освоение приёмов поиска графической информации с помощью поисковой машины, формирование группы ключевых слов и интерфейса поисковой системы для поиска изображений.

 

Задание:
Подготовить иллюстрации к докладу о безопасности детей в сети Интернет.

Порядок выполнения.

  • Запустить обозреватель MS Internet Explorer.
  • В адресной строке набрать адрес поисковой системы http://www.yandex.ru и инициализировать процесс загрузки ресурса.
  • В интерфейсе начальной страницы поисковой системы Яndex.ru найти форму для поиска и строку ввода запроса. Щелчком левой клавишей мыши по строке установить в ней курсор и напечатать: урок школа. Щелчком левой клавиши мыши в соответствующем окошке поставить флажок Картинки.
  • Инициализировать процесс поиска в поисковой сиситеме, нажав на кнопку Найти.
  • Просмотреть результаты поиска и найти среди них наиболее подходящие (релевантные) вашему запросу.
  • Для просмотра увеличенного изображения необходимо щелкнуть левой кнопкой мыши по картинке. Для запуска Интернет-ресурса, на котором располагается данное изображение, щёлкнуть левой кнопкой мыши по ссылке с его адресом под картинкой. Точно так же можно загрузить другие картинки с сервера (их количество представлено в скобках).

Задание 6. Поиск литературных произведений в сети Интернет.

Цель задания:Освоение приёмов поиска и скачивания файлов через WWW.

 

Задание:
Найти и сохранить на локальном диске один из рассказов Ивана Безродного.

Найти и сохранить на локальном диске один из рассказов Захара Прилепина.

Найти и сохранить на локальном диске биографию Корнея Чуковского, его настоящее имя и историю создания альманаха «Чукоккола».

 

5. Содержание отчёта:

5.1. Заполненная таблица по результатам поиска данных в задании 1.

5.2. Список образовательных сайтов.

5.3. Положение Министерства образования Российской Федерации о порядке аттестации педагогических и руководящих работников муниципальных и образовательных учреждений

5.4 Иллюстрации к докладу о методике проведения уроков в школе

 

6. Контрольные вопросы

6.1.Какой вид поиска является самым быстрым и надежным?
6.2.Где пользователь может найти адреса Web-страниц?
6.3.Каково основное назначение поисковой системы?
6.4.Из каких частей состоит поисковая система?
6.5.Какие поисковые системы вы знаете?
6.6.Какова технология поиска по рубрикатору поисковой системы?
6.7.Какова технология поиска по ключевым словам?
6.8.Когда в критерии поиска надо задавать + или -?
6.9.Какие критерии поиска в Яндексе заданы следующей фразой: (няня|воспитатель|гувернантка)++(уход|воспитание|присмотр)?
6.10.Что означает удвоение знака (~~ или ++) при формировании сложного запроса?

 

7. Список рекомендуемой литературы:

7.1 Могилев А.В. Практикум по информатике: учеб.пособие для вузов. - М.: Академия, 2008. - 608с.

7.2 Угринович Н. Д. Информатика и ИКТ:10,11 кл.- М.:БИНОМ. Лаборатория знаний, 2008. - 512с.

7.3 Немцова Т. И. Базовая компьютерная подготовка. Операционная система, офисные приложения, Интернет. Практикум по информатике : учеб. пособие / Т. И.

7.4 Гвоздева В. А. Информатика, автоматизированные информационные технологии и системы: учебник / В. А. Гвоздева. - М. : ИД "Форум": Инфра-М, 2012. - 544 с.

 









Последнее изменение этой страницы: 2016-04-18; Нарушение авторского права страницы

infopedia.su не принадлежат авторские права, размещенных материалов. Все права принадлежать их авторам. Обратная связь