Информационно-поисковые системы (ИПС) . 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Информационно-поисковые системы (ИПС) .



Описание занятия

1. Прочитать и законспектировать теоретическую часть.

2. Выполнить контрольные задания.

3. Ответить на контрольные вопросы.

4. Полученные результаты отправить на электронный адрес radaev1964@gmail.com (или в личку VK)

Теоретические сведения:

Поиск информации.

Информационно-поисковые системы (ИПС).

Поисковые технологии информационных систем.

Примеры поисковых систем и сервисов.

5. Поиско́вые систе́мы в Интернете

Поиск информации

Поиск информации или информационный поиск представляет один из основных информационных процессов.

Знаменитая фраза «Кто владеет информацией, тот владеет миром» принадлежит Ротшильдам. Они ещё в 19 веке прекрасно ориентировались в информационных потоках. Ротшильды подготовили все, чтобы информация попадала в первую очередь к ним и на этом приобрели не только информацию и деньги, но и «неограниченную» власть. Цели, возможности и характер поиска всегда зависели от наличия, информации, её важности и доступности, а также средств организации поиска. «Если Вы думаете, что всё понимаете, значит Вам не обо всём говорят» - Герберт Франке книга "Манипулируемый человек".

Конец XX - начало XXI века, характеризуется огромными массивами постоянно растущей разнообразной информации, доступной и представляющей интерес для самых широких слоев социума. Более того, Интернет-технологии и программно-технические средства, также доступные большинству людей, позволяют осуществлять данный процесс в любое время, практически в любом месте по любым запросам.

Поиск - процесс, в ходе которого в той или иной последовательности производится соотнесение отыскиваемого с каждым объектом, хранящимся в массиве. Цель любого поиска заключается в потребности, необходимости или желании находить различные виды информации, способствующие получению лицом, осуществляющим поиск, нужных ему сведений, знаний и т.д. для повышения собственного профессионального, культурного и любого иного уровня; создания новой информации и формирования новых знаний; принятия управленческих решений и т.п.

По оценке специалистов в Интернете работает 7,75 миллиарда пользователей. Аудитория интернета растет со скоростью 1 000 000 новых пользователей в день, так говорится в новом пакете отчетов о состоянии глобальной отрасли digital на 2020 год (агентство We Are Social и сервис Hootsuite) *.

* - Подробную информацию и статистику можете посмотреть в ПРИЛОЖЕНИИ в конце документа.

Для начала вот самые важные данные, которые можно найти в отчетах We Are Social и Hootsuite о глобальном состоянии цифровых технологий на 2020 год (https://datareportal.com/reports/digital-2020-global-digital-overview):

  • Сегодня в мире 7,75 миллиарда уникальных мобильных пользователей, что на 100 миллионов (2%) больше, чем в прошлом году.
  • В 2019 году аудитория интернета насчитывает 5,19 миллиарда человек, что на 366 миллионов (9%) больше, чем в январе 2019 года.
  • В социальных сетях зарегистрировано 3,8 миллиарда пользователей. По сравнению с данными на начало прошлого года этот показатель вырос на 288 миллионов (9%).
  • Сегодня 3,26 миллиарда человек заходят в социальные сети с мобильных устройств. Это на 10% больше, чем в прошлом году, когда с мобильных в соцсетях сидело на 297 миллионов человек меньше.

 

 Из них десятки тысяч - в режиме онлайн (англ. "on-line" - интерактивный доступ в любой момент времени) и количество таких пользователей постоянно растет. Это затрудняет организацию оперативного поиска и нахождения нужной такому количеству пользователей информации. Возникают проблемы, обусловленные разнообразными возможностями (видами) поиска информации, различными способами их реализации в информационно-поисковых системах (ИПС), разным уровнем знаний пользователей о возможностях таких систем, особенно в области формирования запросов и обработки данных, полученных в результате выполнения этих запросов и т.д.

Предполагается, что в дальнейшем будут созданы ИПС, способные автоматически адаптироваться с учетом уровня знаний и запросов конкретных пользователей, воспринимать запросы на естественном языке и, используя искусственный интеллект, выдавать им релевантную и пертинентную информацию, что на сегодняшний день уже частично реализовано в поиковых системах. Для создания таких ИПС требуются интеллект и знания конкретных пользователей ИПС или их посредников. Пока же от широкого круга пользователей поисковых систем требуется достаточно хорошо владеть данной предметной областью.

Существуют различные толкования термина "поиск информации" или "информационный поиск".

Термин " информационный поиск " (англ. "information retrieval") ввёл американский математик К. Муэрс. Он заметил, что побудительной причиной такого поиска является информационная потребность, выраженная в форме информационного запроса. К объектам информационного поиска К. Муэрс отнес документы, сведения об их наличии и (или) местонахождении, фактографическую информацию.

Решать проблемы фактографического поиска первыми стали представители библиотек. Они разработали средства информационного поиска, получившие название "справочно-поисковый аппарат" (каталоги, библиографические указатели и др.).  В  профессиональной отечественной печати данный термин используется с 1970-х годов.

Библиотекари определяют "информационный поиск" как нахождение в информационном массиве документов, соответствующих информационному запросу пользователей.

С точки зрения использования компьютерной техники "информационный поиск" - совокупность логических и технических операций, имеющих конечной целью нахождение документов, сведений о них, фактов, данных, релевантных запросу потребителя.

" Релевантность " - устанавливаемое при информационном поиске соответствие содержания документа информационному запросу или поискового образа документа поисковому предписанию.

Существуют и другие определения. В любом случае, информационный поиск вызван потребностью удовлетворения информационных запросов пользователей, ожидающих с помощью поисковых систем оперативно получить необходимые им данные или сведения. Он является методом нацеленного поиска и извлечения релевантных документов и (или) фактов из различных источников информации, например, банков данных или запоминающих устройств. В качестве таковых выступают живые и неживые объекты, представляющие различные источники и носители информации.

Системы, обеспечивающие реализацию подобного поиска информации, называются поисковыми системами (ПС). В традиционных технологиях ПС представляют картотеки и каталоги, адресные и иные справочники, указатели, энциклопедии, справочный аппарат к изданиям и другие материалы.

В 1945 годы американский ученый и инженер В. Буш в статье "Возможный механизм нашего мышления" впервые широко поставил вопрос о необходимости механизации информационного поиска. Начиная с 1960 годов, появляются автоматизированные поисковые системы, работающие с информацией. С этого периода ведутся интенсивные работы в области формирования и реализации принципов и методов информационного поиска.

" Поисковые системы " осуществляют поиск среди документов базы данных (БД) или иных массивов машиночитаемых данных, содержащих заданные слова.

Электронные ПС с помощью обычных или интеллектуальных терминалов (ПЭВМ) дают возможность пользователям производить поисковые запросы при помощи формальных и описывающих содержание элементов и с применением специальных логических операторов; осуществляют поиск среди документов базы или иных массивов машиночитаемых данных, содержащих заданные слова. Поисковые системы позволяют осуществлять только поисковые процедуры и связанные с ними процессы.

Средства метапоиска.

В Интернете ИПС размещается на одном или нескольких серверах. В ИПС собирается, индексируется и регистрируется информация о документах, имеющихся в обслуживаемой системой группе веб-серверов. В документах индексируются все значащие слова или только слова из заголовков.

Тематические каталоги предусматривают обработку документов и отнесение их к одной из нескольких категорий, перечень которых заранее задан. Фактически это индексирование на основе классификации. Индексирование может проводиться автоматически или вручную с помощью специалистов, просматривающих популярные веб-узлы и составляющих краткое описание документов-резюме (ключевые слова, аннотация, реферат).

Специализированные каталоги или справочники создаются по отдельным отраслям и темам, по новостям, по городам, по адресам электронной почты и т. п.

Поисковые машины (самое развитое средство поиска в Интернете) реализуют технологию полнотекстового поиска. Индексируются тексты, расположенные на опрашиваемых серверах. Индекс может содержать информацию о нескольких миллионах документов. Например, в индексе популярной ИПС "AltaVista" более 56 млн. URL- адресов.

При использовании средств метапоиска запрос осуществляется одновременно несколькими поисковыми системами. Результат поиска объединяется в общий, упорядоченный по степени релевантности список. Каждая система обрабатывает только часть узлов сети, что позволяет расширить базу поиска. К подобному классу можно отнести и "персональные программы поиска", позволяющие формировать свои собственные инструменты метапоиска (например, автоматически опрашивать часто посещаемые узлы).

Базы информационных данных могут содержать практически любые виды информации, в том числе в любой комбинации. Информационный поиск осуществляется как по существующим в полнотекстовых ЭИР терминам, так и по специальным элементам, входящим в состав ИПЯ. Для формирования запросов используются специальные информационно-поисковые языки.

ИПС внутри найденной выборки обычно пытаются расположить документы в порядке их "релевантности", то есть близости к введенному пользователем запросу. Критериев такой близости много и выявление близких "по смыслу" к запросу документов не решает проблемы получения информации при отсутствии релевантного документа. Подобная ситуация достаточно тривиальна, в том числе и потому, что пользователь зачастую ищет документ, который сам собирается написать. Следует отметить, что в результате проведенного поиска пользователь может получить как релевантные, пертинентные, так и нерелевантные и непертинентные подмассивы данных.

ИПС фактически являются системами информационного обеспечения и представляют собой базы и банки данных. В качестве объекта в них выступает индивид, организация, отрасль, регион и т.п. Субъектом информационного обеспечения является специалист-информатик, любой потребитель информации.

Примеры поисковых систем и сервисов.

Современная страница истории электронных систем начинается с 1989 года публичным представлением агентством Intralex программного комплекса «Юридическая справочно-информационная система», а с 1990 года появлением систем «Кодекс», «Гарант», «Консультант Плюс».

Отличительные особенности представления информации в информационно-справочных системах от интернета заключаются в следующем:

— все документы в системах представлены не разрозненно (отдельно исходный документ, отдельно все изменения и редакции), а комплексно: сами тексты документов включают все изменения, гиперссылки на нормативную базу, сведения о действии и т.д., то есть применительно к системам речь идет о «живых» интерактивных электронных текстах документов;

— документы из информационно-справочной системы отличаются максимальной достоверностью, законностью, аутентичностью и актуальностью.

    Возможности ИПС

  • интеллектуальный поиск — поиск по свободно сформулированному запросу т.е. (слову, фразе, дате принятия, номеру и т. д.).
  • атрибутный поиск — поиск по общим или специализированным атрибутам.

Общие атрибуты — атрибуты, присущие большинству документов (поиск по тексту, наименование, вид документа, принявший орган, номер, дата принятия, актуальность).

Компьютерный вид документа по атрибутам включает в себя:

- тип файла: по расширению (*.txt; *.doc, *.jepg, *.mp3, *.ppt, *xls, …),

- по виду документа (текстовый, табличный, БД, презентация, аудио, графика, инженерная графика, видео, системные файлы…).

Специализированные атрибуты — атрибуты, свойственные данному виду документа.

Описание занятия

1. Прочитать и законспектировать* теоретическую часть.

2. Выполнить контрольные задания.

3. Ответить на контрольные вопросы.

4. Полученные результаты отправить на электронный адрес radaev1964@gmail.com (или в личку VK)

 

* Пишем конспект убористым почерком:
- нет конспекта - 2
- два листа конспекта - 3
- три листа конспекта и ответы на вопросы - 4
- четыре пять листов конспекта и ответы на вопросы -5

Пишем кратко со смыслом, главное ознакомиться с теоретической частью и кратко законспектировать; всё учитывается (отсутствие ошибок, исправлений, понимание текста…) – «краткость сестра таланта».

ПРИЛОЖЕНИЕ – для ознакомления.

 


ПРИЛОЖЕНИЕ 1

Описание занятия

1. Прочитать и законспектировать теоретическую часть.

2. Выполнить контрольные задания.

3. Ответить на контрольные вопросы.

4. Полученные результаты отправить на электронный адрес radaev1964@gmail.com (или в личку VK)

Теоретические сведения:

Поиск информации.

Информационно-поисковые системы (ИПС).



Поделиться:


Последнее изменение этой страницы: 2021-05-12; просмотров: 53; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.117.183.172 (0.02 с.)