В. Л. Римский, заведующий отделом социологии фонда индем 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

В. Л. Римский, заведующий отделом социологии фонда индем



МПСУ                                                                                                    2017 год

Понятие информатики

Слово информатика образовано слиянием двух французских слов: "информация" (information) и "автоматика" (automatique). Так в 60-х годах XX века во Франции называли область человеческой деятельности, занимающейся обработкой информации с помощью ЭВМ - электронной вычислительной машины - так раньше называли компьютеры. В настоящий период название ЭВМ практически не используется, поскольку современные компьютеры заняты не столько расчётами, сколько осуществлением коммуникации между пользователями, созданием документов, записей и распространением звуков, видеоизображений, поиском информации и другими видами работ.

"Информатикой" в Беларуси, России, Франции, Германии и ряде других стран называют дисциплину, связанную с изучением всего, что имеет отношение к компьютерам. В США, Англии и ряде других стран используется термин "Computer Science" (компьютерная наука).

Более конкретно, информатика – это наука:

· о видах, формах представления и свойствах информации;

· о методах и способах хранения, передачи и поиска информации;

· о создании и использовании носителей информации;

· о создании и использовании современных компьютеров;

· о методах создания и свойствах алгоритмов;

· о создании и использовании компьютерных программ и баз данных.

Информатика как сфера практической деятельности, соответствует информатике, как науке. В частности, информатика как практическая деятельность понимается как работа с информацией, как деятельность по применению современных компьютеров и компьютерных сетей в различных предметных областях, а также по разработке аппаратного и программного обеспечения для этих областей. Применение методов современной информатики в конкретных предметных областях не только расширяет объёмы обрабатываемой специалистами информации и ускоряет её обработку, но и позволяет им более глубоко анализировать её, а также использовать методы обработки информации из других предметных областей.

Информатика как наука тесно связана с информатикой как областью практической деятельности. Использование научных принципов и методов современной информатики в конкретных предметных областях позволяет делать более обоснованные выводы и прогнозы с использованием знаний об общих свойствах информации. Связи науки информатики с практической работой в этой области усиливаются тем, что в сфере современных информационных технологий, компьютеров, компьютерных сетей и сетей связи научные достижения быстро внедряются в практику, а сама практика развивается с постоянным использованием самых новых и наиболее эффективных технологий.

Информатика как практическая деятельность включает также не вполне разработанные в науке методы построения информационно-логических моделей предметных областей и некоторых методов программирования, например, объектного. Информационно-логические модели предметных областей используются для создания информационных систем и информационных технологий, автоматизирующих работу с информацией в этих предметных областях. Методы объектного программирования получили в последние годы широкое применение, потому что позволяют по единым моделям и схемам выполнять разработки программных средств от постановки задачи до получения конкретного программного кода. Но полного научного обоснования методы объектного программирования пока не получили. Таким образом, информатика как практическая деятельность в некоторых направлениях опережает научные разработки, стимулирует поиски научных обоснований некоторых новых методов информационной деятельности, доказавших свою полезность и успешность на практике.

В современном понимании информатика – это сфера научной и практической деятельности, связанной с обработкой информации с помощью компьютеров, компьютерных сетей, сетей связи и соответствующих этим техническим средствам компьютерных программных систем. В современной информатике, следовательно, наибольшее внимание и в науке, и в практике обращается на автоматизацию обработки информации и на процессы взаимодействия компьютерных систем и сетей с их пользователями.

Понятие информации

Понятие информации является одним из основных в современной науке и практической человеческой деятельности, но пока не получило общепринятого определения. Приводимые ниже описания понятия информации все в совокупности представляют её основные характеристики и свойства. Фактически, определением понятия информации является совокупность приведённых ниже описаний, хотя и они пока не стали общепринятыми.

Информация – это одно из немногих общенаучных понятий, объединяющих всё известное в настоящий период научное знание. Содержание информации и её специфические свойства в разных предметных областях, безусловно, разные. Но общие свойства информации позволяют применять к ней общие методы обработки, независящие от предметной области, из которой она появилась. Такими общими методами можно считать создание текстов на компьютерах, проведение расчётов в электронных таблицах, проведение статистических расчётов, создание компьютерных презентаций и другие. Эти общие методы применяются единообразно в любых предметных областях, а будучи разработанными в одной из них, в большинстве случаев могут быть перенесены в другие. В частности, современные программы статистических расчётов могут работать с информацией любых предметных областей, а результаты их работы различаются только смыслом, который человек, применяющий эти программы, придаёт результатам таких расчётов.

Понятие информации: выводы

Сводя вместе описания различных сторон понятия информация можно сделать следующие выводы.

Информация – это общенаучное понятие, объединяющее все без исключения предметные области единым пониманием её сущности и методов обработки.

Информация – это нематериальное свойство всех объектов, материальных и нематериальных.

Информация возникает как нематериальная составляющая следов взаимодействий любых материальных объектов.

Информация отражает какие-то свойства одного материального объекта в другом в процессе формирования следа взаимодействия на нём.

Информация охватывает не весь процесс отражения, а только его аспекты, связанные с разнообразием. Разнообразие определяет объём и качество информации: чем оно выше, тем выше объём и качество информации.

В человеческом общении информация воспринимается как сведения, факты или сигналы. Потребность в информации у человека связана с уровнем неопределённости сведений, которые у него имеются. Когда сведений мало, но сформированы структуры сознания, способные их воспринимать, потребность в информации наибольшая, информация снимает неопределённость сведений. Когда сведений много или несформированы структуры сознания, способные эти сведения воспринимать, потребность в информации минимальная, неопределённость она не снимает, потому что такой неопределённости не существует.

В человеческом общении информация существует в виде сообщений, единым и достаточно полным собранием сведений. Виды информации разнообразны и соответствуют возможностям человеческого её восприятия. А по форме сообщения бывают документальные, когда информация фиксируется в каких-то документах, и недокументальные, когда информация в документах не фиксируется.

Информация должна обладать некоторыми обязательными свойствами для повышения эффективности её передачи, получения и переработки в человеческом общении. Синтаксические свойства информации определяют правила составления сообщений. Семантические свойства информации определяют правила придания этим сообщениям смысла. Прагматические свойства информации определяют её ценность и полезность для человека. Атрибутивные свойства информации определяют возможности её существования в материальном мире: это свойства, неразрывно связанные с информацией, но не являющиеся свойствами только информации: неотрывность от материального носителя информации и её языковая природа. Динамические свойства информации определяют возможности её развития и изменения: рост, старение, рассеяние и повторяемость, в первую очередь.

Сбор информации

Сбор информации – это процесс выявления информации, оставшейся в качестве следа от того или иного взаимодействия. Как правило, сбор информации производится сознательно, например, в ходе проведения тех или иных исследований или юридических расследований.

В современных компьютерах важным информационным процессом всегда является ввод информации в них. Поскольку собранная информация очень редко бывает в компьютерном формате, переводить в него собранную информацию приходится операторам, переводящим информацию, например, с печатных документов в компьютерные формы. В последний период для ввода печатных документов в компьютеры широко используются специальные считывающие устройства – сканеры. Ввод информации в компьютер является частным случаем более общего процесса передачи информации.

Передача информации

Передача информации - это процесс переноса информации от одного объекта к другому.

Процессы передачи информации пронизывают всю нашу жизнь. Для передачи информации на большие расстояния человечество создало средства связи: почту, телеграф, телефон, радиосвязь, спутниковую связь и т.д. Благодаря средствам связи современный человек может в тот же день узнать о событии, произошедшем в любой точке земного шара.

В передаче информации всегда участвуют две стороны: передаёт информацию - источник, а получает - приёмник. Например, объясняя урок, учитель передаёт информацию ученикам. В этом случае учитель - источник информации, а ученики - приёмники. А когда ученик отвечает на вопрос, он становится источником, а учитель приёмником.

Преобразование информации

После ввода информации в компьютер она становится данными и может быть обработана без участия человека, т.е. с помощью автоматических процедур. Обработка данных может включать какие-то расчёты с числовой информацией или преобразования данных, т.е. видоизменение данных, направленное на выполнение условий того или иного метода обработки. Эти видоизменения осуществляются по заказу человека, и приводят к возможности получения после преобразований новой информации.

Вывод информации

В современных компьютерах важным информационным процессом является вывод информации, полученной после её преобразований. Вывод информации из компьютера позволяет человеку воспользоваться результатами работы компьютера, в частности, полученной им новой информации. Такой новой информацией могут быть результаты каких-то расчётов, диаграммы, рисунки, звуки, видеоизображения и т.п.

Информационный поиск

Информационный поиск – это процесс отыскания в некотором множестве текстов или документов всех таких, которые посвящены указанной в запросе теме, предмету или содержат нужные потребителю факты, сведения. Информационный поиск таким образом бывает документальным, когда ищется документ, и фактографическим, когда ищется факт, сведения.

Информационный поиск осуществляется посредством компьютерной информационно-поисковой системы или выполняется вручную в непосредственной работе человека с документами. Но всегда участником информационного поиска является человек: он ставит цель поиска, определяет его средства, определяет насколько адекватным его запросу оказался результат поиска и т.п.

Для того чтобы осуществить информационный поиск в соответствующее множество текстов должны быть предварительно введены соответствующие документы, содержащие те или иные факты и сведения. В современных компьютерных системах каждый текст получает при вводе дополнительные записи, содержащие его основное смысловое содержание. По этим смысловым содержаниям и находятся в процессе поиска соответствующие документы. Только в редких случаях при поиске происходит полный просмотр всех текстов документов.

Техническая эффективность информационного поиска характеризуется двумя относительными показателями – коэффициентом точности (отношением числа текстов, отвечающих на информационный запрос, к общему числу текстов в данной выдаче) и коэффициентом полноты (отношением числа текстов, отвечающих на информационный запрос, к общему числу таких текстов, содержащихся в данной системе). Необходимые значения этих показателей зависят от специфики информационных потребностей. Например, при поиске патентных описаний с целью проведения экспертизы патентной заявки на новизну необходима 100%-ная полнота выдачи; при поиске, ориентированном на обычного исследователя или инженера, очень хорошей считается точность выдачи около 80%, полнота - около 50%.

Понятие алгоритмизации

Алгоритмизация – это процесс разработки, составления и внедрения алгоритма для решения тех или иных проблем.

Компьютерная программа – это способ описания, представления алгоритма на языке, понятном компьютеру. В этом смысле компьютер – это техническое устройство, позволяющее хранить и исполнять наборы алгоритмов решений задач из различных областей человеческой деятельности.

Компьютер, как техническое устройство, понимает изначально только язык последовательностей электрических сигналов. Поэтому на самых первых этапах развития компьютеров разрабатывались своеобразные алгоритмы-переводчики, позволяющие человеку составить алгоритм на языке электрических сигналов. В современных компьютерах это делается через цепочку инструментальных программ, часто называемых трансляторами. Каждый транслятор переводит алгоритм с языка более высокого уровня, более близкого к человеческому пониманию, на язык более низкого уровня. И так до тех пор, пока соответствующие инструкции не превратятся в последовательности электрических сигналов. Обычная последовательность такого перевода такова: алгоритм в терминах обычного человеческого языка с возможным добавлением схем – язык программирования высокого уровня, на котором способны писать инструкции практически любые специалисты, – машинно-ориентированный язык программирования, на котором способны писать инструкции только очень высокопрофессиональные программисты, – язык машинных кодов, который понятен управляющим устройствам компьютера, но практически уже непонятен человеческим индивидам, – язык электрических сигналов, понятный только компьютерам.

В процессе алгоритмизации алгоритмы могут задаваться следующими способами:

1. словесно (описание инструкций на обычном человеческом языке);

2. с помощью таблиц (таблицы и формулы расчётов);

3. графически (в виде так называемых блок-схем, показывающих последовательности и содержание действий, шагов алгоритма);

4. с помощью того или иного языка программирования (в виде последовательности кодов, которые можно перевести на язык более низкого уровня, понятный компьютеру).

Многие алгоритмы и даже программы, разработанные ещё в начале использования компьютеров в 50-е и 60-е годы XX века, до сих пор успешно используются. Так происходит накопление алгоритмов и программ для решения задач на компьютерах. Сначала решались более простые задачи, теперь на основе умения решать более простые задачи из соответствующих алгоритмов и программ составляются алгоритмы более высокого уровня, позволяющие решать более сложные задачи.

Понятие технологии

Технология – это слово греческого происхождения, составленное из двух корней: techne - искусство, мастерство, умение, и logos - изучение, наука. В результате получается изучение мастерства, искусства, умения делать что-либо. Это значение понятия технология осталось, в таком понимании некоторые науки имеют своим предметом технологии, например, химические технологии, технологии производства бумаги, технологии производства пищевых продуктов, спирта и т.п. Такие технологии изучают в средних специальных и высших учебных заведениях, во многих из них учат мастерству, искусству, умению что-то делать. Но теперь понятие технологии толкуется и несколько шире.

В широком смысле технология – это совокупность средств и методов получения заранее оговорённого результата, достижения чётко поставленной цели. Результатом применения технологии может быть какой-то продукт (спирт, сок, серная кислота, бензин и т.п.) или состояние (уровень освещённости помещения, уровень шума и загрязнённости в нём, уровень средней зарплаты и т.п.). Технологии могут применяться как к материальным (компоненты химического синтеза), так и к нематериальным объектам (информация). Но в технологии всегда предполагается некий алгоритм, применение которого неизбежно приводит к поставленной цели, к заранее оговорённому и ожидаемому результату.

В связи с этим каждая технология, как и алгоритм, должна применяться некоторым исходным данным, использовать некоторые ресурсы, которые являются допустимыми для этой технологии. Можно говорить, что технология – это совокупность алгоритмов получения точно оговорённых результатов, достижения точно поставленных целей. Технология не может применяться для достижения неточно поставленных целей. Но применение технологии при точной постановке целей всегда, неизбежно приводит к нужному результату. Поэтому технология – это не искусство получения результата, а совокупность методов и средств получения его в массовом порядке, периодически, при возникновении потребности, без необходимости применения высокого искусства персонала, творчества и т.п. Творчество нужно на этапе разработки и внедрения технологии, а при её применении – нужно строго выполнять инструкции. Технология должна себя повторять сама, если эти инструкции выполняются.

В современном понимании технология направлена на производство массового однотипного продукта или формирование состояния тоже в массовом порядке. В современной экономике применение технологий оказалось существенно выгоднее, чем производство продуктов или формирование состояний нетехнологическими средствами. Важнейшие причины в том, что технология позволяет осуществлять высокоавтоматизированное производство продуктов и формирование состояний, проводящиеся при минимальном участии человека, с обеспечением высокого качества. Во многих случаях технология позволяет производить продукты высокого качества, но несколько адаптированные под запросы и предпочтения потребителей, т.е. выпускать однотипные продукты сериями, которые ориентированы на разные категории потребителей. В результате при сравнительно небольших затратах удаётся убедить разные категории потребителей в том, что произведённый продукт реализует именно их потребности, а потому расширить сегменты рынков, на которых такие продукты успешно продаются. Поэтому в современной экономике, как правило, более успешным является тот частный бизнес, который более эффективно использует технологии, кстати, не только производства, но и продажи своих продуктов.

Эти качества технологии часто используются в государственном управлении, политике, экономике, включая частный бизнес, в социальной сфере в целях манипуляций, когда утверждают, что владеют технологиями, а на самом деле сумели только умозрительно описать желаемый результат или сумели его получить однажды, при благоприятном стечении обстоятельств. В таком случае технология пока отсутствует, её нужно разработать для массового применения с получением такого результата и внедрить. Только тогда можно говорить о владении технологией. В частности, так называемые избирательные технологии до сих пор остаются скорее искусством, чем реальными технологиями, потому что никто не может гарантировать получение заранее оговорённого результата при их применении. Более того, стандартные приёмы и методы ведения избирательных кампаний всё чаще приводят к иным результатам, чем ожидаемые. Причина – в постоянных изменениях условий проведения избирательных кампаний и различиях регионов России: что приносит результат в одних, может не дать результата и даже дать прямо противоположный результат в других.

Процесс технологизации

Понятие технологии разделяется на глобальную технологию и конкретные технологии. Глобальная технология абстрагируется от конкретного содержания того или иного процесса, она определяет базовую модель, компоненты которой могут использоваться в конкретных технологиях в различных сочетаниях в зависимости от конкретных условий применения.

Переход от глобальной технологии к конкретным осуществляется через процесс технологизации. Этот процесс можно определить как разработку конкретных алгоритмов, процедур и операций, которые из исходных ресурсов, сырья или данных с неизбежностью должны производить заранее оговорённые результаты, т.е. продукты или состояния.

Конкретные технологии для этих целей разделяются на отдельные процедуры и операции, образующие технологические линии. Последовательность разработки конкретной технологии получается примерно такой. Сначала в глобальной технологии описывается достигнутый уровень знаний о соответствующем технологическом процессе. Затем с учётом целей и доступных средств, методов, а также имеющихся нормативных и морально-этических ограничений глобальная технология трансформируется в систему конкретных технологий, соответствующим конкретным условиям осуществления технологических процессов, т.е. функционирования этих технологий.

Для разработки конкретных технологий приходится разделять их на отдельные процедуры и операции, выполнение которых иногда может представлять довольно существенные проблемы на современном уровне развития техники и технологий. Эти процедуры и операции объединяются в технологические линии по принципу их связи по ресурсам и результатам, а также по готовности к функционированию. Нередко конкретная технология разрабатывается по этапам, на каждом из которых появляется одна или несколько таких технологических линий. В настоящий период такого рода разработки существенно ускоряются при применении современных средств моделирования технологий с помощью компьютерных систем и сетей.

Хронология I этапа

В 40-х и 50-х годах компьютеры создавались на основе электронных ламп. Поэтому компьютеры были большими (они занимали целые залы), дорогими и ненадёжными – ведь электронные лампы, как и обычные лампы, часто перегорают. Но в 1948 году был сконструирован кремниевый транзистор – миниатюрный и недорогой электронный прибор, который и заменил электронные лампы. В 1954 году начато их серийное производство фирмой Texas Instruments. Это привело к уменьшению размеров компьютеров в сотни раз и повышению их надёжности.

В 1956 году IBM сконструировала первый жёсткий диск. Он был 24’’, вмещал 5 Мбайт данных и стоил более миллиона долларов. В этом же году инженер из IBM Джон Бэкас разработал язык программирования FORTRAN.

1958 год – как грибы после дождя, начали появляться коммерческие компьютеры. Такие как IBM Type 650 или IBM System /360 к которому добавлено совместимое ПО. Фирма Bell Labs создала устройство (некое подобие модема) для передачи данных по телефонным линиям. Появился язык программирования ALGOL 58.

После появления транзисторов наиболее трудоёмкой операцией при производстве компьютеров было соединение и спайка транзисторов для создания электронных схем. Но в 1959 году Роберт Нойс (будущий основатель фирмы Intel) изобрёл способ, позволяющий создавать на одной пластине кремния транзисторы и все необходимые соединения между ними. Полученные электронные схемы стали называться интегральными схемами, или чипами. В этом же году IBM анонсировала компьютер IBM 1401, фирма RCA представила компьютер 501 со встроенным языком программирования COBOL, а фирма XEROX выпустила первую копировальную машину.

1960-й год – Пол Бэрэн разработал пакетный способ передачи данных. Фирма DEC выпустила компьютер с клавиатурой и монитором, который стоил 120 тысяч долларов.

1964 год – Джон Кемени и Томас Курц создали язык программирования BASIC.

1967 год – IBM представила первую дискету.

Хронология II этапа

II этап развития информационных технологий длился до начала 80-х годов. Он начался с появлением мини-ЭВМ на больших интегральных схемах. Основным критерием создания информационных технологий стала экономия труда программиста. Цель – разработка инструментальных средств программиста. Появились операционные системы второго поколения, работающие в трех режимах: реального времени, разделения времени и в пакетном режиме.

Системы разделения времени позволили пользователю работать в диалоговом режиме, т. к. ему выделялся квант времени, в течении которого он имел доступ ко всем ресурсам системы. Появились языки высокого уровня (Pascal, C + и др.), пакеты прикладных программ, системы управления базами данных (СУБД), системы автоматизации проектирования (САПР), диалоговые средства общения с ЭВМ, новые технологии проектирования (структурное и модульное). Появились глобальные сети ЭВМ. Совокупность научных методов и технологических приёмов, ориентированных на обработку данных, стали называться информатикой.

В 1970 году был сделан важный шаг на пути к появлению персонального компьютера – Маршиан Эдвард Хофф из фирмы Intel, сконструировал интегральную схему, аналогичную по своим функциям центральному процессору большого компьютера. Так появился первый микропроцессор (Intel -4004).

В 1971 году – Никлас Вирт разработал язык программирования PASCAL.

В 1973 году к американским электронным сетям были подключены Великобритания и Норвегия.

В начале 1975 года появился первый, коммерчески распространяемый компьютер Альтаир –8800 на основе микропроцессора Intel -8080. В конце 1975 года Пол Аллен и Билл Гейтс (будущие основатели Microsoft) создали для этого компьютера интерпретатор языка Basic, что позволило пользователям достаточно просто общаться с компьютером и легко писать для него программы.

В 1978 году для операционной системы CP/M была написана программа для редактирования текста Wordstar. Позже её перенесли на DOS.

1982 год – появились сетевые протоколы TCP и IP, ставшие основой Internet.

Хронология III этапа

III этап развития ИТ продолжался до начала 90-х годов. Он начался с появлением персонального компьютера. ПК – это инструмент, позволяющий формализовать и сделать широкодоступными для автоматизации многие процессы человеческой деятельности. Отсюда критерий – создание информационных технологий для формализации знаний. Цель – внедрение ИТ во все сверы человеческой деятельности. Широкое распространение получили диалоговые операционные системы, автоматизированные рабочие места (АРМ), экспертные системы, базы знаний, локальные вычислительные сети, гибкие автоматизированные производства, распределённая обработка данных. Появление ПК произвело вторую информационную революцию.

В августе 1981 года появился первый компьютер IBM PC с операционной системой MS DOS, архитектура которого наиболее популярна во всем мире и в настоящее время.

В 1983 году Microsoft анонсировала операционную систему Windows, имеющую графический интерфейс пользователя.

1984 год – Sony и Philips представили устройство для чтения CD под названием CD - ROM. В этом же году программисты из Microsoft разработали DOS 3.0.

1985 год – Intel выпустила процессор 80386, состоявший из 250 тысяч транзисторов.

1993 год – Intel анонсировала процессор Pentium, который состоял из 3,1 млн. транзисторов и мог выполнять 112 млн. операций в секунду.

Особенности IV этапа

IV этап развития ИТ – 90-е годы. В этот период разрабатываются информационные технологии для автоформализации знаний, цель – информатизация общества. Информация становится стратегическим ресурсом.

Появились машины с параллельной обработкой данных – транспьютеры. Появились портативные ЭВМ, графические ОС (Windows 95, OS -2) новые технологии: объектно-ориентированные, гипертекст, мультимедиа и др. Телекоммуникация становиться средством общения между людьми. Идёт формирование баз знаний по всем отраслям человеческой деятельности. Происходит информатизация общества. Информатизация общества – это совокупность взаимосвязанных политических, социально-экономических, научных факторов, которые обеспечивают свободный доступ каждому члену общества к любым источникам информации, кроме законодательно секретных.

И так, как вывод, можно сказать следующее. Эволюция информационных технологий неразрывно связана с развитием человеческого общества. ИТ являются продуктом развития производственных и общественных отношений и одновременно – катализатором, ускоряющим процесс развития человеческого общества.

Организация поиска

Предлагается процедуру поиска необходимой информации разделить на девять основных этапов:

1. Определение области знаний.

2. Выбор типа и источников данных.

3. Сбор материалов необходимых для наполнения информационной модели.

4. Отбор наиболее полезной информации.

5. Выбор метода обработки информации (классификация, кластеризация, регрессионный анализ и т.д.).

6. Выбор алгоритма поиска закономерностей.

7. Поиск закономерностей, формальных правил и структурных связей в собранной информации.

8. Творческая интерпретация полученных результатов, т.е. придание им смыслов.

9. Интеграция извлеченных "знаний".

Для проведения поиска первоначально на компьютере пользователя загружается интерфейс работы с соответствующей БД. Это может быть локальная или удалённая БД. Первоначально следует определиться с видом поиска (простой, расширенный и т.д.). Затем с набором предлагаемых для поиска полей. ИПС могут предложить для ввода одно или несколько полей. В последнем случае это обычно поля: автора, заглавия (названия), временного периода, вида документа, ключевых слов, рубрик и др. При формировании запроса практически все системы позволяют использовать логические элементы "И", "ИЛИ", "НЕТ".

Реализация поиска

Что обычно ищут в Интернете: персональные данные об индивидуумах и организациях; различные адресные данные; конкретные материалы (статьи, книги, фотографии, справочные данные, программное обеспечение и др.) в том числе место их хранения; где и сколько стоят те или иные материалы, услуги, продукты и т.п.; информационные сайты и порталы и др.

Общепринята организация поиска по начальным фрагментам слова (поиск с усечением справа), например, вместо слова "библиотечный" можно ввести его фрагмент "библиоте*". При этом будут найдены документы, в которых содержится не только слово "библиотечный", но и "библиотека", "библиотекарь", "бибилотековедение" и др. В каждом случае пользователь должен представлять, что именно он хочет найти, так как в предложенном ему варианте будет найдено гораздо большее количество документов, чем при задании данного слова полностью (без усечения). В подобном случае возможно в полученном массиве информации провести уточняющий поиск и в результате получить более релевантные и пертинентные данные.

Оформление результатов

С точки зрения ИПС результат поиска в ней есть совокупность (подмножество) найденных документов или ссылок на них. Обычно он представляется пользователю в виде списка. То есть простейшей выходной формой в данном случае будет список ссылок в виде полных или частичных БО, найденных ИР. Такой список может быть тут же распечатан или послан на какой-либо адрес электронной почты, если такая возможность предоставляется ИПС и пользователь подключен к Интернету.

Графические и полнотекстовые ЭИР могут предлагаться пользователю только для просмотра, для копирования в различных форматах и масштабах, причём полностью или частично. Графические ИР обычно существуют в общепринятых форматах типа: JPG, GIFF, TIFF, BMP и др., а для текстовых материалов обычно используют текстовые форматы TXT, DOC и др., HTML и PDF - фактически графический формат, в котором могут сохраняться как текстовые, так и графические данные.

Полученные в результате поиска документы сохраняют.

Критерии оценки поиска

Критерием результата поиска является получение пользователем списка документов, одного документа или их частей, максимально удовлетворяющего его потребностям, сформулированным в поисковом запросе. В ИПС принято формировать список полученных в результате поиска документов по их релевантности. Различают критерии смыслового и формального соответствия между поисковым предписанием и выдаваемым документом.

Полнота и точность поиска являются взаимосвязанными показателями. Увеличение одного из них ведёт к снижению другого. В современных ИПС при сбалансированном поиске их значения составляет примерно 70%. Следует учитывать ситуацию, при которой список выданных поисковой системой ссылок содержит несколько, а порой и десятки разных адресов с одним и тем же текстом. Подобные ссылки характеризуются как дубликаты. Из них, при подсчёте коэффициентов учитывается только один документ.

Интернет-поисковые системы

Для получения информации в среде Интернета создаются специальные поисковые системы. Как правило, они общедоступны и обслуживают пользователей в любой точке планеты, где имеется возможность работы с Интернетом. Непосредственно для поиска используются поисковые машины, число которых в мире исчисляется несколькими сотнями. Они ориентируются на определенные типы запросов или их сочетание (библиографический, адресный, фактографический, тематический и др.). Кроме того, бывают полнотекстовые, смешанные и другие поисковые машины.

Для проведения поиска в Интернете (в WWW) функционирует множество сайтов и поисковых систем, поэтому необходимо не только ориентироваться в таких системах, но и уметь осуществлять в них эффективный поиск, то есть использовать соответствующие технологии.

"Технология поиска (англ. "Search Technology") означает совокупность правил и процедур, в результате выполнения которых пользователь получает ИР. При поиске в Интернете рекомендуется обращать внимание на две составляющие: полноту (ничего не потеряно) и точность (не найдено ничего лишнего). Обычно соответствие найденных материалам этим критериям называют релевантностью, то есть соответствием ответа вопросу (запросу).

Поисковые системы характеризуются также временем выполнения поиска, интерфейсом, предоставляемым пользователю и видом отображаемых результатов. При выборе поисковых систем обращают внимание на такие их параметры, как охват и глубина. Под охватом понимается объём базы поисковой машины, измеряемый тремя показателями: общим объёмом проиндексированной информации, количеством уникальных серверов и количеством уникальных документов. Под глубиной понимается - существует ли ограничение на количество страниц или на глубину вложенности директорий на одном сервере.

Каждая поисковая машина имеет свои алгоритмы сортировки результатов поиска. Чем ближе к началу списка, полученного в результате проведения поиска, оказывается нужный документ, тем выше релевантность и лучше работает поисковая машина.



Поделиться:


Последнее изменение этой страницы: 2019-05-20; просмотров: 192; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 44.200.39.110 (0.07 с.)