Информационные структуры и инфраструктура 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Информационные структуры и инфраструктура



Информационными структурами принято считать учреждения и организации, профессионально производящие, обрабатывающие и «переупаковывающие» информацию разного рода, обеспечивающие ее хранение и доступ к ней пользователям. Это информационные агентства, службы, центры и институты информации, библиотеки и другие подобного рода учреждения и организации.

Наиболее упорядоченными информационными структурами являются системы научно-технической информации, существующие фактически в любой стране. Особенности построения каждой такой системы зависят от многих причин: географического положения страны, размеров ее территории, численности населения, используемых в ней языков, ее истории, уровня экономического развития, политического строя и др. Такие системы могут быть централизованными, децентрализованными и смешанного типа.

В настоящее время, когда информация все больше становится экономическим фактором, правительства всех стран принимают доступные им меры для укрепления и развития таких систем в своих странах. Эти меры составляют содержание информа­ци­он­ной политики, которая разрабатывается и осуществляется в каждой стране.

В странах, ставших политически неза­висимыми после второй мировой войны и/или не имевших исторически сложившихся научно-информационных систем, они стали создаваться по цен­тра­ли­зо­ванной схеме. Она была рекомендована ЮНЕСКО и предусматривала создание национальных центров и нахо­дя­щихся под их методическим руководством сетей специальных центров и научно-технических библиотек. Такие национальные центры были созданы в Аргентине, Бразилии, Египте, Израиле, Индии, Индонезии, Иране, Испании, Китае, Пакистане, Португалии, Турции, ЮАР, Южной Корее, Японии, в странах СЭВ и многих других странах.

Для общего руководства работой национальной информационной системы и главных направлений ее развития в большинстве стран созданы межведомственные комиссии или комитеты, которые функционируют при соответствующем органе государственной власти (парламенте, премьер-министре, министерстве или госкомитете). Такие межведомственные комиссии (комитеты) выполняют следующие основные функции:

– организуют разработку прогнозов развития информационных систем и проводят их экспертную оценку;

– определяют цели и разрабатывают основные направления государственной информационной политики;

– разрабатывают среднесрочные (до 5 лет) и долгосрочные (10 и более лет) программы развития национальной информационной системы;

– осуществляют научную экспертизу проектов, направлен­ных на развитие национальной системы;

– организуют разработку законодательных актов и других нормативных документов, относящихся к деятельности национальной системы.

Основными средствами, которые применяются для решения задач, одобренных межведомственными комиссиями или комитетами, являются:

– законодательные акты;

– прямые распоряжения органов государственного управления административно подчиненным организациям и учреждениям;

– прямые государственные заказы на выполнение конкрет­ных заданий;

– государственное субсидирование проектов, способствую­щих дости­жению поставленных комиссией (комитетом) целей.

Научно-методическое руководство национальной информационной системой (сетью) той или иной страны осуществляется либо специально созданным для этой цели национальным институтом (центром) научной и технической инфор­мации, либо национальной библиотекой.

В странах, которые имеют давно сложившиеся механизмы и традиции децентрализованного управления научными исследованиями и их информа­ционного обеспечения, они основаны на принципах координации и кооперации. Эти страны раньше других осознали большое значение научных исследований и разработок для развития экономики и культуры. Поэтому в таких странах были созданы эффективно действующие сети научно-технических библиотек, которые преимущественно и осуществлялинаучно-информационное обслужи­ва­ние исследователей (т. е. выполняли функции информационных центров) вплоть до начала второй мировой войны. К числу таких стран относятся США, Великобритания, Германия, Франция, Италия и скандинавские страны.

Важным средством повышения эффективности национальной системы (се­ти) информационных органов, особенно при наличии в стране частного и государственного секторов экономики, является развитие и укрепление научных обществ, научно-исследовательских ассоциаций в отраслях промышленности и профессиональных ассоциаций. Эти общества и ассоциации обеспечивают неформальное взаимодействие между частным и государственным секторами экономики, в том числе и в области информационного ее сектора. Они решают следующие основные задачи:

– выпускают научно-техническую литературу, особенно периодические издания, по своим отраслям;

– организуют научные совещания ученых и специалистов;

– создают центры и системы информационного обеспечения своих членов;

– организуют и/или проводят исследования в интересах всех своих членов;

– разрабатывают общие методические и нормативные материалы, необходимые для взаимодействия между государствен­ными и частными организациями и учреждениями;

– разрабатывают общие профессиональные требования к специалистам собственной сферы, организуют и контролируют их подготовку и повышение квалификации;

– развивают координацию и кооперацию между однотипны­ми организа­циями и учреждениями;

– информируют общественность о целях, задачах и достижениях своих членов.

В области научно-технической информации такими обществами и профессиональными ассоциациями в США являются: Американская библиотечная ассоциация (1876–, св. 47 тыс. чл.), Ассоциация специальных библиотек (1909–, 4 тыс. чл.), Ассоциация научных библиотек (1932–, ок. 120 чл.), Ассоциация медицинских библиотек (1898–, 5 тыс. чл.), Ассоциация по образованию в области библиотековедения и информатики (1915–, ок. 700 чл.) и еще не менее 30 других библиотечных ассоциаций; Библиографическое общество Америки (1904–, ок. 1,4 тыс. чл.), Американское общество по информатике (1937–, ок. 4,3 тыс. чл), Ассоциация информационной промышленности (1968–, ок. 600 чл.), Американское общество индексаторов (1968–, св. 750 чл.), Ассоциация американских издателей (1970–, св. 250 чл.), Общество научного книгоиздания (1979–, ок. 600 чл.), Американская ассоциация книготорговцев (1900–, 7,3 чл.) и мно­гие другие.

В Великобритании важнейшими обществами и профессиональными ассоциациями в области библиотечного дела и информатики являются: Библиотечная ассоциация (1877­–), Ассоциация по информационному менеджменту (прежде Ассоциация специальных библиотек и информационных бюро, 1926–, ок. 2 тыс. чл.), Институт информационных специалистов (1958–, св. 2 тыс. чл.), Общество индексаторов (1957).

Во Франции такими организациями являются: Ассоциация французских библиотекарей, Французская ассоциация документалистов и работников специальных библиотек, Французский союз органов документации (1932–). В Германии насчитывается несколько десятков обществ и профессиональных ассоциаций в области библиотечного дела и информатики, из которых крупнейшими являются: Объединение немецких библиотекарей (1900–, 1350 чл.), Немецкий библиотечный союз (1949–, 2,3 тыс. чл.), Объединение дипломированных библиотекарей научных библиотек (1948–, ок. 3 тыс. чл.), Объединение немецких документалистов.

В настоящее время стал модным термин инфраструктура, который неправильно употребляют в значениивнутренней структуры. Понятие инфраструктуры на самом деле определяется как совокупность отраслей хозяйства, которые организационно не входят в данную отрасль, но без участия и развития которых невозможно эффектив­ное функционирование последней. Для информационной отрасли инфраструктурными отраслями можно считать издательское дело и полиграфическую промышленность, книжную торговлю, библиотечное дело, почтовую и телеграфную связь, телевидение и некоторые другие отрасли.

В информатике это понятие связано с понятиями национальной и глобальной инфраструктуры и впервые возникло в США. В речах о политике в области науки и технике 17 и 22 февраля 1993 г. президент США Б. Клинтон объявил о намерении своей администрации создать в стране Национальную информационную инфраструктуру и супермагистр­аль (Na­ti­o­nal Information Infrastructure – NII)[23].

Идея создания инфраструктуры и ее станового хребта – информационной супер­магистра­ли (information superhighway) или инфобана (Infobahn) была выдвинута в 1989 г. А. Гором, тогда еще сенатором, а затем вице-президентом США. Им же введен в обращение в 1978 г. и сам термин “информационная супермаги­страль”. Осуществление этой идеи – по замыслу ее авторов – должно было стать национальной задачей США, вдохновляю­щей и сплачивающей исследователей, инженеров, бизнесменов и других граждан этой страны, т. е. примерно такой, какой была в 60-е годы программа “Аполлон” по выполнению полетов американских астронавтов на Луну[24].

За всю 219-летнюю историю США по этой стране прокатились лишь две обновляющие экономические волны, которые радикально изменили образ жиз­ни ее населения. Первую волну породило строительство железных дорог в середине XIX века, а вторую – строительство скоростных автострад, особенно между штатами, в 50-х годах ХХ века.[25] Третью волну должно было породить строительство информационной супермагистрали, что могло бы оказать на жизнь американцев и людей всего мира не меньшее воздействие, чем в ХV веке оказало на жизнь народов Европы изобретение книго­печа­тания Гутенбергом[26].

В документе “План действий по созданию Национальной инфор­мационной инфраструктуры”, который был обнародован Белым Домом 15 сентября 1993 г., эта инфраструктура видится как “бесшовное сплетение ком­муникационных сетей, компью­теров, баз данных и устройств бытовой элек­троники, которое будет доставлять непосредственным потребителям огромные объе­мы информации. Создание национальной информационной инфра­структуры может способствовать развязыванию информационной революции, которая навсегда изменит образ жизни людей, то, как они работают и взаимодействуют друг с другом”.

В другом документе Национальная информационная инфраструктура трактуется как программа, направленная “на повышение эффективности работы правительства”, на ”сохранение Соединенными Штатами мирового лидерства в науке, технике и технологии”, на то, чтобы “все американцы получали нужную им информацию тогда, когда она нужна им, когда они хотят ее получить – и за приемлемую плату”[27].

Как следует из названия этой программы, в ней предусматривалось создание информационной инфраструктуры. Это означало разработку средств, позволяющих быстро передавать и получать информацию, организационно не входящих в существующие информационные структуры (например, как почта, которая лишь обеспечивает быструю доставку корреспонденции адресатам, но не создает и не использует ее сама). Поэтому, чтобы собственно информа­ционные структуры – центры информации, библиотеки и т. п. – могли эф­фективно пользоваться этой инфраструктурой (т. е. сверх­быстро­действующей сетью передачи данных), они должны быть переосна­щены новейшим информационным оборудованием, создавать новые виды инфор­мационной продукции, внедрять новые методы информационного обслу­живания.

Основой для создания информационной супермагистрали должна служить сначала сеть Internet, а затем – сеть NREN, которая создается с 1989 г. тоже по инициативе А. Гора. С созданием инфраструктуры тесно связывают программы оцифровки рукописных и печатных фондов библиотек и появление так называемых “виртуальных библиотек”.

 

 


Информационный поиск

Предыстория и сущность

"Знание бывает двух видов. Мы знаем предмет по существу, или же мы знаем, где можно найти информацию о нем". В этой простой мысли давно известного высказывания английского писателя XVIII в. Сэмюэля Джонсона содержится главный признак, по которому деятельность информационная отделяется от научно-исследовательской. В ходе научного исследования возникает новое знание, а в сфере информации происходит отчуждение этого знания от его творцов и превращение в общее достояние. Однако простота этого разграничения мнимая, потому что в науке грань, отделяющая информационную деятельность от исследовательской, непостоянна. Развитие информационной технологии все время сдвигает эту грань, поскольку информационной деятельности становятся подвластны все более сложные процессы переработки знаний. То, что вчера еще делали сами исследователи, сегодня оказывается целесообразным передать информационным работникам.

Эти соображения, уже высказанные в лекции об информационной деятельности, уместно повторить, начиная разговор об информационном поиске, поскольку он является основным процессом этой деятельности и на протяжении нескольких десятилетий – центральной проблемой информатики. Новая информационная технология меняет подход к этой извечной проблеме и во многом определяет сегодня развитие информационных систем. Но информационный поиск как процесс и проблема известен с давних пор (наиболее ранние из дошедших до нас яинформационно-поисковых систем насчитывают тысячелетий) и продолжает волновать ученых и специалист­ов‑прак­тиков.

Само понятие информационного поиска появилось только в середине нашего века. Оно объединило такие, казалось бы, разные виды деятельности, как составление библиотечных каталогов и библиографических указателей, организация библиотек и справочно-информа­ционного обслуживания, архивное дело, создание словарей, справоч­ников, энциклопедий, вспомогательных указателей к монографиям и сборникам.

В основе этого понятия лежит представление о том, что поиск необходимой информации в любом собрании документов практически невозможен путем прочтения или даже беглого просмотра текстов всех документов данного собрания. Поэтому уже с незапамятных времен для поиска информации применяют ряд логических процедур, которые в совокупности и составляют процесс информационного поиска. Прочтение полного текста документа заменили просмотром заглавий, аннотаций, рефератов. Однако и эта процедура в многотысячных собраниях документов оказалась слишком трудоемкой. Документы пришлось систематизировать по содержанию, которое условно стали обоз­начать индексами, т. е. буквами и/или цифрами. Систематизация по разделам наук (классам) – один из самых первых способов раскрытия содержания научно-технических документов, моделирую­щий работу человеческого сознания и восходящий к глубокой древ­ности.

По мере увеличения количества письменных и печатных документов и объема наших знаний о мире их классификация усложнялась. Эти классификации получили название иерархических. Многотомные схемы классификации конца прошлого – начала нашего века насчитывали десятки тысяч классов, подклассов, отдельных рубрик. Специалистам смежных областей знания и особенно массовому читателю библиотек стало трудно ориентироваться в схемах классификации и определять в их иерархии место той рубрики, по которой необходимо получать информацию.

Да и сами рубрики, строго ориентированные на узкие разделы наук, подвергающихся непрерывному процессу дифференциации, перестали удовлетворять специалистов-практиков, которым нужна была все более комплексная, предметная информация. Это привело к созданию в 70-х годах XIX в. предметной или точнее алфавитно-пред­метной классификации. На долгие годы она стала господствующей при составлении энциклопедий, вспомогательных указателей к тру­дам, систематически излагающим проблему или раздел науки, а в США, где она была создана, при организации каталогов.

Стремительный рост объемов литературы значительно усложнил также задачу идентификации каждого произведения печати. Библиотеки первыми столкнулись с необходимостью создать инструмент, при помощи которого можно было бы быстро и надежно устанавливать наличие определенного произведения в их фондах. Таким инструментом стал в XIX в. авторский, именной указатель (алфавитный каталог, по библиотечной терминологии), который однозначно идентифицировал произведение по именам лиц, принимавших участие в его создании или же связанных с его содержанием. Таким образом, до середины ХХ в. возможности содержательного поиска информации по справочникам или документов, содержащих нужную информацию, в библиотеках ограничивались тремя способами: систематическим, предметным и алфавитным.

Традиционной технологией реализации этих способов были списки, перечни книг и статей, содержавших необходимую информацию. С 70-х годов XIX в. эти сведения стали записываться на дискретных носителях – библиотечных карточках из плотного картона формата 75х125 мм (размер сложенной пополам американской почтовой карточки). Следует отдать должное этой традиционной технологии. Она успешно обеспечивала культурный прогресс на протяжении целого столетия вплоть до нынешнего этапа научно-технической революции, позволила накапливать и использовать многомиллионные собрания документов, обслуживать тематические потребности ученых и специалистов в необходимой им информации. На ней и сегодня еще в значительной степени зиждется деятельность всей мировой библиотечной системы – этого краеугольного камня человеческой культуры, важными составными частями которой является наука и техника.

Однако недостаточность, ограниченность этой технологии стала все более остро ощущаться уже в первой четверти ХХ в. В науке первыми почувствовали это химики из-за быстрого роста числа синтезируемых ими веществ. В настоящее время каждые три года появляется свыше миллиона таких веществ. Обычные методы оповещения – библиографические указатели, библиотечные каталоги, справочники типа «Гмелина» для неорганической химии и «Бельштейна» для органи­че­ской – начали значительно отставать по времени от успехов исследователей и перестали охватывать их результаты в полном объеме. Революции в физике и электронике, характеризующие середину нашего столетия, усугубили трудности информационной коммуникации.

 

Процедуры и понятия

Научное сообщество осознало необходимость организационного оформления информационной деятельности, которая в течение нескольких десятилетий подспудно созревала в недрах науки и техники. Большая наука индустриального типа, пришедшая на смену "малой" науке университетского типа, выдвинула задачу создания систем научно-технической информации. Именно в это время, в конце 40-х – начале 50-х годов были сформулированы понятия информационного поиска, информационно-поисковой системы, информационно-поиско­вого языка, была выдвинута задача механизации, а затем и автомати­зации информационного поиска. Не случайно именно в это время В. Буш писал о необходимости новых форм справочных материалов, которые учитывали бы ассоциативные связи и были пригодны для механизации.

К этому времени стало ясно, что информационный поиск – это совокупность логических процедур, в результате которых в ответ на информационный запрос выдается либо необходимая информация, либо документы, в которых она может содержаться, либо библиографические адреса этих документов. В первом случае поиск получил название фактографического, во – втором документального, в тре­тьем – библиографического. Эти процедуры сводятся к следующему.

Каждый вновь появляющийся документ подвергается анализу, в результате которого определяется его смысловое содержание. Этот анализ осуществляется интеллектом человека, возможность его формализации остается пока неясной. У автора документа и различных его читателей может быть разное представление о содержании документа. Затем это абстрактное представление о содержании (считается, что оно должно совпадать с авторским) выражается на некотором информационно-поисковом языке, т. е. синтезируется в виде библиографического описания и индекса.

Индекс образуется путем мысленного сопоставления основного смыслового содержания с потенциальными запросами потребителей информации. Эти запросы как бы зафиксированы в схемах классификации и обозначены индексами. Сама процедура выражения основного смыслового содержания документов и информационных запросов на информационно-поисковом языке получила название индексирования и составляет существенную часть аналитико-синтетической обработки документов. Информационный поиск, таким образом, заключается в замене содержательного прочтения полного текста документов формальным сличением (сравнением на соответствие) их поисковых образов с запросами на языке индексов.

Понятно, что такая замена значительно упрощает и убыстряет нахождение нужной информации, делает возможной автоматизацию процедуры сравнения. Но за это приходится платить неполнотой и неточностью поиска. Описанные выше логические процедуры допускают субъективизм осуществляющих их лиц, а используемые информационно‑по­исковые языки несовершенны и неспособны адекватно передавать содержание документов и смысл запросов. Следовательно, информационные потери и шум – неизбежные условия информационного поиска. Когда говорят, что поиск осуществлен со 100 %-ной полнотой, имеют в виду, что информационного поиска не производилось, а был осуществлен полный перебор всех текстов (современная технология в некоторых случаях предоставляет такую возможность).

Информационный поиск реализуется при помощи информационно-поисковой системы, которая в абстрактном виде должна состоять из информационно-поискового языка, правил перевода на этот язык и критерия смыслового соответствия, определяющего объем выдачи документов или информации (критерий выдачи). Конкретная система включает также средства реализации (перечень, картотека, механический селектор, компьютер), информационный массив и обслуживающий персонал.

Функционирование простейшей документальной информационно-поисковой системы можно проследить по ее блок-схеме на рис. 9. В системе имеется два входа (для документов и запросов) и один выход (для выдачи документов по запросам). На входах имеются преобразователи для индексирования документов и запросов. Поисковые образы документов вместе с адресами их хранения (номерами) направляются в активное запоминающее устройство (ЗУакт), а сами документы – в пассивное (ЗУпас). Индексы каждого запроса сравниваются с индексами всех документов в решающем устройстве (РУ), которое в случае их соответствия (полного или предусмотренного критерием выдачи) дает в хранилище (ЗУпас) команду на выдачу документа. Это хранилище составляет как бы второй контур системы (сами документы), которого нет у библиографических (одноконтур­ных) систем.


 

Поисковые образы и адреса
Адреса
Документы с адресами
Рис. 9. Блок-схема информационно-поисковой системы
Д о к у м е н т ы
З а п р о с ы
Д о к у м е н т ы
Пассивное запоминающее устройство
Индексирова­ние документов
 
 
Индексирова­ние запросов
Решающее устройство
Активное запоминающее устройство

 

Даже названия элементов на блок-схеме говорят о возможности автоматизации информационно-поисковой системы. Однако блок-схе­ма верно обрисовывает работу любой системы, включая и наиболее традиционные. Это легко видеть на примере библиотеки. Преобразо­ватели на входах соответствуют отделам обработки и справочно-биб­лиогра­фиче­скому, ЗУакт – каталогам, ЗУпас – фондам. Нет в библио­теке только РУ – оно моделируется интеллектом читателя, который (хотя часто он и не осознает этого) вырабатывает собственный крите­рий выдачи и собственную стратегию поиска.

Не случайно именно эта интеллектуальная часть функционирования информационно-поисковой системы представила наибольшие трудности для автоматизации, именно она больше всего сдерживала развитие этих систем. Камнем преткновения явились, прежде всего, традиционные информационно-поисковые языки, ограничивающие возможности содержательного поиска информации. Расхожее мнение о том, что эти языки трудно поддаются автоматизации, неверно. Но они рассчитаны на ручную реализацию, и поэтому использование их в компьютерах удорожает поиск, ограничивает число пользователей и не дает никаких выигрышей, т. е. не снимает ограничений, присущих этим языкам.

А ограничения эти стали особенно ощутимыми на нынешнем этапе научно-технической революции. Прежде всего, традиционная технология поиска рассчитана на стабильный, медленно меняющийся состав запросов. В схемах классификации и перечнях предметных рубрик уже заранее как бы скоординированы все понятия, по которым можно извлекать информацию из документов и затем производить по ним поиск (такие языки поэтому и получили название предкоординатных). Это приводит к тому, что при возникновении новой проблемы или направления исследований, по которым имеется полученная прежде информация, система не обеспечивает ее поиска. Ведь эта тематика раньше не была сформулирована и не нашла места в схемах классификации и списках предметных рубрик, а значит и индексирование по ней не производилось.

Другими словами, традиционная технология поиска не позволяет искать информацию по любому, заранее не предвиденному сочетанию признаков. При этом, как уже говорилось, субъективизм индексатора при извлечении основного содержания документа увеличивает информационный шум и потери, предопределенные характером традиционных поисковых языков. Нельзя не отметить также, что основанные на них системы ручного поиска, даже фактографические, не предназначены для манипулирования полученными из них данными. Они не имеют логического аппарата для содержательной переработки этих данных. Подобная задача всегда решалась самими потребителями без помощи информационных систем.

 

Координатное индексирование

Новая технология пришла в информационный поиск в виде метода координатного индексирования, разработанного в США в 50-е годы математическим логиком М. Таубе и работником службы химической информации К. Муэрсом. Этот метод основан на предположении, что основное смысловое содержание любого документа и информационного запроса можно выразить при помощи набора терминов, по большей части содержащихся в самом индексируемом документе. Эти термины получили название ключевых слов. Если, к примеру, нужно заиндексировать документ, в котором говорится о защите от коррозии лопаток газовых турбин, то совокупность терминов "турбина", "газ", "лопатки", "коррозия", "защита" и будет служить поисковым образом документа. Эти ключевые слова образуют для данного документа как бы координатную сетку, по которой в дальнейшем ведется информационный поиск по соответствующему запросу.

Преимущества данного метода очевидны. Прежде всего, информационные работники и потребители информации освобождаются от жестких рамок классификационных схем и перечней предметных рубрик. Индексирование новых документов ведется без оглядки на отраженные в них потенциальные и часто уже устаревшие запросы специалистов. С другой стороны, индексирование освобождается от субъективизма – ключевые слова выбираются формально. Эту работу, в принципе, можно поручить автомату. Во многих современных информационно-поисковых системах оператор вводит в машину библиографические данные документа, его реферат (аннотацию, резюме), а иногда и наиболее информативные части текста (например, первый и последний абзацы статьи, содержащие наибольшее число терминов, относящихся к ее содержанию). При помощи "запретительного" списка служебных и общезначимых слов, введен­ных в компьютер, осуществляется автоматический отбор ключевых слов, которые программно приводятся к нормальному виду (единст­венное число именительного падежа существительных и прилагательных, инфинитив глаголов). Это существенный шаг к автоматизации ввода информации в информационно-поисковую систему.

При поиске необходимой информации специалист может формулировать свой запрос в виде цепочки терминов, на пересечении которых и окажется большинство документов, содержащих необходимую информацию. При этом потребитель может произвольно менять стратегию поиска в зависимости от оценки его промежуточных результатов. Если документов по запросу мало или нет в системе, можно снять из запроса какие-либо ключевые слова (в приведенном выше примере "газ" и "защита"). Тогда система выдаст документы более широкого содержания о коррозии лопаток турбин, в которых все же может содержаться нужная информация. В случае, если документов по запросу слишком много, можно добавить ключевые слова, ограничивающие поиск, например, определенным классом турбин или же конкретными методами защиты их лопаток от коррозии. В этом уже заключен важный элемент возможности диалога с системой при помощи слов естественного языка.

Основные достоинства этого принципиально нового подхода к раскрытию содержания документов и поиску информации заключаются в том, что он позволяет находить информацию по любому, заранее не предвиденному сочетанию признаков. Кроме того, при появлении совершенно новых направлений исследований можно вести поиск во всем массиве документов, ранее заиндексированных по этому методу. Традиционные методы таких возможностей не предоставляли.

Было бы несправедливо умолчать о том, что достоинства нового метода приходится оплачивать преодолением дополнительных трудностей. Прежде всего, поиск с использованием естественного языка ограничивает его рамками знакомых пользователю языков. Чтобы расширить этот круг, приходится прибегать к словарям. Затем, каждый естественный язык отличается богатством своего словарного состава – слова, одинаковые по написанию, могут иметь разный смысл (многозначность, омонимия), а одно и то же понятие может выражаться разными терминами (синонимия). Запросив информацию о косах, вы получите сведения не только о сельскохозяйственных орудиях, но и о географических объектах, а может быть и о прическах. Желая получить документы о транзисторах, следует помнить, что они могут также называться полупроводниками.

Термины находятся в сложных взаимоотношениях между собой, выражают более узкие или более широкие понятия, могут быть связанными по сходству, по контрасту или по другим ассоциациям. Чтобы иметь возможность учитывать это при поиске, приходится составлять на каждом языке специальные понятийные справочники (тезаурусы). В них для каждого понятия (класса условной эквивалентности) выбирается один термин – дескриптор, а для остальных слов указывается их связь с дескриптором. Тезаурусы иногда называют дескрипторными словарями, а сам поиск с их использованием дескрипторным. Кроме словарей для поиска по ключевым словам и дескрипторам часто создают специальную грамматику, Необходимость в ней вызывается возникновением ложной координации терминов, ошибочным их сочетанием. В ответ на запрос "трубы" х "медь" х "свинец" х "покрытие" можно получить не только необходимую информацию о покрытии медных труб свинцом, но и о покрытии свинцовых труб медью.

Курьеза ради, следует упомянуть, что метод координатного ин­дек­сирования для поиска информации, явившийся принципиальным шагом к новой информационной технологии, на самом деле новшеством не был. В 1915 г. он был реализован на перфокартах американским орнитологом Т. Тейлором при составлении определителя птиц, а у Б. Виккери возникло предположение, что шумерские врачи еще в III тысячелетии до н. э. пользовались диагностическими устройствами, работавшими по этому принципу. На глиняных клинописных плитках записывались симптомы болезней, а под каждым из них – названия болезней, при которых эти симптомы встречаются. Совокупность симптомов составляла координатную сетку, а совпадающие для всех симптомов названия болезней – наиболее вероятные недуги боль­ного.

Из этого понятно, что информационно-поисковые системы, основанные на принципе координатного индексирования, могут быть реализованы простейшими средствами ручного обращения. Система "унитерм-карт" самого М. Таубе представляла собой особым образом организованную картотеку, позволявшую легко сличать номера документов, чтобы выявить совпадающие номера для заданных терминов ("унитермов"). Первые информационно-поисковые системы такого типа часто создавались на просветных перфокартах. Однако подлинный размах создание координатных, по большей части дескрипторных систем получило, когда они стали использовать компьютеры второго поколения. В 60‑е –70-е годы на базе крупнейших в мире реферативных служб были созданы мощные автоматизированные информационные системы, которые предназначались для ускорения выпуска информационных изданий и расширения спектра информационных услуг, а затем стали основными генераторами документальных баз данных на магнитных лентах.

 



Поделиться:


Последнее изменение этой страницы: 2016-04-19; просмотров: 164; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.217.194.39 (0.046 с.)