Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь КАТЕГОРИИ: АрхеологияБиология Генетика География Информатика История Логика Маркетинг Математика Менеджмент Механика Педагогика Религия Социология Технологии Физика Философия Финансы Химия Экология ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Теоретико-множественная модель индексирования и поиска
Документальным информационным массивом будем называть совокупность документов. Т.е. массив является множеством документов (сообщений), что является одной из предпосылок применения теоретико-множественного подхода. С теоретико-множественных позиций описываем и документы или элементы массива. Каждый документ есть множество лексических единиц - слов, дескрипторов (односложных или составных), терминов индексирования, классификационных рубрик (УДК, МПК, ББК и т.д.). Целесообразно ввести понятие универсального словаря D, подмножествами которого являются любые документы. Таким образом: , для всех k где какое-либо сообщение. Далее, является элементом некоторого массива L: L Подобно универсальному словарю, содержащему все термины, (прототипом которого может являться тезаурус ИС, рубрикатор УДК или другая структура), необходимо ввести универсальный массив (массив) L 0, содержащий все сообщения: L 0 , для всех k, причем Прообразом Lo могут являться: поисковый массив АИС, отраслевой справочно-информационный фонд, массив библиотеки и т.д. Представления документа как множества приводит к тому, что с точки зрения потребителя информации каждый документ, загруженный в базу данных, является или множеством терминов или же совокупностью множеств терминов, где могут быть выделены, например: - множество терминов заголовка; - множество терминов реферата первоисточника; - множество дескрипторов индексирования документа. 5.3. Линейное описание информационных массивов (слайд 5) Линейное представление теоретико-множественного образа документа является дополнительным к теоретико-множественному:
Универсальный массив в линейном представлении есть матрица размерности ( - мощность множества ): L0 Подобные матрицы известны под названием "матрицы термин-документ".
Автоматизированная информационно-поисковая система (АИПС) представляет собой объект, реализующий два типа формализованных процедур: - преобразование массивов документов - информационный поиск, в том числе текущий или ретроспективный, отбор из поискового массива множества сообщений, подчиняющихся определенным формальным условиям;
- преобразование документов - составление поисковых образов индексов (индексирование) документов, отбор из текста документа или вспомогательных лексических коллекций определенных терминов или других лексических единиц для концентрированного отображения содержания сообщения. Модели упомянутых групп процессов представляют собой основной объект нашего дальнейшего изложения; в различных интерпретациях или сочетаниях они позволяют получить комплексное описание многих аспектов информационной деятельности. 5.4. Структурная схема АИПС. В структурной схеме (Слайд 6) может быть выделен контур документов и контур запросов. Контур документов включает процессы получения множества документов и преобразования каждого документа в поисковый образ (ПОД). Контур запросов включает множества запросов. Каждый запрос преобразуется в поисковый образ (ПОЗ) с созданием массива поисковых образов запросов. Тезаурус есть средство, используемое для индексирования, реализующее отображение D ® D, причем в общем случае тезаурус, применяемый для документов, не совпадает с тезаурусом запросов.
|
|||||||||
Последнее изменение этой страницы: 2021-12-07; просмотров: 89; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.12.36.30 (0.004 с.) |