Методы обработки результатов поиска 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Методы обработки результатов поиска



По характеру преобразований (в контексте дальнейшего использования результатов обработки) методы обработки результатов поиска можно условно разделить на две группы:

1. Структурно-форматные преобразования.

2. Структурно-семантические преобразования (информационно-аналитические, логико-семантические).

Структурно-форматные преобразования осуществляются формальными алгоритмическими методами, поэтому они сравнительно несложно автоматизируются и переносятся для исполнения на компьютеры с помощью современных информационных технологий. К таким преобразованиям, например, можно отнести перекодировку сообщений для передачи данных через каналы связи или получения их из каналов связи в компьютеры, выделение в текстах контента по точному совпадению с ключевыми словоформами, сортировку сообщений по наличию тех или иных вариантов выделенного контента, разделение или объединение текстов по формальным признакам наличия того или иного контента в них и т.п.

Структурно-семантические преобразования осуществляются, как правило, человеком, потому что они основаны на придании тех или иных смыслов анализируемым сообщениям. Такие преобразования крайне сложно автоматизируются, как правило, они осуществляются только при поддержке современных информационных технологий, например, когда человек осуществляет эти преобразования в том или ином текстовом редакторе. К таким преобразованиям можно отнести, например, выделение среди полученных сообщений значимых для дальнейшего анализа, выделение в текстах сообщений метафор или других типов словоупотреблений, расположение фрагментов сообщений в порядке, определяемом их значимостью или полезностью для дальнейшего анализа, и т.п.

Реализация поиска

Что обычно ищут в Интернете: персональные данные об индивидуумах и организациях; различные адресные данные; конкретные материалы (статьи, книги, фотографии, справочные данные, программное обеспечение и др.) в том числе место их хранения; где и сколько стоят те или иные материалы, услуги, продукты и т.п.; информационные сайты и порталы и др.

Общепринята организация поиска по начальным фрагментам слова (поиск с усечением справа), например, вместо слова "библиотечный" можно ввести его фрагмент "библиоте*". При этом будут найдены документы, в которых содержится не только слово "библиотечный", но и "библиотека", "библиотекарь", "бибилотековедение" и др. В каждом случае пользователь должен представлять, что именно он хочет найти, так как в предложенном ему варианте будет найдено гораздо большее количество документов, чем при задании данного слова полностью (без усечения). В подобном случае возможно в полученном массиве информации провести уточняющий поиск и в результате получить более релевантные и пертинентные данные.

Оформление результатов

С точки зрения ИПС результат поиска в ней есть совокупность (подмножество) найденных документов или ссылок на них. Обычно он представляется пользователю в виде списка. То есть простейшей выходной формой в данном случае будет список ссылок в виде полных или частичных БО, найденных ИР. Такой список может быть тут же распечатан или послан на какой-либо адрес электронной почты, если такая возможность предоставляется ИПС и пользователь подключен к Интернету.

Графические и полнотекстовые ЭИР могут предлагаться пользователю только для просмотра, для копирования в различных форматах и масштабах, причём полностью или частично. Графические ИР обычно существуют в общепринятых форматах типа: JPG, GIFF, TIFF, BMP и др., а для текстовых материалов обычно используют текстовые форматы TXT, DOC и др., HTML и PDF - фактически графический формат, в котором могут сохраняться как текстовые, так и графические данные.

Полученные в результате поиска документы сохраняют.

Критерии оценки поиска

Критерием результата поиска является получение пользователем списка документов, одного документа или их частей, максимально удовлетворяющего его потребностям, сформулированным в поисковом запросе. В ИПС принято формировать список полученных в результате поиска документов по их релевантности. Различают критерии смыслового и формального соответствия между поисковым предписанием и выдаваемым документом.

Полнота и точность поиска являются взаимосвязанными показателями. Увеличение одного из них ведёт к снижению другого. В современных ИПС при сбалансированном поиске их значения составляет примерно 70%. Следует учитывать ситуацию, при которой список выданных поисковой системой ссылок содержит несколько, а порой и десятки разных адресов с одним и тем же текстом. Подобные ссылки характеризуются как дубликаты. Из них, при подсчёте коэффициентов учитывается только один документ.



Поделиться:


Последнее изменение этой страницы: 2019-05-20; просмотров: 705; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.138.175.180 (0.005 с.)