Информационно-поисковые задачи 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Информационно-поисковые задачи



В настоящее время во всем мире накоплено огромное количество информации, которая используется в процессе расследования. Информационно-поисковые системы позволяют находить информацию, хранящуюся в разных формата, в базах разных ведомств и разных стран.

Идентификации отпечатков пальцев,

идентификация фотографий подозреваемых,

идентификация «почерка» преступления,

расследование экономических преступлений.

 

4.3  Обобщенная технология решения правовой задачи

Правотворческая деятельность представляет собой деятельность государства по подготовке, принятию и изменению правовых норм и нормативных правовых актов. Она опирается на принципы законности, гласности, демократизма, профессионализма и планирования. Правотворчество — первоначальное звено системы правового регулирования.

Этапы использования информации [2].

На стадии подготовки первоначального варианта законопроекта используются:

× сведения, обосновывающие необходимость принятия конкретного закона (статистические, социологические и прочие исследования);

× справки или информационные обзоры обо всех действующих актах по данной проблеме;

× заключение юридической службы о соответствии законопроекта Конституции РФ и действующему законодательству;

× расчетная информация (предполагаемые расходы, связанные с реализацией закона);

× прогнозная информация.

На стадии предварительного рассмотрения законопроекта приоритетными являются:

× варианты решений того или иного вопроса, включая альтернативные проекты;

× рекомендации, сформулированные с учетом наиболее удачных правовых решений по этому вопросу, имеющихся в нашей стране и за рубежом;

× экспертные оценки (в том числе правовая, финансово-экономическая, экологическая экспертиза).

Сегодня информационный фонд, представленный в компьютерной сети Государственной Думы, распределен по следующим рубрикам и базам данных:

информация о деятельности Федерального Собрания РФ,

информация о составе депутатов Федерального Собрания РФ,

информация по законодательству,

экономическая и статистическая информация,

справочная информация,

сводки российских информационных агентств.

В развитие информационно-правового обеспечения законодательной деятельности проведена разработка серии прикладных программ, которые объединены под общим заголовком «Интеллектуальные инструменты юридической деятельности»:

шестиязычный юридический словарь, тезаурус EUROVOC (русская версия),

алфавитно-предметные указатели к Конституции РФ и Гражданскому кодексу РФ,

сборник образцов документов Государственной Думы,

база данных «Законопроекты» и т.д.

Разработан ряд информационных решений по обеспечению деятельности Совета Федерации. Среди них «Парламентские процедуры и регламент», «Статистика» и др.

Министерство юстиции РФ играет ведущую роль не только в обеспечении информатизации регионов, но и в контроле развития законодательства субъектов Федерации. Функцией Министерства юстиции РФ является проведение юридической экспертизы нормативных правовых актов субъектов Российской Федерации на предмет их соответствия Конституции РФ и федеральным законам. Для обеспечения этой функции создана интегрированная база данных «Правотворчество».

Режимы обработки информации

Правовая информация создается на разных уровнях (федеральном, республиканском, местном) разных ведомств. Решением правовой задачи нередко занимается целый коллектив юристов и экспертов других квалификаций. Информация, которую они используют, может принадлежать другому ведомству. Для обмена информацией и объединения ресурсов применяются распределенные информационные системы.

Распределенные АИС ­– такие АИС, в которых есть возможность использования одного или нескольких компонентов одной или нескольких АИС и соответствующих им информационных технологий другими людьми (пользователями системы).

Распределенные системы получают в настоящее время все более широкое распространение по следующим причинам:

- бурное развитие технологии производства вычислительной техники позволяет объединить большое число достаточно мощных и относительно недорогих вычислительных машин в единую сеть, способную выполнять асинхронные параллельные вычисления и эффективно обмениваться информацией;

- многие предметные области, распределены по своей природе. Некоторые из них распределены функционально, другие распределены как пространственно, так и функционально.

- пространственно и функционально распределенные системы облегчают обмен информацией и принятие согласованных решений группами специалистов, совместно работающих над решением одной задачи, и/или группами экспертных систем, управляющих сложным техническим объектом.

- принцип модульного построения и использования систем также хорошо реализуется в распределенных системах. Возможность создавать системы для решения сложных проблем из относительно простых и автономных программно-аппаратных модулей облегчает их создание, отладку и эксплуатацию.

Для использования распределенных АИС применяются сетевые технологии. Это могут быть локальные сети, корпоративные – для ведомственного использования или глобальные – для предоставления информации внешним пользователям. На рис. 5 показана обобщенная схема технической архитектуры распределенной АИС. В нее включены разные категории пользователей:

внешние пользователи, имеющие возможность получать информацию общего доступа через интернет; 

пользователи из других ведомств, использующие корпоративные сети для обмена данными;

собственные пользователи для распределенного использования данных и приложений.

 

 

Рисунок 5. Архитектура распределенных АИС.

В настоящее время архитектура распределенных АИС полностью не реализована. Например, ГИБДД имеют 2 независимые системы данных об угнанных автомобилях: местные и находящиеся в федеральном розыске (федеральный уровень). При этом местные базы не доступны федеральному уровню.

Режимы обработки информации

Решения ряда задач не требуют вмешательства человека, т.к. они всегда выполняются по определенному алгоритму. Если такие задачи занимают длительное время, рационально проводить их в фоновом режиме и сразу с целым набором данных.

Пакетный режим обработки информации - обработка данных по заранее выбранному алгоритму, без вмешательства человека

 Если существуют альтернативные пути решения задачи, выбор варианта остается за пользователем. Ввод указаний пользователя происходит в диалоговом окне или в командной строке.

Диалоговый режим обработки информации – выбор алгоритма обработки данных на основании указаний пользователя, получаемых в диалоговом режиме.

Существует активный и пассивный диалоговый режим.

В пассивном режиме диалог инициируется программой в заранее заданных ситуациях: при выборе пути решения, ввода данных или при обнаружении ошибки.

В активном режиме пользователь может вмешиваться в ход работы программы самостоятельно. Для организации активного диалога обычно используются командные языки.

Автоматические информационные системы работают только в пакетном режиме. Автоматизированные ИС предполагают участие человека, и работают в диалоговом режиме, однако часть данных может обрабатываться и в пакетном режиме.

 

 

Выводы

 

  1. ИТ используются в той или иной мере во всех сферах правотворческой, правоохранительной и правоприменительной деятельности. В этой теме будут рассмотрены разные подходы к постановке и решению правовых задач.
    1. Общество и право являются сложными, изменяющимися во времени системами. Поэтому для их описания применимы методы системного анализа и математического моделирования.
    2. Математическая модель – способ описания элементов системы с помощью набора чисел, а действие элементов друг на друга как математические функции. Математическое моделирование позволяет предсказывать реакцию системы на изменение некоторых элементов или их взаимодействий. Имитационные модели позволяют прослеживать изменение системы во времени (ее развитие).
    3. Формально-логическое описание правовой системы естественно вытекает из основы теории права. Сложная структура правовой системы затрудняет полное ее описание. В идеале такое описание позволило бы проверять полноту и непротиворечивость всей законодательной системы. В настоящее время такие задачи решены только частично.
    4. Лингвистические методы служат для компьютерной обработки речи и текстов. Эти методы применяются для фонетической и семантической обработки текстов, а также для автоматизации поиска текстовых документов.
    5. Статистические методы описывают многообразие элементов системы. Такое описание более точно соответствует социальным системам: человек как индивидуум отличается от других, но будучи частью одной системы, люди не могут сильно отличаться друг от друга. Статистический подход позволяет выявить общие закономерности в многообразии поведения отдельных людей или их групп, моделировать и прогнозировать развитие социальных систем. Для нахождения закономерностей приходится использовать большие массивы данных, обработка которых нуждается в ИТ.
    6. Информационно-поисковые задачи возникли в ответ на информатизацию правовой сферы, возможности хранить правовую информацию в электронном виде.
    7. Развитие естественных наук дало возможность криминалистам проводить химическую, биологическую, токсикологическую экспертизу следов, содержащих малые количества вещества. Эти приборы поставляются в комплекте со специальным программным обеспечением.
    8. Математическая теория игр позволяет выбирать стратегию достижения цели в условиях существования конкуренции с другим игроком. Учитываются направленные на выигрыш действия другого игрока и возможность случайных событий.
    9. Методы практической психологии позволяют построить психологический портрет преступника на основе разнообразных данных его биографии, описания внешнего вида, манеры поведения. Систематизация таких сведений требует сложных компьютерных технологий.
    10. Одним из специфически программных методов является метод распознавания образов. Эта методика позволяет автоматически выделять классы в наборе объектов, а потом «сортировать» другие объекты по этим классам. Метод находит очень широкое применение в статистике, социологии, психологии, лингвистике, а также в задачах идентификации.
  2. Основной задачей права является законотворчество. Этот процесс строго регламентирован и содержит этапы подготовки законопроекта, его анализа и принятия. Подготовка основана на изучении статистической информации и социологических исследованиях. Второй этап – правовой анализ законопроекта и выявление изменений, которые придется ввести с случае его принятия. Третий этап – процедура принятия решения. Для обеспечения регламента работы Федерального Собрания используют информационные системы ««Парламентские процедуры и регламент» и др. Столь же строго регламентированы процедуры решения задач правоприменительной и правоохранительной деятельности. Они также разделяются на сбор информации о факте противоправного деяния, анализ имеющихся фактов и принятие решения. Для каждого из этапов характерны свои информационные технологии.
  3. Информация, необходимая для решения правовых задач, возникает в разных ведомствах, разделенных как территориально, так и системно. В этой ситуации целесообразно использовать распределенные АИС, в которыхесть возможность использовать разные компоненты разных АИС разными пользователями.

 

5. Базы данных в юридической деятельности

5.1. Роль и место баз данных в юридической деятельности

В Теме 3 вы познакомились с технологией процесса решения правовой задачи. Важной частью этой задачи является поиск нормативной и ненормативной документированной информации, связанной с решаемой проблемой. Поиск нужных документов осложнен рядом факторов:

× постоянным ростом количества документов, которые непрерывно образуются в результате правотворческой и правоприменительной деятельности;

× местные и ведомственные нормативные документы не печатаются в центральной прессе, поэтому трудно отследить их обновление или изменение;

× вхождение России в международное информационное пространство требует знания законодательства зарубежных стран и международных соглашений;

× позитивной избыточностью правовой информации, которая используется законодателем для повышения эффективности восприятия нормативных актов. В этом случае одно и то же положение повторяется в нескольких НПА. Например, право на информацию встречается и в Конституции РФ и в законе «Об информации», что значительно увеличивает количество документов, касающихся определенной проблемы;

× негативной избыточность правовой информации, связанной с недоработкой правовых документов. Негативная избыточность возникает в тех случаях, когда в разных нормативных документах одинаковые термины описываются по-разному. Например, в одном документе используется открытый список примеров (присутствуют слова «и др.»), а в другом список закрытый, т.е. не позволяет добавлять по аналогии. Для выявления или использования подобных «дыр» в законодательной базе необходимо рассмотреть все НПА, в которых упоминается данный термин;

× огромным объемом ненормативной правовой информации, связанной с расследованием преступлений и антитеррористической деятельностью. Эта информация содержит не только текст, но и изображения, звук, видео- и аудио-записи и др.

× часть правовых документов имеют режим ограниченного доступа, поэтому они не могут быть опубликованы в открытой печати; и потребитель должен подтверждать свое право на их использование.

Поэтому столь необходимо упорядочивание хранения и автоматизации поиска нормативных документов.

В 1993 году был подписан Указ Президента РФ, утвердивший Концепцию правовой информатизация России. Несмотря на постоянно разрабатываемые новые проекты и концепции, процесс этот еще далек от завершения.

В рамках этого проекта была разработана Общегосударственная автоматизированная система правовой информации (ОГАСПИ).

В соответствии с Концепцией ОГАСПИ разделялась на 3 уровня. Верхний уровень представлялся автоматизированной системой правовой информации Научного центра правовой информации (АСПИ НЦПИ). Два других уровня – республиканскими и отраслевыми системами и системами местных органов власти, учреждений и организаций.

В функции АСПИ входят

× сбор, формально-логический контроль, накопление, хранение и поддержка в контрольном состоянии правовой информации;

× ретроспективный поиск информации по реквизитам, темам, элементам текста;

× работа с текстами на экране ЭВМ;

× распространение информации санкционированным пользователям.

Информационной основой создания АСПИ, как и любых автоматизированных информационно-справочных систем, является концепция централизованной или распределенной базы данных.

Как любые АИС автоматизированные информационно-справочные системы, включают в себя, помимо баз данных, технические и программные средства (рис. 6) и группу администрирования.

БД – данные и структура связей. Информация в БД должна быть непротиворечивой, не избыточной, целостной.

СУБД (система управления базами данных) состоит из комплекса программ и языков, которые обеспечивают доступ к информации, накопленной в БД. В состав любой СУБД входят языки дух типов

язык описания данных, с помощью которого описываются данные и структура связей;

язык запросов, с помощью которого происходит доступ пользователя к данным.

В функции администратора входит координация работ по разработке, внедрению и сопровождению БД, защите данных, координация вопросов технического и программного обеспечения.

Рисунок 6. Основные компоненты АИС управления базами данных.

Процесс проектирования БД весьма сложен. Он начинается с анализа предметной области и возможных запросов пользователей. Предметная область – это информация об объектах, процессах и явлениях окружающего мира, которая с точки зрения потенциального пользователя должна храниться и обрабатываться в информационной системе.

В результате анализа предметной области определяется перечень данных и связей между ними, которые будут адекватно – с точки зрения будущих потребителей – отражать предметную область. На следующих этапах выбирается программное обеспечение (СУБД) и строится концептуальная модель, которая связана с принципами хранения данных в ЭВМ и зависит от выбранной СУБД.

От выбора СУБД зависит скорость обработки запросов, максимальный размер БД, характеристики вычислительной системы.

Следующая задача – наполнение БД. Это трудоемкий процесс перевода имеющихся данных предметной области на язык представления данных.

В процессе функционирования системы ее необходимо

Сопровождение БД – ответственный процесс. Информация в предметной области быстро меняется: появляются новые данные, некоторые данные устаревают или корректируются. Поэтому БД требует постоянного обновления. При этом необходимо выполнять определенные условия:

× обновление не должно нарушать ограничения целостности данных, т.е. не выходить за рамки формально-логических условий на данные (тип, число разрядов, величина);

× обновление данных должно проводиться регулярно и оперативно;

× новые данные не должны противоречить уже имеющимся;

× процесс обновления БД не должен занимать много времени и приостанавливать работу других систем;

× пользователь должен быть в курсе, когда произошло последнее изменение, т.е. в какой мере он может доверять информации, предоставленной системой.

 

Кроме БД нормативных документов, в структурах МВД создаются многочисленные базы данных ненормативной правовой информации, содержащие сведения о лицах, находившихся под следствием (их фотографии, отпечатки пальцев, ДНК), утерянных паспортах, угнанных автомобилях, похищенном оружии и пр. Использование этих данных позволяет существенно повысить качество и эффективность информационно-аналитической работы следователей и оперативных работников.

 В настоящее время большинство организаций имеют собственные базы данных. Многие из них содержат важнейшую информацию для следственно-розыскной деятельности. БД банков сохраняют «кредитные истории» своих вкладчиков. В БД гостиниц, вокзалов и аэропортов хранятся сведения о их клиентах. Эти сведения могут дать ценнейшую информацию при расследовании преступлений.

Однако юридическая деятельность не исчерпывается поиском документов. Документ является только базой, на основе которой строится рассуждение и принятие решения. Информационно-справочные системы освобождает специалиста от рутинной работы, повышая тем самым требования к его опыту и квалификации.

5.2. Справочные правовые системы

Справочные правовые системы служат для хранения в электронном виде, поиска и анализа нормативной правовой информации. Потребность в такой информации возникает не только у юристов, но и у бухгалтеров, налоговиков, предпринимателей в ходе их профессиональной деятельности, а также у отдельных граждан.

При разработке поисково-справочных систем по законодательству самой важной становится проблема индексации текстов. Способ индексации определяет качество и скорость поиска, способ построения запросов.

Вторая задача, стоящая перед создателем – удобство просмотров списков, передвижения по тексту найденных документов. НПА существуют во взаимосвязи друг с другом, образуя систему. Важно, чтобы в СПС обрабатывались связи документов. Не менее важной для профессионального пользователя является возможность сохранять, обновлять, комментировать найденные документы.

 

Индексация текстов НПА

Индексация текста – обработка текста документа для осуществления полнотекстового поиска.

Информационно-поисковый язык – это формализованный искусственный язык, предназначенный для индексирования документов, информационных запросов и описания фактов с целью их последующего хранения и поиска.

Индексация означает создание общего глоссария по всему массиву для увеличения скорости поиска. Естественно, что не все слова документа несут информационную нагрузку. Поэтому разрабатывается информационно-поисковый язык (ИПЯ), который содержит только слова, значимые для данной предметной области. Для всей текстовой базы составляется список встречающихся в ней слов ИПЯ, и каждому из них ставится в соответствие некоторый индекс (координаты в текстовой базе); чаще всего это номер документа и номер слова в документе. При поступлении запроса слово сначала ищется в этом списке, и по найденным координатам выдаются нужные документы.

Информационный поисковый язык по законодательству должен обеспечивать:

× эффективную формализацию правовых норм и нормативных правовых актов;

× высокую скорость поиска на компьютере информации, необходимой для решения конкретных задач правотворчества;

× оптимальный (адекватный) перевод нормативного текста с юридического языка на язык, доступный ЭВМ;

× минимальный «шум» (т. е. сведение к минимуму выдачи компьютером излишней информации);

× полноту информационного поиска, т. е. получение всей необходимой информации для решения конкретных задач правотворчества.

Для количественной характеристики возможностей поисковой системы используют понятие релевантности поиска.

Релевантность – соответствие результатов поиска запрашиваемой информации (relevant – по-английски относящийся к делу).

Например, если при запросе на поиск документов о правах граждан на информацию, будет представлен список, содержащий только Конституцию РФ, то эта информация релевантная – в Конституции действительно говорится о праве на информацию. С другой стороны, ряд не попавших в список документов (не выбранных системой) также содержат сведения о правах граждан на информацию. Поэтому выбор документов, не включенных в список, оказался нерелевантным.

Обозначим

Рв – количество релевантных выбранных документов, т.е. количество отобранных системой документов, в которых содержится запрашиваемая информация.

Рн – количество релевантных невыбранных документов, т.е. количество не отобранных системой документов, в которых не содержится запрашиваемая информация.

Соответственно,

Нв – количество нерелевантных выбранных документов, т.е. количество отобранных системой документов, в которых не содержится запрашиваемая информация.

Нн – количество нерелевантных невыбранных документов, т.е. не отобранных системой документов, в которых содержится запрашиваемая информация.

Тогда

Шум = Нв/(Рв+Нв) ·100%;

Точность = Рв/(Рв+Нв) ·100%;

Величины этих коэффициентов зависят от целого ряда факторов: как внутренних свойств собственно поисковой системы (объема и характеристик информационного массива, информационно-поискового языка, критерия выдачи), так и от многих «внешних» условий. Большую роль играет способность пользователя правильно сформулировать свои информационные потребности на языке запросов, правильности построения конкретного запроса, а также от субъективного представления пользователя о том, что такое нужная ему информация. Из-за ошибок и неточностей, возникающих на каждом из этапов работы как пользователя, так и системы, результаты могут сильно отличаться от того, что хотел получить пользователь, обращаясь к поисковой справочной системе.

Информационно-поисковый язык

Теория информационного поиска различает следующие типы ИПЯ

Языки предметного типа — это алфавитно-предметные указатели к сборникам и отдельным нормативным актам и широко распространенные алфавитно-предметные рубрикаторы. При использовании языка этого типа основная тема (предмет) документа выражается одним или несколькими типовыми словами — рубриками. Все документы в Системе «КонсультантПлюс» классифицируются по тематическому рубрикатору, который является собственной разработкой специалистов «Консультант Плюс» на основе Общеправового классификатора отраслей законодательства

  Язык классификационного типа представляет собой не что иное, как Классификатор отраслей законодательства, принятый Указом Президента РФ в 1993 г.

Языки дескрипторного типа – наиболее полно отражают смысл текста. Эти языки строятся на основе правового тезауруса.

Правовой тезаурус — это собрание ключевых слов и дескрипторов, применяемых в качестве лингвистического обеспечения и использования автоматизированных информационно-поисковых системах правовой информации.

Тезаурус учитывает семантические связи между словами: антонимы (противоположный смысл), синонимы (тот же смысл), гипонимы (более узкое понятие), гиперонимы (более широкое понятие). Например, правовая информация является гиперонимом нормативно-правовой информации, а закон – гипонимом нормативного документа.

Ключевые слова наиболее полным образом описывают содержание правовых норм (актов), их самые существенные черты.

Дескриптор — это выделенное ключевое слово, которое представляет целую группу ключевых слов, являющихся синонимами или уточнениями.

Поисковый образ правовой нормы (нормативного правового акта) — это формализованное представление структурных элементов НПА (нормы, статьи, акты в целом) в терминах информационно-поискового языка (ключевых слов и дескрипторов). Поисковый образ правового акта (его части) служит для хранения данного документа в памяти компьютера.

Как уже отмечалось, качество поиска сильно зависит от того, насколько правильно пользователь формирует запрос.

В идеале  язык запроса должен совпадать с естественным языком. Естественный язык запроса – формулирование запроса к поисковой системе так же, как он был бы сформулирован при обращении к живому эксперту;

система должна помогать пользователю правильно формулировать свои информационные потребности.

Для этих целей создаются экспертные информационные системы.

Экспертные системы — это компьютерные программы, формализующие процесс принятия решений человеком. Назначение таких систем — формирование и вывод рекомендаций в зависимости от текущей ситуации. Совокупность сведений или данных, которые описывают ситуацию, вводятся пользователем в диалоговом режиме.

Экспертные информационные системы требуют гораздо больших затрат для разработки и сопровождения, поэтому они не имеют широкого применения.

Разработчики справочных поисковых систем также пытаются упростить язык запросов. Одним из путей упрощения языка запроса – использование морфологического поиска. В этом случае на основе словаря или морфологического анализа определяется основа слова и возможные окончания. Поиск осуществляется по сочетанию основы и всех возможных окончаний.

Следующим шагом является создание «Помощников», которые в диалоговом режиме уточняют запрос, если в качестве ключевых слов задаются слишком общие понятия или, наоборот, слишком конкретные. Для уточнения используются другие ключевые слова, относящиеся к тому же дескриптору, но являющиеся гипонимами или гиперонимами слова из запроса.

 



Поделиться:


Последнее изменение этой страницы: 2020-10-24; просмотров: 142; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.218.38.125 (0.092 с.)