Оценка информации в управлении 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Оценка информации в управлении



Важной частью организационных и информационных механизмов, обеспечивающих производственную и информационно-аналитическую деятельность объектов управления различного уровня (индивидуум, коллектив, организация, ведомство, государство), является система оценки получаемой и подготавливаемой к реализации информации. Критерии оценки и отбора информации регулируются и формируются, в частности: идеологическими и стратегическими установками субъектов управления или общегосударственными задачами; неформальными пристрастиями лиц, участвующих в процессе принятия решений; под давлением разнообразных групп интересов и иных субъектов, не институализированных в государственно-административной сфере, но стремящихся принять участие в оценке и переоценке управленческой информации.

Оценка информации заключается в установлении степени их ценности для решаемых задач, при этом производится их отбор с учетом ценности (прагматическая фильтрация). Оценка информации осуществляется в двух взаимосвязанных аспектах: содержательная, отражающая возможность и целесообразность использования ее в целях управления; формальная (общая), отражающая качество ее подготовки.

При формальной (общей) оценке документы, содержащие информацию, рассматриваются на предмет ясности изложения, полноты, краткости и систематичности изложения, наличия заверительных подписей. Ясным считается документ, который изложен простым, понятным языком, содержит наиболее распространенную и однозначно трактуемую терминологию. Полнота документа зависит от наличия в нем всех данных, необходимых для решения задачи, к которой он имеет отношений. Если документ исполнен на бланке, определяется полнота его заполнения. Систематичность предполагает, что содержание документа изложено в легко воспринимаемой логической последовательности. Достоверность содержащих в документе сведений удостоверяется подписями работников, исполнивших документ, а также руководителями, несущими личную ответственность за содержание документа и качество работы подчиненных.

Содержательная оценка информации имеет значение в следующих управленческих аспектах: для установления характера возможного использования информации в практической деятельности; для определения состава подразделений организации, заинтересованных в получении этой информации; для принятия решения о направлении сведений потребителю первичной или аналитической (выводной) информации, в частности, топ-менеджменту организации, объединению деловых кругов, в высшие органы государственной власти и т.д.; для координации деятельности подразделений и филиалов организации (министерств и ведомств; региональных и муниципальных образований); для осуществления методического руководства деятельностью подразделений организации и ее филиалов, а также оказания им практической помощи; для совершенствования системы управления.

Оценку информации в тех или иных объемах и формах осуществляют большинство подразделений организации. Значительное место оценка информации занимает в деятельности аналитических, информационных, маркетинговых подразделений, а также служб безопасности и коммерческой разведки.

Оценка информации – единственный из процессов информационной технологии, который в принципе не поддается полной формализации. Дело в том, что оценка информации не только чрезвычайно сложна и не может не испытывать влияния субъективных факторов, но и, более того, тесно переплетена с процессами принятия решений. В этой связи особенностью данного процесса является то, что с помощью средств вычислительной техники можно осуществить лишь количественную оценку формальных параметров информации - срок поступления, наличие определенного перечня реквизитов (заголовков), объем поступившей информации, в определенной степени наличие повторов и т.д. В полной мере качественная оценка информации под силу лишь человеку.

С другой стороны, по своему содержанию этот процесс все же относится к информационным технологиям. В противном случае в результате применения информационных технологий формировалась бы не информация для принятия решения, но лишь ее полуфабрикат – данные, не отфильтрованные с позиций их ценности для субъекта управления. «Об опасности такого положения свидетельствует накопленный опыт применения ЭВМ в управлении: они оказались способными завалить пользователей данными, которые, если они не отфильтрованы, могут нанести больший вред, чем отсутствие данных, поскольку из них крайне трудно извлечь полезную информацию. В то же время, они могут создавать иллюзию информированности».[36] Таким образом, автоматизированные системы управления, в которых не предусмотрена оценка данных, могут быть квалифицированы как системы обработки данных, которые современным требования не удовлетворяют.

Содержательная оценка информации - это вид информационного процесса, который заключается в определении с использованием установленных критериев ценности полученной информации и возможных путей реализации, а также выработке соответствующих рекомендаций по организации и направленности работы в дальнейшем. Работа по оценке информации осуществляется в целях: совершенствования деятельности по информированию топ-менеджмента организации; повышения эффективности использования имеющегося кадрового и иного ресурсного потенциала; повышения эффективности управления деятельностью подразделений организации, связанной с информированием топ-менеджмента организации. Оценка информации производится на основе его аналитической обработки специалистами и экспертами, либо по заключению заказчика (потребителя) информации. Предварительная оценка информации по отдельным критериям осуществляется и самим подразделением организации - источником информации.

Объектом оценки являются полученные из различных источников материалы, содержащие, в большинстве случаев, коммерческую, социально-экономическую, экономическую, научно-техническую информацию значимую для управления деятельностью организации. Для организаций, занятых в некоторых специфичных сферах деятельности, интерес может представлять социологическая, внутриполитическая, внешнеполитическая и иная информация. Предметом оценки является определение соответствия материалов установленным критериям оценки, актуальным потребностям потребителей информации, а в некоторых случаях и действующим заданиям.

Основные задачи, решаемые в процессе оценки информации: обеспечение всесторонности и объективности оценки материалов и деятельности подразделений, филиалов и системы управления определенного уровня в целом; повышение полноты использования имеющейся информации; координация деятельности подразделений и филиалов организации, повышение ее целенаправленности; расширение и улучшение качественных показателей информационной базы для подготовки управленческих решений в сфере производственной, финансовой и иной деятельности организации (системы управления).

Всесторонность и объективность оценки информации достигается за счет следующего. Используется совокупность частных критериев, позволяющих оценивать информацию в различных аспектах, значимых для принятия управленческого решения (секретность, достоверность, соответствие приоритетной тематике, новизна, своевременность и т.д.). Учитывается вид материала – оригинал, копия или изложение документа, обобщенная информация и т.д. Принимаются во внимание также характеристики и особенности источника информации – его категория (собственные разработки, рекламные материалы, официальные контакты, случайный источник и др.), его надежность, а также круги, из которых исходит информация (деловые, научные, журналистские, правительственные, парламентские, дипломатические и т.д.). Большое значение имеет также то обстоятельство, что оценку производит работник, являющийся экспертом в соответствующей области (эксперт, аналитик). На окончательную оценку большое влияние оказывает мнение конечного потребителя и характер использования им полученной информации (использовано при ведении переговоров, при подготовке встречи с партнерами, при подготовке нормативно-правового документа, дано устное распоряжение и т.д.). Всесторонность и объективность оценки деятельности подразделений и филиалов организации (системы управления) обеспечивается вследствие того, что, при выработке такой оценки учитывается качество абсолютно всех материалов, направленных ими в центральное звено корпорации.

Соответствующим образом сгруппированные данные учета оценочных материалов позволяют делать обоснованные выводы об уровне работы подразделений организации. Оценивать качество персонала, его творческий потенциал. Учитывать интенсивность и качество работы в целом и в интересах конкретных направлений деятельности организации – научно-исследовательская деятельность и опытно-конструкторские работы, маркетинг и т.д. Для этого используются показатели: общее количество поступивших материалов, количественные характеристики по важнейшим параметрам, таким как новизна, своевременность, информационные возможности и уровень инициативы, свойственные конкретному подразделению или работнику. Оценки по некоторым частным критериям отражают уровень организации работы и исполнительскую дисциплину в подразделении, филиале («своевременность поступления информации», «конкретность информации»).

Под расширением и улучшением качественных показателей информационной базы для подготовки управленческих решений в сфере деятельности организации (системы управления) понимается следующее. Во-первых, соответствующие подразделения организации могут быть ориентированы на поиск недостающей информации, которая бы устранила имеющиеся пробелы и противоречия в информационной базе по конкретной проблеме экономического или иного характера, либо обеспечила бы необходимое расширение этой информационной базы.

Во-вторых, появляется возможность накапливать структурированную информацию, отражающую деятельность самих подразделений организации. Это необходимо для обоснования управленческих решений, направленных, в частности, на изменение организационно-штатного расписания подразделения, выделение региональных центров, решение вопросов материально-технического обеспечения подразделений и филиалов, материального и морального стимулирования конкретных руководителей и работников по достигнутым ими результатам.

Работа с информационными материалами включает в себя следующие основные этапы: подготовку исходных данных для оценки информации; оценку информации по частным критериям; общую оценку информации; описание реализации и использования информации; доведение оценок до сведения автора информации. Подготовка исходных данных для оценки информационного материала, заключается обычно в составлении его формализованного описания. Качественная оценка информации осуществляется с помощью частных и общего критерия. Основные частные критерии оценки: секретность информации по существу; новизна; конкретность; достоверность; своевременность поступления; аналитический уровень. Существо этих критериев рассмотрено в параграфе 1.1.

При составлении общей оценки качества информации все указанные выше критерии рассматриваются в единстве и применяются системно. Возможные варианты общей оценки информации: особо ценная; ценная; представляющая интерес; представляющая ограниченный интерес; интереса не представляет.

 

4.4. Передача информации.

Транспортировка данных представляет собой их прием и передачу (доставку и поставку) между удаленными участниками информационного процесса. Передача информации осуществляется курьером, путем пересылки по почте, по каналам связи. Необходимость передачи информации обусловлена тем, что ее сбор (регистрация) территориально отделен от обработки. Сбор информации осуществляется во внешней среде или на рабочих местах, тогда как обработка – преимущественно в вычислительном центре.

Применительно к информационным технологиям речь идет, прежде всего, о передаче информации по каналам связи. Передача данных по каналам связи кардинальным образом сокращает трудовые и временные затраты по сравнению с перепиской и традиционными способами информационного обмена (с помощью бумажных носителей). Любую систему передачи информации можно считать состоящей из трех частей: источника сообщений, канала связи и приемного устройства. Сущность передачи информации по каналам связи заключается в воспроизведении на выходе канала связи переданного сообщения или, иначе говоря, в индуцировании в приемном устройстве требуемого физического состояния. Ввод и передача информации по каналам связи возможны в пределах глобальных сетей, корпоративных и локальных компьютерных сетей, систем передачи печатных документов.

Для осуществления передачи информации по каналам электросвязи необходимы специальные технические средства – телефон, телеграф, модем, кодек, мультиплексор передачи данных и т.д. Существуют следующие основные виды каналов электросвязи: телефонные, телеграфные, факсимильные, телевизионные, проводного и радиовещания, передачи данных и т.д.

Канал связи вносит в процесс передачи информации случайный шум, который искажает сообщение и тем самым затрудняет его прочтение. Между отправителем сообщения и каналом связи могут находиться кодирующие устройства, преобразующие сообщение в форму, удобную для передачи по каналу связи. Декодирующее устройство, установленное на другом конце канала, восстанавливает принятое сообщение. Степень автоматизации передачи информации по каналам связи сильно влияет на эффективность технологии в целом, при этом высокая степень автоматизации процесса сопряжена со значительным увеличением ее стоимости.

В контексте передачи информации необходимо различать среду, сигнал и сообщение. Средой может служить обычный провод, витая пара, коаксиаль­ный кабель, оптико-волоконный кабель, атмосфера и космический вакуум. Так, в сотовых телефонах информация передается с помощью электромагнитного излучения в воздушной среде. Японские производители сотовых телефонов используют в качестве среды для новейших моделей кости скелета.

Сигнал – физический носитель информации (звуковые или электрические колебания, импульсы напряжения, намагниченная среда, механическая борозда на поверхности физического носителя, сажа в типографской краске и т.д.). Сообщение – те изменения в некотором параметре физического носителя, которые позволяют считать, что сигнал несет в себе некоторую информацию (изменение фазы электрических колебаний, изменение давления, изменение направления канавки в звукозаписи и т.д.).

Изменение параметра сигнала для сообщения может быть непрерывным или дискретным. Примером аналогового сигнала является посто­янно изменяющаяся электромагнитная волна. Дискретный сигнал может представлять собой, вчастности, последо­вательность импульсов напряжения: обычно уровень постоянного положительного напряже­ния соответствует двоичной «1», а уровень постоянного отрица­тельного напряжения - двоичному «0».

Передаваемые данные также могут быть дискретными или аналоговыми. Аналоговые (непрерывные) данные имеют непрерывно изменяемые на некотором интервале времени значения - звук или изображение, информация датчиков о температуре и давлении и т.д. Дискретные данные представляют собой ряд скачкообразно изменяющихся значений и имеют вид числа или текста. Как непрерывные, так и дискретные данные могут быть представлены и переданы с помощью как аналого­вых, так и дискретных сигналов.

Аналоговая передача непрерывных данных осуществляется, например, с помощью телефона. Дискретные данные передаются с помощью дискретных сигналов в большинстве современных компью­терных сетей.

Дискретные данные могут быть представлены анало­говыми сигналами с помощью устройства «модем» (модуля­тор/демодулятор). На его входе линии связи преобразует серию бинарных (два уровня) импульсов напряжения в аналоговый сигнал путем модуляции его несущей частоты. Форми­руемый таким образом аналоговый сигнал передается по приемлемой для модулируемой частоты среде (обычно используется полоса частот телефонных линий, предназначенных для передачи речи). На другом конце линии связи аналогичный модем с помощью процедуры демо­дуляции извлекает оригинал дискретных данных в виде последователь­ности импульсов напряжения.

Для передачи непрерывных данных с использованием цифровых сигналов применяются преобразователи кодек (кодер/декодер). На одном конце дискретной линии связи это устройство преобразует аналоговый сигнал, соответствующий речевым данным, в поток дво­ичных «1» и «0». На выходе линии аналогичный кодек реконструирует поток бит в аналоговый сигнал.

В основе аналоговой передачи лежит непрерыв­ный сигнал постоянной частоты, так называемый несущий сигнал. При передаче дискретных данных по аналоговым линиям связи мо­дулируется одна из трех характеристик несущего сиг­нала - амплитуда, частота, фаза или комбинация из этих характеристик.

Основными достоинствами цифровой передачи дан­ных являются относительная низкая стоимость использования дискретных сигналов, а также их меньшая подверженность воздействию шумов (т.е. большая устойчивость к искажению передаваемой информации). Недостатком цифровой пере­дачи по сравнению с аналоговой является более быстрое затухание сигнала при его движении в передающей среде.

Для устранения эффекта затухания сигналов в дискретных системах передачи данных используются специальные технические устройства - повторители, которые, получив зату­хающий сигнал, полностью восстанавливают содержащиеся в нем данные и передают их далее. В традиционных аналого­вых системах передачи данных в этих целях применяются устройства - усилители, которые усиливают передаваемый сигнал. Вместе с тем, увеличение энергии принятого сигнала усиливает также и наложен­ные на него компоненты шума, смысловое содержание сигнала по мере прохождения через каскад усилителей, все более искажается.

Важнейшей характеристикой канала связи является пропускная способность (емкость), равная логарифму эффективного числа сообщений, различимых на его выходе. Процесс передачи информации считается надежным, если скорость передачи сообщений меньше пропускной способности канала. В противном случае надежная передача информации оказывается невозможной. Мультиплексиро­вание представляет собой одновременную передачу по высокоскоростному магистральному каналу связи нескольких сигналов и обеспечивает тем самым его экономичное использование.

При цифровой передаче данных получатель должен знать момент начала и временной период пе­редачи каждого получаемого бита, поэтому существуют следующие способы цифровой передачи данных: синхронная и асинхронная.При асинхронной передаче данные передаются по одному символу, причем каждому передаваемому символу пред­шествует передача кода «старт», а за передачей символа следует передача кода «стоп». Более эффек­тивная синхронная передача данных позволяет пере­сылать блоки символов или битов без старт-стопных кодов за счет наличия механизма синхронизации передатчика и приемника. Что­бы приемник мог определить начало и конец блока передаваемых данных, каждый блок снабжается заголовком и концевиком. Данные, обрамленные заголовком и концевиком, образуют пакет. Содержание заголовка и концевика зависит оттого, какая использу­ется схема построения блока - байт-ориентированная или более эффективная бит-ориентированная.

При наличии в сети транзитных узлов применяются следующие методы передачи данных: коммутации каналов, коммутации сообщений и коммутации пакетов. Коммутация каналов используется, когда меж­ду двумя станциями необходимо установление непосредственного физического канального соединения. Это соединение устанавлива­ется в узлах сети до начала передачи данных. Коммутация каналов используется, в частности, в телефонных сетях. Необходимым условием резервирования каналов на всем пути от передатчика к приемнику является способность узлов распределять ресурсы и выбирать маршруты при установке соединений. После установления в сети с коммутацией каналов соединения пере­дача данных идет практически без задержек. К числу недостатков метода относятся: неэффективность использования ресурсов (каналы резервируются даже на то время, когда данные не передаются); высокая вероятность получения отказа при резервировании пути, включающего много транзитных узлов; значительная задержка при установлении соединения; склон­ность сети к перегрузке; лавинообразный рост отказов установления соединений в случае перегрузки сети.

Коммутация сообщений позволяет реализовать поэтапную передачу данных с промежуточным хранением. Сообщение (связанный блок данных) последо­вательно передается по сети от узла к узлу, которые представляют собой компьютеры, организующие промежуточное хранение транзитных сообщений и их маршрутизацию при передаче по сети. Для маршрутизации каждое сообщение снабжается заголовком с сетевыми адресами станции-передатчика и станции-приемника. Путь между узлами не резервируется.

Этот метод передачи данных увеличивает эффективность использо­вания линий связи, позволяет избежать блокировок сети при росте сетевого трафика, обеспечивает возможности установления приоритетного обслуживания сообщений, осуществления контроля за ошибками передачи и использования процедур восстановления искаженных или потерянных данных, позволяет пользователям осуществлять взаимодей­ствие через сеть даже в случае использования ими различных скоростей передачи и кодов представления данных. Недостатком метода являются возникающие задержки передачи, которые связаны, прежде всего, с ожиданием длинных сообщений в очередях узлов и значительно воз­растают при увеличении нагрузки. Данный метод не пригоден для организации интерактивного сетевого взаимодействия в режиме реального времени.

Коммутация пакетов предполагает, что сообщения предварительно разбиваются на небольшие, фиксированного размера порции (пакеты).Каждый пакет при пере­даче по коммуникационной сети является независимой единицей. Для этого он снабжается заголовком, где указываются сетевые адреса отправителя и получателя сообщения, а также порядковый номер пакета в сообщении. Преимущества этого метода, уменьшающие сетевые задержки, заключаются в следующем. Размеры передаваемых порций информации уменьшаются, поэтому коммутационные узлы могут иметь не столь большие, как при ком­мутации сообщений, размеры буферов для временного размещения транзитных пакетов. Как следствие, скорость обработки информации в этих узлах повышена. Кроме того, появляется воз­можность одновременной передачи нескольких пакетов одного со­общения по альтернативным путям. При обнаружении ошибок передачи повторно передаются лишь отдельные пакеты, а не целые сообщения.

Недостатки пакетной коммутации: с одной стороны, при ее использовании увеличивается объем дополни­тельной, служебной информации, передающейся по сети (заголовки отдельных пакетов), а с другой - возникает проблема организации сборки переданного сообщения в узле назначения, которая связана с тем, что отдельные пакеты, про­ходя различными маршрутами по подсети связи, будут приходить в конечный узел назначения в случайном порядке.

В вы­числительных сетях на практике применяются сочетания различных методов коммутации в зависимости от требований приложений, ко­личественных и качественных характеристик узлов, линий связи и трафика.

Процедура передачи и распространения информации включает, помимо собственно передачи, следующие операции: ввод данных в систему, в компьютерную сеть, преобразование из цифровой формы в аналоговую и наоборот, вывод сообщений, контроль ввода и вывода, защиту данных.

Реализация процессов передачи информации предполагает в качестве наиболее критичных критерии: пропускную способность канала связи, скорость передачи информации, а также защищенность информации от несанкционированного доступа к ней. Для процедуры распространения – прежде всего, полнота охвата адресатов (ее массовость).

 

Накопление информации

Процесс накопления информации включает в себя следующие основные операции: формализацию данных, индексирование документов, комплектование информационных фондов. Применяются и некоторые дополнительные операции, в их числе аннотирование, реферирование, контроль непротиворечивости формализованных описаний и др.

Формализация данных означает приведение данных, поступающих из различных источников, к одинаковой форме для того, чтобы сделать их сопоставимыми друг с другом, т.е. повысить их доступность. При формализации (преобразовании) информации осуществляется аналитико-синтетическое изучение содержания исходной информации, зафиксированной в первичном или выводном документе и подготовка в дополнение к ней вторичной информации, отражающей наиболее существенные элементы исходной информации;

Формализация информации является в большинстве случаев необходимым условием для осуществления ее эффективной автоматизированной обработки после оценки и отбора из соответствующих источников. Назначением процесса формализации является выделение и фиксация значений реквизитов, по которым будем производиться идентификация объектов учета при накоплении информации и ее поиск в ходе решения информационных задач. Основное правило при этом – адекватность формализованного представления сведений, т.е. его точное по смыслу соответствие данным в первичном документе. На основе наиболее существенных с позиций субъекта управления элементов содержания информации в отношении объектов учета осуществляется поиск и сопоставление данных, решение статистических задач.

Правила формализации сведения устанавливаются с помощью различного рода анкет, информационных карт, бланков, которые определяют структуру накапливаемой информации, а также инструкций по их заполнению. Инструкции уточняют толкование и назначение реквизитов, фиксируется способ их заполнения (текст или код), указываются номера используемых словарей, формулируются требования по заполнению различных входных документов, при необходимости устанавливается порядок записи слов и словосочетаний, составляющих наименования различных объектов учета, перечень допустимых сокращений и аббревиатур, правила применения знаков пунктуации, присоединительных союзов, правила транскрипции и транслитерации и т.д. Соответствующие инструктивные документы учитывают особенности информации в отношении различных объектов учета, а также ее формализованного представления. Использование подобного рода инструкций позволяет повысить адекватность формализованного представления информации, исключить противоречия в формализованном представлении информации об объекте, сократить ошибки при индексировании. Единство правил формализации информации, содержащейся в различных источниках и различающейся по содержанию и характеру, способам и приемам получения и закрепления, правовому значению, является залогом обеспечения ее сопоставимости и делает принципиально возможной дифференцированную обработку с учетом особенностей источников.

Индексирование документа - это процедура описания основного содержания документа в терминах информационно-поискового языка. Результат индексирования – это поисковый образ документа. По сути это - отображение текста документа в специальную форму (индекс документа), предназначенную для автомати­ческой обработки. Документу назначается обычно от 6 до 20 терминов.

Существуют следующие виды индексирования: ручное, автоматическое и смешанное. При руч­ном индексировании информационный работник на основе анализа содержания документа отображает текст документа в набор ключевых слов или дескрипторов. Это своего рода искусство. Преимуществом ручного индексирования является его высокое качества. Не­достатками - низкая производительность, высокая стоимость и субъективизм (возможна ситуация, когда один и тот же документ, обработанный раз­личными специалистами, может получить различные индексы). Автоматическое индексирование осу­ществляется компьютерной системой, при этом текст документа рассматривается как множество словоформ - символов, разделенных пробелами. Этот процесс базируется на автоматическом морфологическом и синтаксическом анализе текста. Автоматическое индексирование означает существенное сокращение трудовых и временных затрат, связанных с систематизацией информации.

Морфологический анализ текста - анализ структур словоформ, рассматриваемых изолированно друг от друга с целью распознавания в них слов естественного языка. В ходе морфологического анализа текста осуществляется выделение из текста словоформ, распознавание слов или их сочетаний, распознава­ние грамматических признаков словоформ (часть речи, падеж и т. п.), нормали­зация словоформ (их приведение к словарному виду). Для анализа текста используются авто­матические словари двух типов. К первому типу относятся словари, используемые для распознавания сло­воформ и их нормализации - словарь словоформ, словарь основ слов, словарь окончаний, словарь устойчивых словосочетаний. Вместо таких словарей для нормализации слов используются алгоритмы, позволяющие преобразовывать различные грамматические формы слов. Исчезает необходи­мость заносить в словарь все возможные формы слов, уменьшается объем словарей, увеличивается эффективность поиска, так как в тексте могут быть найдены все грамматические формы слова, заданного в запросе. Ко второму типу относятся информационно-поисковые тезаурусы, которые содержат информацию об отношениях между словами – подчинения, условной эквивалентности, ассоциативных.

Синтаксический анализ текста представляет собой исследование структуры предложения текста с целью установления синтаксичес­ких связей между членами предложения, при этом используются результаты морфологического анализа. Дело в том, что значительная доля смысла текста содержится именно в отношениях между словами. Основой для разработки методов синтаксического анализа являются исследования в области математической лингвистики и систем машинного перевода.

Для выбора в тексте информативных ключевых слов применяются методы статистического анализа, которые позволяют рассчитывать соответствующие параметры: число вхождений слова в документ, общее число вхождения слова в документы данной тематики, относительную частоту вхождения слова в документ. Считает­ся, что пик информативности приходится на слова со средней частотой встречаемости, причем очень редкие, а также наиболее часто встречаемые термины в качестве информативных слов использоваться не могут. Вместе с тем, статистическими методами невозможно в полном объеме решить задачу оценки информативности слов текста, поэтому они используются как вспомогательные. В целом автоматическое индексирование уступает по качеству ручному.

Комплектование информационного фонда (банка данных) состоит в составлении и систематическом пополнении различного рода массивов формализованной информации и документальных материалов, используемых в интересах субъекта управления; сосредоточение информации в определенных организационных звеньях организационной структуры, в которых принимаются управленческие решения.

При комплектовании информационных фондов в ряде автоматизированных систем ключевым моментом является идентификация информационных объектов. Постановка задачи идентификации объекта учета в информационной системе совпадает с ее постановкой в теории криминалистической идентификации. Целью идентификации является установление «того же самого объекта», т.е. объекта, тождественного самому себе, а не «такого же объекта», что характерно для идентификации в химии, физике, биологии, когда осуществляется определение групповой (родовой или видовой) принадлежности объекта. Для каждого объекта учета используются специфичные наборы характеристик для идентификации. Такого рода наборы имеются, в частности, для лица, организации, факта, события как объектов учета. Состав характеристик, используемых для идентификации объекта, зависит от предметной области автоматизированной системы. Так, физическое лицо может быть идентифицировано по так называемым номинативными данным, в их числе фамилия, имя, отчество (второе имя), псевдонимы, дата рождения, пол, национальность, гражданство место рождения. Ключевыми с точки зрения идентификации являются следующие признаки: табельный номер работника, фамилия, имя, отчество, второе имя, либо псевдоним. Для специальных приложений существуют методики идентификации физического лица по его характеризующим данным.

Социальная организация может быть идентифицирована по одному или нескольким видам ее наименований – действительному, открытому (полным или различных видов сокращенным), а также условному. Дополнительной сложностью при идентификации организации является то обстоятельство, что, в отличие от номинативных данных лица, ее наименование не структуризовано: составляющие его словосочетания отражают различные аспекты деятельности организации, состав которых обычно не регламентирован, количество и последовательность произвольны. Для идентификации организации может быть использованы также адрес дислокации организации и иные признаки ее описания (государственная и ведомственная принадлежность, государственно-правовой и международно-правовой статус, организационная подчиненность, профиль деятельности, тип организации и др.).

Существенной с точки зрения процедуры идентификации особенностью информации, накапливаемой в некоторых системах социальной информации, и прежде всего названий объектов учета, является ее подверженность искажениям. Это связано, с одной стороны, с определяющим значением для проведения идентификации графического представления (изображения) информации, а с другой – ограниченностью возможностей его фиксации различными средствами получения информации и многократным воспроизведением информации в процессе производственной и иной деятельности перед осуществлением идентификации в информационной системе.

Информация в отношении объектов учета может быть получены с помощью технических средств непосредственной фиксации сведений, отражающих течение технологических процессов, воспроизведена с документа, записана со слов работника, получена с использованием аудио- и видеозаписи и т.д. Сфомированное с помощью указанных источников графическое изображение названия объекта учета может быть искажено в результате перестановки букв, их замены, перестановки слогов и т.д. Такого рода искажение может произойти при восприятии названия объекта учета на слух, особенно если название незнакомо снимающему информацию или передано на иностранном языке (в этом случае могут возникнуть погрешности, связанные с транскрипцией или транслитерацией информации).

Возможности осуществления идентификации объектов повышаются вследствие использования единых методов формализации информации, программных средств, реализующих методы морфологического и синтаксического анализа и учитывающих наиболее вероятные искажения, а также за счет расширения информационной базы для идентификации (увеличения количества объектов данного типа, стоящих на учете в информационной системе).

Аннотирование представляет собой подготовку кр



Поделиться:


Последнее изменение этой страницы: 2017-02-22; просмотров: 896; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.217.4.206 (0.041 с.)