Статистический и семантические подходы к оценке информации 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Статистический и семантические подходы к оценке информации



Для определения количества информации в теории информации предложен энтропийный подход. В соответствии с ним количество информации оценивается мерой уменьшения у получателя неопределенности (энтропии) выбора или ожидания событий после получения информации. Количество получаемой информации тем больше, чем ниже вероятность события. Такой подход хорошо разработан для определения количества информации в сообщении, передаваемом по каналам связи. Выбор при приеме осуществляется между символами алфавита сообщения. Количество информации в передаваемом по каналам связи сообщении из N символов (без учета связи между символами в сообщении) рассчитывается по известной формуле Шеннона:

, (2)

где Рi – вероятность появления в сообщении символа i, n – количество символов в алфавите языка.

Как следует из формулы, количество информации, измеряемое в двоичных элементах (в битах, байтах), зависит только от количества и статистики символов, но не зависит от содержания сообщения. Количество информации, определяемое по этой формуле, одинаковое при передаче бессмысленного текста или сообщения о жизненно важных для получателя сведениях. С точки зрения передачи таких сообщений по каналам связи такой подход обоснован, так как затраты на передачу этих сообщений одинаковы. А на что потрачены деньги отправителя сообщения и насколько оно информативно для получателя, – эти вопросы к связи отношения не имеют.

Аналогично, когда при телефонном разговоре Ваш собеседник сообщает известные сведения, то количество полученной Вами информации мало, хотя разговор может длиться достаточно долго. В таком случае возникает вопрос, что передавалось в этом случае. Очевидно, что осуществлялась передача лишь акустических и электрических сигналов.

Если информацию трактовать как знания, то количество информации, извлекаемой человеком из сообщения, можно оценить степенью изменения его знаний. При этом структурированные знания, представленные в виде понятий и отношений между ними, называютсятезаурусом. Тезаурус имеет иерархическую структуру. Понятия и отношения, группируясь, образуют другие, более сложные понятия и отношения.

Знания отдельного человека, организации, государства образуют соответствующие тезаурусы. Тезаурусы различных организационных структур включают части тезаурусов входящих в их состав элементов, прежде всего, людей. Например, тезаурус организации образуются из тезаурусов сотрудников по тематике их работы и других носителей информации (документов, продукции, материалов и т. д.).

Для передачи знаний тезаурусы должны пересекаться, т. е. они должны содержать общие элементы (понятия и отношения между ними), Если таковых нет, то владельцы разных тезаурусов просто не поймут друг друга. О таких людях говорят, что они разговаривают на «разных языках». Даже люди одной национальности часто говорят на «разных языках», вкладывая в одинаковые по форме понятия разное содержание. Подход к оценке количества информации по степени изменения тезауруса после ее получения, предложенный Ю.А. Шрейдером, можно назвать тезаурусным.

В общем случае количество информации, получаемое из сообщения ее получателем, зависит от соотношения тезауруса сообщения и получателя. Если тезаурус сообщения составляет часть тезауруса получателя или их тезаурусы настолько отличаются по составу, что не пересекаются, то количество получаемой информации минимальное. В первом варианте получатель не приобретает новые знания и тезаурус получателя не пополняется, во втором — получатель не понимает смысл сообщения и не может установить отношения с другими элементами тезауруса. Подобное происходит, когда совершаются «преждевременные» научные открытия, которые даже для научной общественности являются «вещью в себе». В истории науки и искусства много фактов отторжения общественностью идей и произведений, опережающих «свое время». Например, доклад русского математика Н. И. Лобачевского на заседании физико-математического факультета Казанского университета в l826 г. с изложением основ созданной им неевклидовой геометрии, которые рассматриваются в настоящее время как крупнейшее достижение математической мысли в истории мировой науки, почти никем не был понят и подвергся резкой критике.

Обобщая сказанное, циркуляцию информации в человеческом обществе можно представить исходя из следующей модели.

Тезаурусы человека и любой организационной структуры представляют их капитал. Поэтому они стремятся, во-первых, к сохранению (безопасности) своего тезауруса, а, во-вторых, к его увеличению.

Тезаурус владельца информации может быть увеличен как за счет синтеза знаний владельцем путем проведения собственных исследований или разработок, так и их законного и незаконного приобретения.

Законное приобретение знаний возможно путем организованного обучения в учебных заведениях, самостоятельного изучения литературы (самообучения), приглашения на работу более знающего специалиста, покупки патента или лицензии. Приобретение знаний путем хищения информации является незаконным способом увеличения тезауруса.

В природе и обществе происходят процессы как увеличения тезауруса владельца в результате синтеза информации, так и выравнивания тезаурусов разных владельцев.Выравнивание тезаурусов происходит путем передачи информации от тезауруса большего объема тезаурусу меньшего объема. Кроме целенаправленной (законной или незаконной) деятельности по передаче информации имеют место случайные процессы выравнивания тезаурусов владельцев, аналогично выравниванию температуры в замкнутом пространстве. Этот процесс объективно проявляется в любой организации и государстве путем случайных, трудно контролируемых процессов распространения информации от источника с большим объемом тезауруса к получателю, в том числе несанкционированному, с меньшим объемом тезауруса. Необходимы большие затраты и усилия для замедления процессов выравнивания тезаурусов, так же как, например, трудно удержать сгусток энергии от растекания.

При выравнивании тезаурусов коммерческая цена информации убывает, а ценность информации может, как возрастать, так и снижаться. Действительно, закон Ома знают очень много людей, но от этого полезность его для практики не уменьшается. Но покупателя на эту информацию вряд ли удастся найти, так как изучение закона Ома входит в программу школьного образования. На практике используют более грубый и простой, так называемый объемный способ измерения информации путем подсчета количества (в битах или байтах) символов сообщения или измерения характеристик носителя (количества листов, времени передачи сообщения и др.). Но семантика информации и ее ценность при этом не учитываются.



Поделиться:


Последнее изменение этой страницы: 2016-08-16; просмотров: 417; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.12.36.30 (0.007 с.)