Виды информации, размещаемой в Интернете. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Виды информации, размещаемой в Интернете.



 

В соответствии с Законом от 20 февраля 1995 г. № 224-ФЗ «Об информации, информатизации и защите информации» под терми­ном «информация» понимаются сведения о лицах, предметах, фактах, событиях, явлениях и процессах независимо от формы их представле­ния. Специалисты в области теории познания утверждают, что че­ловек познает реальный мир через объекты, свойства и отношения. Лица, предметы, факты, события, явления и процессы являются клас­сами объектов. Предметная область — это классы объектов, информа­ция о которых необходима в данном виде деятельности человека. В каж­дой предметной области потребителей интересует четко определенный перечень свойств и глубина описания этих свойств. Очевидно, что перечни интересующих потребителя свойств о лице в экономике и в ме­дицине будут различны.

Информация о предметной области, то есть об объектах и их свя­зях, может быть представлена в Двух видах: формализованном и в виде текста на естественном языке.

Формализованное описание конкретного объекта включает имя свой­ства (характеристики) и значение этого свойства для данного объекта. Имя свойства отражает ту грамматическую роль, которую играет зна­чение этого свойства по отношению к данному классу объектов. Зна­чение свойства (характеристики) может задаваться нормированным словарем или произвольно. Например, значение свойства «организа­ционно-правовая форма фирмы, организации» должно выбираться из нормированного словаря, а значение свойства «название организации» является произвольным. Формализованное описание объекта во мно­гом схоже с анкетной формой описания объекта. Некоторые авторы называют формализованное описание информации числовым. Это не совсем точное определение, так как фамилия лица или название орга­низации задается не числовым значением, но может быть представле­но в формализованном виде.

Названия классов объектов, свойств и областей возможных значе­ний этих свойств (характеристик), то есть язык формализованного описания для каждой предметной области, разрабатывают квалифи­цированные специалисты данного вида деятельности. С помощью от­дельных свойств устанавливаются связи между объектами. Так, на­пример, если описаны два объекта: фирма и товар, — то между ними устанавливается связь — отношение, указывающее, что данная фирма выпускает этот товар. Описание такого формализованного языка пос­ле согласования с источниками и потребителями информации в дан­ной предметной области издается в виде нормативного документа, и на основе его создаются базы данных формализованной информа­ции. Описание информации в таких базах в максимальной степени приближено к представлению специалиста о предметной области, в ко­торой он работает. Формализованный язык описания предметной об­ласти выполняет следующие основные функции:

позволяет источнику отбирать лишь ту информацию и описы­вать ее так, как это необходимо потребителю;

позволяет в базах данных отражать информацию в том же виде, в каком она отражена в сознании специалиста в данной предмет­ной области;

позволяет в информационных системах по указанию потреби­теля производить автоматическую обработку формализованной информации;

существенно облегчает поиск необходимой информации в базах данных.

Другим видом информации о предметной области является инфор­мация, представленная в виде текста на естественном языке.

Для того чтобы понять, в какой степени информация на естествен­ном языке, накапливаемая в информационных системах, подходит для удовлетворения информационных потребностей пользователя, рассмотрим в самых общих чертах природу восприятия человеком реальной действительности и отображение этой действительности на естественном языке. Индивидуальное знание предметной области источником и потребителем информации складывается из совокупно­сти представлений и понятий. Представления — это чувственно наглядные образы объектов реального мира. Источником формирова­ния представлений являются психологические процессы ощущения и восприятия, а также информация, получаемая от других членов об­щества в процессе общения. В результате создаются представления об объектах реального мира. Представления носят субъективный харак­тер, который определяется внутренним психологическим миром дан- ного человека. Хотя у разных людей создаются разные представления о реальном мире, в них присутствует элемент общности, которой по­зволяет использовать представления в процессе общения.

 

Понятия образуются в результате логического осмысления пред­ставлений об объектах реального мира и являются формой абстракт­ного мышления, отражающей и фиксирующей существенные призна­ки данных объектов. Понятия более объективны и в большей степени отражают коллективный опыт. Понятия и представления тесно связа­ны друг с другом и являются формой отражения реальной действи­тельности в мышлении.

Язык — это средство, с помощью которого люди передают друг дру­гу информацию о реальном мире. Словарные выражения являются материальной формой понятий и представлений. Естественный язык сформировался в результате длительного развития общества. По­скольку для различных слоев общества характерна разная степень общности представлений, возникла многозначность слов естественно­го языка: одно и то же слово приобретало множество различных зна­чений, и для одного и того же слова использовалось несколько словес­ных выражений. Таким образом, общими недостатками естественного языка с позиций оценки эффективности поиска являются избыточ­ность и недостаточность.

Избыточность проявляется в следующем:

1) активную роль в процессе передачи содержания текста играют только некоторые слова или словосочетания, так называемые ключевые слова. Другие можно отбросить практически без ущер­ба для понимания смысла;

2) в естественном языке используются синонимы, то есть слова, раз­личающиеся по звучанию и написанию, но тождественные или близкие по смыслу;

3) имеет место неоднозначность выражения, то есть возможность выразить одну и ту же мысль словами, не являющимися сино­нимами (например, «уменьшение сопротивления» — «увеличение проводимости»).

Недостаточность выражения на естественном языке проявляется в следующем:

1) многозначность отдельных слов — омонимия (совпадение по зву­чанию и написанию разных по значению слов). Например, «ключ» (для двери), «ключ» (источник);

2) эллипсность естественного языка. Под эллипсностью понимает­ся пропуск в тексте подразумеваемых слов.

Если рассматривать процесс отражения объектов реального мира текстом на естественном языке, то в нем можно выделить план содержания — смысл сообщения, то есть результат процесса мышления, и план выражения — произвольный текст на естественном языке. Та­ким образом, тексты на естественном языке, хранящиеся в информа­ционных системах, находятся на уровне плана выражения и характе­ризуются всеми недостатками естественного языка, которые были отмечены выше. Следует иметь в виду, что выявленные недостатки следует рассматривать лишь с позиций эффективного поиска сообще­ний в информационных системах. Причина неоднозначности выраже­ний, например эллипсность, при рассмотрении под другим углом бу­дет отнесена к достоинствам естественного языка.

Отметим, что потребитель информации, пользователь нуждается в получении информации о предметной области в соответствии со сво­ими представлениями об объектах, свойствах и отношениях в этой об­ласти. Свой запрос он также формулирует на уровне плана выражения.

Таким образом, в самой информационной системе, содержащей тексты на естественном языке, мы имеем массив планов выражения Источников на естественном языке, а на входе информационной сис­темы мы имеем множество запросов в виде планов выражения, сфор­мулированных потребителями информации.

Для того чтобы решить задачу поиска необходимой потребителю информации, необходимо смоделировать (представить) — о каком фрагменте предметной области потребитель хочет получить инфор­мацию. Далее необходимо просмотреть хранящиеся документы — пла­ны выражения, составленные источниками, представить (смоделиро­вать), что хотел сказать источник о предметной области, и на основе научно обоснованной методики отобрать те из документов, которые отвечают на поставленный вопрос полностью или частично.

Работы в области машинного перевода и теории построения доку­ментальных информационных систем, проводимые в течение последних 50 лет в нашей стране и за рубежом, показали, что процесс выявления смысла произвольного текста на естественном языке не подлежит ав­томатизации и может быть реализован лишь человеком, обладаю­щим глубокими знаниями в данной предметной области.

Однако общество нуждалось в построении документальных ифор-мационных систем, в первую очередь в области научно-технической информации. Для того чтобы облегчить поиск в больших массивах текстовой информации, стали строить информационно-поисковые системы, в которых документы описывались с помощью специальных поисковых языков. С помощью элементов этих же языков описывались и запросы. Для отбора документов в ответ на запрос осуществ­лялось сравнение поисковых образов запросов и поисковых образов документов, которое проводилось на одном и том же искусственном язы­ке. Такой подход является вынужденным.

Из-за недостатков естественного языка, отмеченных выше, доку­ментальные информационные системы не дают ответа на вопрос по­требителя, а выдают ему документы, в которых может содержаться ответ на его запрос, предоставляя потребителю самому выявить смыс­ловое содержание этих документов. Вопросы оценки эффективности поиска информации в документальных информационных системах будут рассмотрены ниже.

Структура Интернет.

13.2. Структура и принципы работы Интернет

Фактически, Интернет состоит из множества локальных и глобальных сетей, принадлежащих различным компаниям и предприятиям, работающих по самым разнообразным протоколам, связанных между собой различными линиями связи, физически передающих данные по телефонным проводам, оптоволокну, через спутники и радиомодемы.

За Интернет никто централизовано не платит, каждый платит за свою часть. Представители сетей собираются вместе и решают, как им соединяться друг с другом и содержать эти взаимосвязи. Пользователь платит за подключение к некоторой региональной сети, которая в свою очередь платит за свой доступ сетевому владельцу государственного масштаба. Интернет не имеет никакого собственника, здесь нет и специального органа управления, который бы контролировал всю работу сети Интернет. Локальные сети различных стран финансируются и управляются местными органами согласно политике данной страны.

Структура Интернет напоминает паутину, в узлах которой находятся компьютеры, связанные между собой линиями связи. Узлы Интернет, связанные высокоскоростными линиями связи, составляют базис Интернет. Как правило, это поставщики услуг (провайдеры). Оцифрованные данные пересылаются через маршрутизаторы, которые соединяют сети с помощью сложных алгоритмов, выбирая маршруты для информационных потоков.

Каждый компьютер в Интернет имеет свой уникальный адрес. В протоколе TCP/IP каждый компьютер адресуется четырьмя отделяемыми друг от друга точками десятичными числами, каждое из которых может иметь значение от 1 до 255. Адрес компьютера выглядит следующим образом:

19.226.192.108

Такой адрес называется IP-адресом. Этот номер может быть постоянно закреплен за компьютером или же присваиваться динамически - в тот момент, когда пользователь соединился с провайдером, но в любой момент времени в Интернет не существует двух компьютеров с одинаковыми IP-адресами.

Пользователю неудобно запоминать такие адреса, которые к тому же могут изменяться. Поэтому в Интернет существует Доменная Служба Имен (DNS - Domain Name System), которая позволяет каждый компьютер назвать по имени. В сети существуют миллионы компьютеров, и чтобы имена не повторялись, они разделены по независимым доменам.

Таким образом адрес компьютера выглядит как несколько доменов, разделенных точкой:

<сегмент n>. … <сегмент 3>.<сегмент 2>.<сегмент 1>.

Здесь сегмент 1 – домен 1 уровня, сегмент 2 – домен 2 уровня и т.д.

Доменное имя - это уникальное имя, которое данный поставщик услуг избрал себе для идентификации, например: ic.vrn.ru или yahoo.com

Например, доменный адрес (доменное имя) www.microsoft.com обозначает компьютер с именем www в домене microsoft.com. Microsoft – это название фирмы, com - это домен коммерческих организаций. Имя компьютера www говорит о том, что на этом компьютере находится WWW-сервис. Это стандартный вид адреса серверов крупных фирм (например, www.intel.com, www.amd.com и т.д.). Имена компьютеров в разных доменах могут повторяться. Кроме того, один компьютер в сети может иметь несколько DNS-имен.

Домен 1 уровня обычно определяет страну местоположения сервера (ru – Россия; ua – Украина; uk – Великобритания; de – Германия) или вид организации (com – коммерческие организации; edu - научные и учебные организации; gov - правительственные учреждения; org – некоммерческие организации).

Когда вводится доменное имя, например, www.mrsu.ru, компьютер должен преобразовать его в адрес. Чтобы это сделать, компьютер посылает запрос серверу DNS, начиная с правой части доменного имени и двигаясь влево. Его программное обеспечение знает, как связаться с корневым сервером, на котором хранятся адреса серверов имён домена первого уровня (крайней правой части имени, например, ru). Таким образом, сервер запрашивает у корневого сервера адрес компьютера, отвечающего за домен ru. Получив информацию, он связывается с этим компьютером и запрашивает у него адрес сервера mrsu. После этого от сервера mrsu он получает адрес www компьютера, который и был целью данной прикладной программы.

Данные в Интернет пересылаются не целыми файлами, а небольшими блоками, которые называются пакетами. Каждый пакет содержит в себе адреса компьютеров отправителя и получателя, передаваемые данные и порядковый номер пакета в общем потоке данных. Благодаря тому, что каждый пакет содержит все необходимые данные, он может доставляться независимо от других, и довольно часто случается так, что пакеты добираются до места назначения разными путями. А компьютер-получатель затем выбирает из пакетов данные и собирает из них тот файл, который был заказан.

Для идентификации служб используются порты. Порт - это число, которое добавляется к адресу компьютера, которое указывает на программу, для которой данные предназначены. Каждой программе, запущенной на компьютере, соответствует определенный порт, и она реагирует только на те пакеты, которые этому порту адресованы. Существует большое количество стандартных портов, соответствующих определенным службам, например, 21 - FTP; 23 - telnet; 25 - SMTP; 80 - HTTP; 110 - POP3; 70 - Gopher и т.д.

В Интернет используются не просто доменные имена, а универсальные указатели ресурсов URL (Universal Resource Locator).

URL включает в себя:

  • метод доступа к ресурсу, т.е. протокол доступа (http, gopher, WAIS, ftp, file, telnet и др.);
  • сетевой адрес ресурса (имя хост-машины и домена);
  • полный путь к файлу на сервере.

В общем виде формат URL выглядит так:

method://host.domain[:port]/path/filename,

где method - одно из значений, перечисленных ниже:

file - файл на локальной системе;

http - файл на World Wide Web сервере;

gopher - файл на Gopher сервере;

wais - файл на WAIS (Wide Area Information Server) сервере;

news - группа новостей телеконференции Usenet;

telnet - выход на ресурсы сети Telnet;

ftp – файл на FTP – сервере.

host.domain – доменное имя в сети Интернет.

port - число, которое необходимо указывать, если метод требует номер порта.

Пример: http://support.vrn.ru/archive/index.html.

Префикс http:// указывает, что далее следует адрес Web-страницы, /archive описывает каталог с именем archiv на сервере support.vrn.ru, а index.html - имя файла.

Ниже приведены некоторые наиболее часто встречающиеся названия компьютеров сети Интернет.

Сервер в сети Интернет - это компьютер, обеспечивающий обслуживание пользователей сети: разделяемый доступ к дискам, файлам, принтеру, системе электронной почты. Обычно сервер - это совокупность аппаратного и программного обеспечения.

Сайт - обобщенное название совокупности документов в Интернет, связанных между собой ссылками.

Шлюз (gateway)- это компьютер или система компьютеров со специальным программным обеспечением, позволяющая связываться двум сетям с разными протоколами.

Домашняя страница - это персональная Web-страница конкретного пользователя или организации.

Принципы выбора провайдера.

Выбор провайдера - задача весьма ответственная. Так что попытаюсь изложить общие принципы выбора и некоторые существенные моменты.
Вначале определимся, что конкретно нам требуется в нете. Если нужна только почта в небольших объемах, и задержка в десятки минут не критична, можно смело подключаться к любому провайдеру - большинство провайдеров вполне справятся с обменом электронной корреспонденцией. В этом случае важна легкость дозвона к провайдеру, этим будет в основном определяться оперативность обмена почтой.
И все же, советую подключаться к первичному провайдеру - зачастую у них гораздо больше каналов. Если у провайдера только один канал для связи, то надежность будет минимальной. Если кроме e-mail необходим и серфинг, требования к провайдеру резко возрастают. Скорость работы будет зависеть от внешних каналов провайдера и их реальной загрузки пользователями. У первичных провайдеров как правило качество работы выше, чем у вторичных.(у первичного провайдера есть внешний канал за пределы города, а вторичный провайдер не имеет своих внешних каналов, и сам подключен к первичному... AFAIK...).
Провайдер (первичный) почти всегда публикуют у себя на сайте *свои технические данные и даже открыто показывают свою статистику. И наоборот - вторичные провайдеры с неохотой рассказывают о своих каналах, а статистику загрузки скрывают...
Но кроме толщины каналов еще важна их реальная загрузка. К сожалению, четких критериев оценки качества со стороны нет. Единственным более менее надежным способом может быть только собственная проверка.
Многие провайдеры предоставляют желающим по просьбе тестовый вход бесплатно. Но тестировать провайдера желательно именно в те часы, когда собираемся реально работать. Качество работы очень сильно зависит от времени суток и даже дня недели. Самый лучший вариант - оплатить несколько тестовых часов и проверять работу в удобное время.
Опять же чем больше модемных линий имеет провайдер тем проще будет связаться, но так же не стоит забывать о том какие протоколы поддерживает тот или иной номер дозвона (практически обязательным на сегодняшний день является протокол передачи данных V.90, скорость связи до 57600 бит/сек)..
Загруженность телефонных линий провайдера легко проверить еще до подключения, просто позвони несколько раз на модемные телефоны провайдера в нужное время, если часто слышим "занято" вместо ответа модема - значит подключаться к такому провайдеру не стоит.... в идеале - "занято" вообще не должно быть никогда, даже в часы "пик". Но позволить себе достаточное количество телефонов могут пока только крупные провайдеры. *Но иногда совсем неважно, сколько входных телефонов заявляет провайдер, ведь есть многоканальные линии...
Нужно помнить что никто не может обещать что канал будет свободен или будет работать вообще, даже в договоре с провайдером скорее всего сказано, что провайдер не несет за это никакой ответственности....
Советы:
При выборе провайдера руководствоваться надо только собственными тестами, а не советами со стороны.

Не подключаться к провайдеру с единственным внешним каналом - в случае сбоев запасных вариантов не будет. Если провайдер скрывает информацию о своих каналах и статистику - это повод для сомнений.

Определяемся исходя из своих запросов с тарифным планом..



Поделиться:


Последнее изменение этой страницы: 2021-03-10; просмотров: 280; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.145.42.94 (0.03 с.)