Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь FAQ Написать работу КАТЕГОРИИ: АрхеологияБиология Генетика География Информатика История Логика Маркетинг Математика Менеджмент Механика Педагогика Религия Социология Технологии Физика Философия Финансы Химия Экология ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Метрики работы информационной системыСодержание книги
Поиск на нашем сайте
Чтобы определить, что такое безошибочная работа ИС, нужны критерии — метрики. Рассмотрим так называемые бизнес-метрики, т. е. те критерии безошибочной работы ИС, которые интересны компании с точки зрения осуществления ее производственной деятельности. Существуют три основные бизнес-метрики работы ИС [64]. Ожидаемое время восстановления системы MTTR (Mean Time to Restore). Эта метрика задается бизнес-подразделениями компании службам администратора системы. Есть виды бизнеса, которые могут просуществовать без ИС только несколько минут, а затем цена простоя за минуту станет критически высокой. Другие виды бизнеса могут ждать восстановления системы несколько дней без финансовых потерь. Это критическая метрика для планирования процедуры восстановления. Стоимость по применению превентивных мер для восстановления системы растет в геометрической прогрессии в зависимости от значения MTTR. Ожидаемое время между отказами MTBF (Mean Time Between Failures), или наработка на отказ, — это метрика работы оборудования, задаваемая производителем. Так как современное компьютерное оборудование работает достаточно надежно (очень часто производителем дается пожизненная гарантия), то часть производителей не приводит эту метрику в своей технической документации. Администратору системы следует в этом случае брать ее из публикуемых аналитических данных по данному виду оборудования. Время подъема системы Uptime — это результирующая метрика, которая говорит о том, сколько времени пользователь не пользуется ИС из-за проблем диагностики ошибки и восстановления системы, т. е. это совокупность времени для поиска ошибок, их диагностики, времени восстановления и запуска ИС в промышленном режиме. Эта метрика задается бизнес-подразделениями службам администратора системы в SLA. Определяется она исходя из финансовых возможностей предприятия и, соответственно, его оснащенностью средствами диагностики и восстановления. Для служб администратора системы эта метрика является отчетной и определяет их возможность поддерживать ИС в работоспособном состоянии.
Диагностика ошибок Ethernet
Практически 99% всех ИС реализованы с использованием технологии Ethernet и протоколов TCP/IP. Поэтому в данном разделе рассмотрим, с какими ошибками может встретиться АС при использовании средств Ethernet [51, 65], а вопросы диагностики ошибок в среде протоколов TCP/IP будут изложены далее (в подразделе 8.7). Коллизии в Ethernet [51] возникают при одновременном доступе к среде передачи двух устройств (node — нода), а также из-за задержек сигнала в устройствах, находящихся между источником и приемником. При возникновении коллизии очень рано (на уровне передачи преамбулы) может быть не передан даже разделитель фреймов SFD. Коллизию при передаче преамбулы (до SFD) не распознают большинство диагностических средств, так как микросхемная база Ethernet обычно не передает информацию протоколам второго уровня модели OSI, пока не «увидит» SFD. При обнаружении коллизии станцией или коммутатором, посылается «пробка» (JAM), которая представляет собой не- стандартизированный 32-битный фрейм. Часто это просто сигнал тактовой частоты 10 МГц. Если он посылается слишком рано, то уничтожается (затирается) часть заголовка фрейма, и адрес источника или получателя искажается. Коммутаторы, обнаружив коллизию на одном из портов, разошлют пробку всем остальным портам, чтобы коллизия стала известна станциям. В современных коммутируемых сетях с топологией кабельной системы типа «звезда» коллизия обнаруживается нодой сети при одновременном сигнале на пинах пары приема (RC) и пинах пары передачи (TR). Если коммутатор обнаруживает такую коллизию на своем порту, то распознает ее как локальную. Если такая коллизия обнаруживается на порту рабочей станции, то передача фрейма прерывается, и он передается как короткий фрейм до 64 байт с неправильной контрольной суммой (FCS). Он настолько короткий, что заголовок не передается целиком, а пробка занимает четыре последних байта. Коммутатор распознает этот фрейм как удаленную коллизию. Практически все коллизии в современных Ethernet-сетях воспринимаются как удаленные. Все это необходимо понимать администратору системы при анализе Ethernet-сети. Коллизии не являются ошибкой, они обязательны в сетях с конкурентным методом доступа. Вопрос только в их количестве. По рекомендациям компаний-производителей диагностических средств существует специальный вид проверки на ошибки длительностью в одну минуту [51]. Рассмотрим ее подробнее. Проверка Ethernet «1 минута» предполагает следующий анализ: - если потери производительности пропускной способности канала составляют менее одного процента, считается, что ошибок нет; - процент средней утилизации (использования) канала (на сколько процентов в единицу времени загружен канал) должен быть до 40%. При этом необходимо следить, чтобы не было долговременных всплесков утилизации более 60%. В противном случае администратору системы следует принимать меры по сегментации сети; - средний процент коллизий не должен быть больше 5% от общего числа переданных фреймов. Превышение данного значения означает либо проблемы устройств физического уровня модели OSI, либо превышение количества станций в коллизионном домене; - широковещательный трафик (Broadcast) не может составлять более 5—10% пропускной способности канала. При правильной работе ошибок не должно быть обнаружено. Теперь рассмотрим основные ошибки, которые могут произойти в сетях Ethernet [51, 65]. К ним относятся поздняя коллизия, короткий фрейм, неверная контрольная сумма (FCS), «болтовня» (Jabber), «карлики» (Runts), «привидения» (Ghosts), ошибки выравнивания. Поздняя коллизия (late collision) — это коллизия, которая фиксируется уже после того, как устройство передало в канал связи первые 64 байта фрейма, но обнаружило сигнал одновременного приема и передачи на соответствующих пинах. При этом регистрируется неправильная контрольная сумма, а в последних четырех байтах содержится пробка. Так как коллизия происходит после того, как 64-ый байт был передан, то автоматически фрейм повторно не передается. Вместо этого протокол верхнего уровня (например, TCP или SPX) должен среагировать на то, что данные отсутствуют, и послать запрос на повторную передачу данных. Как правило, поздняя коллизия вызвана дефектным сетевым оборудованием. Короткий фрейм — это фрейм длиной менее 64 байт (после 8-байтной преамбулы) с правильной контрольной суммой (последовательностью FCS). Наиболее вероятная причина появления коротких фреймов — неисправная сетевая плата или неправильно сконфигурированный сетевой драйвер. Неверная контрольная сумма (FCS). Когда фрейм данных пересылается от одного сетевого устройства к другому, передающая станция вычисляет контрольную последовательность фрейма (FCS- или CRC-контрольную сумму) и добавляет ее в конец фрейма. Принимающая станция повторно вычисляет FCS и сравнивает его с FCS, которая была добавлена во фрейм данных передающей стороной. Если два значения совпадают, то считается, что фрейм был передан без ошибок. Если они отличаются друг от друга, это означает, что данные были искажены в процессе передачи. Эта ситуация называется ошибкой FCS. Большое число ошибок FCS от одной станции указывает на работающий со сбоями сетевой адаптер (NIC) либо на неправильно сконфигурированные драйверы NIC, либо на плохое кабельное подключение. Если ошибки FCS регистрируются от многих станций, то это может указывать на неполадки в кабельной системе, неправильные версии драйвера NIC, дефектный порт коммутатора или внешние электрические помехи (шумы). Карлики (Runts). Многие анализаторы протоколов и сетевых мониторов подсчитывают фреймы-карлики. К сожалению, термин Runt не стандартизирован, и его определение имеет разные значения в различных продуктах. Runt может быть любым типом фрейма, который короче, чем разрешенный минимум в Ethernet (48 байт), включая локальные удаленные коллизии или коллизии на этапе передачи преамбулы с хорошей или плохой FCS. Привидения (Ghosts) — это фреймы длиной не менее 72 байт с неправильной контрольной последовательностью. Впервые данный термин был введен компанией Fluke в целях определения фреймов, пораженных шумами, и дифференциации их отличий от удаленных коллизий. Для администратора сети очень важно, что в этом случае результаты диагностики зависят от сегмента, где происходят измерения. Ghosts являются «коварными» ошибками, так как они не распознаются программными анализаторами протоколов (как и коллизии на этапе передачи преамбулы). Некоторые типы шума воспринимаются нодами как получение фреймов. На самом деле никакой информации не передается. Различные сетевые интерфейсы будут реагировать на это по-разному. Не существует стандартов реагирования на шумы в сегментах сети. Коммутаторы будут иногда передавать эти сигналы в другие сегменты сети. Характерный признак ghosts — сеть, которая работает медленно без видимой причины. Оборудование, контролирующее сеть, показывает очень низкие показатели утилизации сети, но пользователи жалуются администратору сети, что сеть работает медленно или полностью не функционирует. Симптомы могут ограничиваться территориально. Обычно причиной появления ghosts являются электротехнические проблемы. Болтовня (Jabber) определяется как длинный фрейм (long frame), длиннее 1518 байт. Длинный фрейм может иметь правильную или неправильную контрольную последовательность. Длинные фреймы с неправильной контрольной последовательностью обычно называют Jabber. Обнаружение длинных фреймов с правильной контрольной последовательностью указывает чаще всего на некорректность работы сетевого драйвера. Ошибки типа Jabber свидетельствуют об неисправности активного оборудования или наличии внешних помех. В соответствии со спецификациями IEEE 802.3 сетевые устройства (например, коммутатор) должны отключить порт при обнаружении большого числа фреймов Jabber. После краткого промежутка времени, порт будет повторно включен, если Jabber отсутствует. В действительности не все сетевые устройства осуществляют эту часть спецификации. Некоторые устройства вообще не обнаруживают Jabber, в то время как другие устройства могут обнаружить и отключить проблемные порты, но повторно их не активируют. Наличие большого числа фреймов Jabber приведет к повышению занятости канала и резкому замедлению работы сети. Ошибки выравнивания. Если фрейм не заканчивается на границе байта, то такая ошибка определяется как ошибка выравнивания. Обычно это проблема драйвера или коллизия, сопровождаемая неверной контрольной суммой.
|
||||
Последнее изменение этой страницы: 2016-12-30; просмотров: 1372; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.16.76.102 (0.007 с.) |