Структурні аспекти побудови відмовостійких комп ’ ютерних систем 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Структурні аспекти побудови відмовостійких комп ’ ютерних систем



 

Існує два основних напрямки побудови відмовостійких систем:

- використання лише відмовостійких компонентів – при такій реалізації кожен компонент системи може продовжувати своє функціювання, навіть якщо один/декілька підкомпонентів системи виходять з ладу;

- розроблення методів, які гарантують побудову відмовостійкої системи з невідмовостійких компонентів – відмовостійкість в таких системах реалізується за рахунок введення надлишковості та розроблення спеціального програмного забезпечення, елементних взаємозв’язків та алгоритмів функціювання.

Отже, основною задачею при розробці та експлуатації відмовостійких КС є забезпечення їх надійності.

У процесі розробки відмовостійких КС ключовим моментом є вибір оптимальної елементної бази, що має задовольняти певним вимогам. На сьогоднішній день, у зв’язку із значними змінами в технології розробки мікросхем, розробники надають перевагу таким технологіям, які дають змогу збільшити кількість логічних елементів на кристалі, при цьому мати можливість не тільки задавати певну конфігурацію мікросхеми, а й, при потребі, виконувати її конфігурацію; досягти зниження вартості; споживаної потужності і складності систем. Всім цим характеристикам відповідають програмовані логічні інтегральні мікросхеми (ПЛІС). ПЛІС отримали застосування в системах керування військовою технікою, наприклад в літальних апаратах APACHE, COMANCHE, B-52, в системах керування запуском та наведенням ракет, системах керування радарами і т.д.

При підвищенні відмовостійкості важливе пророблення рішення на кожній стадії й кожному рівні переміщення, розміщення й зберігання даних. Не завжди найдорожчий варіант забезпечує рішення насущних проблем, іноді він ще й додає нові. Будь-який керівник служби ІТ ставить перед собою головну мету - побудувати високопродуктивну обчислювальну систему з високим ступенем відмовостійкості й при цьому знизити як закупівельну, так й експлуатаційну вартість, тобто вартість КС. У ході проектування й побудови правильно збалансованого комплексу, залучення компаній з досвідом інтеграційних рішень можна уникнути зайвих витрат і грошей і часу. Компроміс між простотою рішення, продуктивністю й відмовостійкістю необхідно відшукувати на стадії проектування й розробки, постійно коректувати дії виходячи з вартості КС й показників продуктивності.

Необхідно відзначити, що підвищення відмовостійкості в більшості випадків приводить не тільки до подорожчання системи, але й до ускладнення процесу моніторингу й, як наслідок, до більш складного розподілу ресурсів і керуванню ними. Ці фактори, у свою чергу, ведуть до необхідності підвищення кваліфікації обслуговуючого персоналу, впровадження спеціалізованого ПЗ, що неминуче веде до збільшення експлуатаційних витрат і вартості володіння.

 Засоби відмовостійкості дозволяють скоротити час простою до п'яти хвилин у рік або навіть менше. Відмовостійкість забезпечується надлишковістю на фізичному рівні, де в кожному з компонентів може виникнути збій і ніхто цього не помітить.

У підсумку всі системи в відмовостійкій конфігурації відрізняються високим рівнем апаратної надлишковості, обслуговуваності й можливостей віддаленого керування. Всі основні апаратні елементи, такі як процесори, пам'ять і диски, дублюються. Всі надлишкові компоненти виконують будь-який процес всі разом.

Репліцировані компоненти виконують ті самі команди одночасно, тому навіть якщо на одному з компонентів виникне помилка, додаток буде працювати без змін. У результаті адміністратори можуть нарощувати систему, здійснювати повсякденну підтримку й видаляти компоненти, на яких виник збій, без відключення всієї системи.

У серверах використовується концепція, що одержала назву “пари процесів”. Суть її в тому, що основний процес і резервний процес виконуються на різних вузлах. Резервний процес відзеркалює всю інформацію з основного вузла й здатний у будь-який момент “підмінити” основний процес у випадку виникнення в ньому помилки.

Надмірність доповнюють високонадійні операційні системи, вбудовані інструментальні засоби діагностики й різноманітне програмне забезпечення керування потоками робіт.

Крім усього іншого, таке відмовостійке програмне забезпечення покликане запобігти втраті даних у випадку виникнення збою й управляти виконанням таких завдань, як примусове перемикання із системи, де виник збій. Мета полягає в тому, щоб виявити апаратні проблеми, які можуть призвести до відключення системи, і швидко перерозподілити робоче навантаження на інші системи.

 

Як приклад|зразок| підвищення надійності кластерної системи приведемо рішення фірми|фірма-виготовлювача| Hewlett-Packard|. У цих рішеннях|розв'язаннях,вирішеннях,розв'язуваннях|, залежно від потрібного рівня відмовостійкості, серверні вузли кластера розміщуються таким чином:

- централізований (локальний кластер);

- по сусідніх будівлях (кампусный| кластер);

- по декількох територіях в межах міста (метро кластер);

- у різних містах, країнах або континентах (два зв’язані кластери - континентальний кластер).

На додаток до дубльованого центрального комутатора, всі апаратні компоненти: системний контроллер, джерела живлення|харчування|, системи охолоджування, годинник - повністю|цілком| дубльовані. Система не має одиничного|поодинокої| блоку|точки| збою. Для порівняння - якщо такий простий елемент як системний годинник вийде з ладу|строю,буд| в дорогому сервері HP| Superdome| або IBM| p680|, вся система припинить роботу.

У систему повинні бути заздалегідь|наперед| встановлені|установлені| або сконфігуровані запасні модулі, так що при відмові одного з модулів запасний модуль може замінити його практично негайно. Модуль, що відмовив, може ремонтуватися автономно, тоді як система продовжує працювати.

Принцип швидкого прояву|вияву| несправності зазвичай|звично| реалізується за допомогою двох методів - самоконтролю і порівняння. Засоби|кошти| самоконтролю припускають|передбачають|, що при виконанні деякої операції модуль робить|чинить| і деяку додаткову роботу, що дозволяє підтвердити правильність отриманого результату|достатку|. Прикладами|зразками| цього методу є|з'являються,являються| коди виявлення несправності при зберіганні даних і передачі повідомлень|сполучень|. Метод порівняння грунтується на виконанні однієї і тієї ж операції двома або великим числом модулів і зіставленні результатів компаратором. У разі|в разі| виявлення неспівпадання результатів робота припиняється.

Методи самоконтролю були основою побудови|шикування| відмовостійких систем протягом багатьох років. Вони вимагають реалізації додаткових схем і часу розробки і, ймовірно|певно,мабуть|, домінуватимуть в пристроях|устроях| пам’яті і пристроях|устроях| зв’язку завдяки простоті і ясності логіки. Проте|однак| для складних пристроїв|устроїв| обробки даних економічні міркування|тяма|, зв’язані із застосуванням стандартних масових компонентів, нав’язують використання методів порівняння. Оскільки компаратори порівняно прості, їх застосування|вживання| дає деяке збільшення логічних схем при істотному|суттєвому| скороченні часу розробки. Слід зазначити, що|слід відзначити, що,следует отметить | в раніших відмовостійких конструкціях 30% логічних схем процесорів і 30% часу розробки йшло|вирушало| на реалізацію засобів|коштів| самоконтролю. З цієї точки зору схеми порівняння додають|добавляють| лише універсальні схеми з|із| простою логікою. В результаті скорочуються загальні|спільні| витрати на розробку і логіку.

Ще одним засобом|коштом| побудови|шикування| відмовостійкої архітектури є|з'являється,являється| принцип дублювання дуплексних модулів, який припускає|передбачає| створення|створіння| деякої комбінації двох модулів (“супермодуля”), побудованих|спорудити| на принципах швидкого прояву|вияву| несправності. Такий “супермодуль” продовжує працювати, навіть коли відмовляє один з субмодулів.

Дублювання дуплексних модулів вимагає більшого об’єму|обсягу| устаткування|обладнання|, але|та| дозволяє робити|чинити| вибір одного з режимів роботи: організацію двох незалежних обчислень|підрахунків| на принципах швидкого прояву|вияву| несправності, модулів, що виконуються на двох парах, або одного високонадійного обчислення|підрахунку|, що виконується на всіх чотирьох модулях.

Необхідно пам’ятати, що сама по собі надмірність тільки|лише| знижує надійність у разі|в разі| дублювання і троювання|. Для істотного|суттєвого| збільшення рівня готовності надмірна|надлишкова| конструкція повинна забезпечувати можливість|спроможність| ремонту і заміни модулів, що відмовили.

 



Поделиться:


Последнее изменение этой страницы: 2021-12-15; просмотров: 80; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.223.196.59 (0.005 с.)