Класифікація структур систол 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Класифікація структур систол



Аналіз різних типів систоличних структур і тенденцій їх розвитку дозволяє класифікувати ці структури за декількома ознаками.

За гнучкістю систоличні структури можуть бути згруповані на:

- спеціалізовані;

- алгоритмічно орієнтовані;

- програмовані.

Спеціалізовані систоличні структури орієнтовані на виконання певного алгоритму. Ця орієнтація відбивається не тільки в конкретній геометрії систоличної структури, статичності зв’язків між ПЕ і числом ПЕ, але і у виборі типу операції, що виконується всіма ПЕ. Прикладами є структури, орієнтовані на рекурсивну фільтрацію, швидке перетворення Фурье для заданої кількості крапок, конкретні матричні перетворення.

Алгоритмічно орієнтовані систоличні структури володіють можливістю програмування або конфігурації зв’язків в систоличній матриці, або самих ПЕ. Можливість програмування дозволяє виконувати на таких структурах деяку множину алгоритмів, що зводяться до однотипних операцій над векторами, матрицями і іншими числовими множинами.

У програмованих систоличних структурах є можливість програмування як самих ПЕ, так і конфігурації зв’язків між ними. При цьому ПЕ можуть володіти локальною пам’яттю програм, і хоча всі вони мають одну і ту ж організацію, в один і той же момент часу допускається виконання різних операцій з деякого набору. Команди або керуючі слова, що зберігаються в пам’яті програм таких ПЕ, можуть змінювати і напрям передачі операндів.

За розрядністю процесорних елементів систоличні структури діляться на:

- однорозрядні;

- багаторозрядні.

В однорозрядних матрицях ПЕ в кожен момент часу виконує операцію над одним двійковим розрядом, а в багаторозрядних - над словами фіксованої довжини.

За характером локально-просторових зв’язків систоличні структури бувають:

- одновимірні;

- двомірні;

- тривимірні.

Вибір структури залежить від виду оброблюваної інформації. Одновимірні схеми застосовуються при обробці векторів, двомірні - матриць, тривимірні - множин іншого типу.

Систоличні структури можуть відрізнятися по топології зв’язків між ПЕ:

- лінійні;

- квадратні;

- гексагональні;

- тривимірні і ін.

Кожна конфігурація матриці найбільш пристосована для виконання певних функцій, наприклад лінійна матриця оптимальна для реалізації фільтрів в реальному масштабі часу; гексагональна - для виконання операцій звернення матриць, а також дій над матрицями спеціального вигляду; тривимірна - для знаходження значень нелінійних диференціальних рівнянь в часткових похідних. Найбільш універсальними і найбільш поширеними, проте, можна рахувати матриці з лінійною структурою.

 

КС з наддовгими командами (VLIW)

VLIW (англ. very long instruction word - дуже довга машинна команда) - архітектура процесорів з декількома обчислювальними пристроями (рис.16.4). Характеризується тим, що одна інструкція процесора містить декілька операцій, які повинні виконуватися паралельно.

Рисунок 16.4 – Процессор Itanium 2 в корпусе PAC з архитектурой VLIW

Архітектура з командними словами надвеликої довжини або з наддовгими командами (VLIW) відома з 80-х років.

Ідея VLIW базується на тому, що завдання ефективного планування паралельного виконання декількох команд покладається на “розумний” компілятор. Такий компілятор спочатку досліджує початкову програму з метою виявити всі команди, які можуть бути виконані одночасно без виникнення конфліктів. В процесі аналізу компілятор може навіть частково імітувати виконання даної програми. На наступному етапі компілятор намагається об’єднати такі команди в пакети, кожний з яких розглядається як одна наддовга команда. Об’єднання декількох простих команд в одну наддовгу проводиться за наступними правилами:

- кількість простих команд, що об’єднуються в одну команду надвеликої довжини, рівна числу наявних в процесорі функціональних блоків (ФБ);

- у наддовгу команду входять тільки такі прості команди, які виконуються різними ФБ, тобто забезпечується одночасне виконання всіх складових наддовгої команди.

 Довжина наддовгої команди зазвичай складає від 256 до 1024 біт. Така метакоманда містить декілька полів (по числу створюючих її простих команд), кожне з яких описує операцію для конкретного функціонального блоку. На рис.16.5 показаний можливий формат наддовгої команди і взаємозв’язок між її полями і ФБ, що реалізовують окремі операції.

 

 

Рисунок 16.5 – Формат наддовгої команди і взаємозв’язок полів команди з складовими блоку виконання

 

Кожне поле наддовгої команди відображається на свій функціональний блок, що дозволяє отримати максимальну віддачу від апаратури блоку виконання команд.

VLIW-архітектуру можна розглядати як статичну суперскалярну архітектуру. Розпаралелювання коду проводиться на етапі компіляції, а не динамічно під час виконання. Те, що у виконуваній наддовгій команді виключена можливість конфліктів, дозволяє гранично спростити апаратуру VLIW-процесора і досягнути вищої швидкодії.

Для створення наддовгої команди, як правило, як прості команди, використовуються команди RISC-типу. Тому архітектуру VLIW іноді називають пост-RISC-архітектурою. Максимальне число полів в наддовгій команді рівно числу обчислювальних пристроїв і зазвичай коливається в діапазоні від 3 до 20. Всі обчислювальні пристрої мають доступ до даних, що зберігаються в єдиному багатопортовому регістровому файлі. Відсутність складних апаратних механізмів, характерних для суперскалярних процесорів (прогноз переходів, позачергового виконання і т.д.) дає значний виграш в швидкодії і можливість ефективніше використовувати площу кристала. Переважна більшість цифрових сигнальних процесорів і мультимедійних процесорів з продуктивністю більше 1 млрд операцій/с базується на VLIW-архітектурі. Серйозна проблема VLIW - ускладнення регістрового файлу і зв’язків цього файлу з обчислювальними пристроями.

Переваги технології VLIW.

Використання компілятора дозволяє усунути залежність між командами до того, як вони реально виконуватимуться, на відміну від суперскалярних процесорів, де такі залежності доводиться виявляти і усувати «в процесі виконання». Відсутність залежностей між командами в коді, сформованому компілятором, веде до спрощення апаратних засобів процесора і за рахунок цього до істотного підвищення його швидкодії. Наявність множини функціональних блоків дає можливість виконувати декілька команд паралельно.

Недоліки технології VLIW.

Потрібне нове покоління компіляторів, здатних проаналізувати програму, знайти в ній незалежні команди, зв’язати такі команди в рядки завдовжки від 256 до 1024 битів, забезпечити їх паралельне виконання. Компілятор повинен враховувати конкретні деталі апаратних засобів. При певних ситуаціях програма виявляється недостатньо гнучкою.

Основні сфери застосування.

VLIW-процесори поки що мало розповсюджені. Основними сферами застосування технології VLIW є цифрові сигнальні процесори і обчислювальні системи, орієнтовані на архітектуру IA-64. Найбільш відомою була VLIW-система фірми Multiflow Computer, Inc. У Росії VLIW-концепція була реалізована в супер-комп’ютері Ельбрус 3-1 і отримала подальший розвиток в його послідовнику - Ельбрус-2000 (E2k). До VLIW відноситься і сімейство сигнальних процесорів TMS320C6x фірми Texas Instruments. На початку 2000 року фірма Transmeta заявила процесор Crusoe, що є програмно-апаратним комплексом. У ньому команди мікропроцесорів серії х86 транслюються в слова VLIW завдовжки 64 або 128 біт. Відтрансльовані команди зберігаються в кеш-пам’яті, а трансляція при багатократному їх використанні проводиться тільки один раз. Ядро процесора виконує елементи коду в строгій послідовності.

 



Поделиться:


Последнее изменение этой страницы: 2021-12-15; просмотров: 46; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.14.6.194 (0.007 с.)