Процесори швидких косинус- і синус-перетворень Фур’є 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Процесори швидких косинус- і синус-перетворень Фур’є



 

В основі структурної організації процесорів швидких косинус- і синус-перетворень Фур’є (ШКПФ-ШСПФ) лежить матрична мережа, яка є двовимірною сукупністю ПЕ, які апаратно реалізують базові операції (БО) та з’єднані між собою відповідно до графа алгоритму ШКПФ-ШСПФ (рис.15.4).

 


Рис.15.4 Граф алгоритму ШКПФ-ШСПФ

 

Апаратне відображення графа модифікованого алгоритму ШКПФ-ШСПФ на ПЕ, які складаються з операційних пристроїв і конвеєрних регістрів, дозволяє отримати матричний конвеєрний процесор. Такий процесор повинен забезпечити неперервну обробку потоку даних, що надходять з інтенсивністю Pd=kndFd. Структура матричного процесора 16-точкового ШКПФ-ШСПФ, який працює за конвеєрним принципом, наведена на рис.15.5, де ТІ – вхід тактових імпульсів; RS – вхід скиду; СК – сходинка конвеєра.

 


Рис.15.5 Структура матричного конвеєрного процесора 16-точкового ШКПФ-ШСПФ

 

Схеми основних ПЕ, на базі яких реалізується такий процесор, наведені на рис.15.6, де См – суматор; Вд – віднімач; КПМ – конвеєрний пристрій множення, який працює з тактом рівним часу спрацювання суматора та регістра

 

Тк1=tСм+tРг.

 


Рис.15.6. Схеми процесорних елементів

 

Розроблений матричний процесор 16-точкового ШКПФ-ШСПФ забезпечує наступну інтенсивність обробки

 

 

Особливістю матричного процесора ШКПФ-ШСПФ є інтерфейс, який в кожному такті роботи забезпечує одночасне введення 16 даних і виведення 16 результатів обробки. Реалізація процесора з таким інтерфейсом вимагає значної кількості виводів і великих розмірів кристала. Апаратні витрати на реалізацію матричного процесора ШКПФ-ШСПФ обчислюються за наступною формулою

 

W1=4N(1+log2N)WРг+(N/2+Nlog2N)WСм+WПк+NWКПМ

 

де N-розмірність перетворення; WРг, WСм, WПк, WКПМ – апаратні витрати відповідно на регістр, суматор, пристрій керування та конвеєрний пристрій множення.

Для синтезу процесора з меншою кількістю виводів використовують лінійну проекцію потокового графа модифікованого алгоритму ШКПФ-ШСПФ на вісь паралельну передачі даних. При цьому для кожного ярусу формується проекція БО - макрооператор та проекція каналів передачі даних оператор зберігання. Для відтворення потокового графу модифікованого алгоритму ШКПФРБ-ШСПФРБ на базі макрооператорів та операторів зберігання для кожного ярусу вводяться оператори управління, які визначають послідовність операцій у ПЕ та керують обчислювальним процесом у відповідності із структурою алгоритму

При апаратному відображені лінійної проекції графа алгоритму макрооператор і оператор зберігання кожного ярусу реалізується ПЕ, а оператори управління пристроєм керування. Структурна схема потокового процесора 2-4-8-16-точкового ШКПФ-ШСПФ наведена на рис.15.7, де ТІ – вхід тактових імпульсів; РП – вхід задання розміру перетворення; cos/sin – вхід задання виду перетворення; СПП – спеціалізована паралельна пам’ять; СВ – суматор-віднімач; КПМ – конвеєрний пристрій множення. Обробка даних в процесорі здійснюється за конвейєрним принципом з тактом

 

Тк1=tСм+tРг+tКм

 

де tРг, tСм і tКм - час спрацювання відповідно регістра, суматора і комутатора. Інтенсивність обробки даних у розробленому процесорі визначається за наступною формулою

 

 

Рис.15.7 Структурна схема 2-4-8-16-точкового процесора ШКПФ ШСПР

Для реалізації 16-точкового перетворювання ШКПФ-ШСПФ використовуються п’ять послідовно з’єднаних процесорних елементів (ПЕ), перший з яких здійснює виділення парної та непарної складових, другий базову операцію виду a'=(a+b)Rj, b'=(a-b)Rj, а решта - її спрощений варіант a'=a+b, b'=a-b. До складу ПЕ3, ПЕ4 і ПЕ5 входять суматор-віднімач СВ, комутатор Км і пристрій затримки, що складається з набору регістрів Рг. Схема таких ПЕ наведена рис.15.8.

 

Рис.15.8. Схема процесорного елемента

 

Затримка інформації в ПЕj, де j=3, 4, 5, визначається його порядковим номером j та дорівнює Zj=2j-3. Процесор забезпечує виконання 2-4-8- чи 16-точкового ШКПФ-ШСПФ, при цьому тактова частота роботи прийому і видачі даних не залежить від розмірності перетворення. Апаратні витрати на реалізацію такого процесора рівні

 

W2=(1+2log2N)WCB+2WКПМ+2WСПП+(2+2log2N)WКм+(N+2log2N)WРг+W4Км+WПК

 

де WРг, WСВ, WПК, WКПМ, WКм, W4Км, WСПП – апаратні витрати відповідно на регістр, суматор-віднімач, пристрій керування, конвеєрний пристрій множення, двовходовий комутатор, чотиривходовий комутатор і спеціалізовану паралельну пам’ять.

 



Поделиться:


Последнее изменение этой страницы: 2017-02-05; просмотров: 305; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.191.234.62 (0.009 с.)