Многопроцессорные системы с общей памятью или 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Многопроцессорные системы с общей памятью или

Поиск

Symmetric Multiprocessing (SMP)

Схема многопроцессорной системы с общей памятью представлена ниже:

 

Наличие общей памяти вызывает как положительные, так и отрицательные последствия:

• Наличие разделяемой памяти не требует физического перемещения данных между взаимодействующими программами, которые параллельно выполняются в разных процессорах. Это упрощает программирование и исключает затраты времени на межпроцессорный обмен.

• Поскольку при выполнении команд каждым процессором необходимо обращаться в разделяемую память, то требования к пропускной способности

коммутатора этой памяти чрезвычайно высоки, что и ограничивает число про-

цессоров в системах с общей памятью величиной 10...20. Для устранения этого

существенного недостатка используются развитые системы кэширования, то

есть внутрипроцессорной быстродействующей памяти для временного хране-

ния промежуточных результатов.

• Несколько процессоров могут одновременно обращаться к общим данным и это может привести к получению неверных результатов. Чтобы исключить такие ситуации, необходимо ввести систему управления доступом в оперативную память, разрешающую обращение к памяти только одному процессу. Это является отличительной особенностью систем с общей памятью.

 

Управление доступом к памяти. Пусть два процесса (процессора) L1 и L2

выполняют операцию прибавления 1 в ячейку Х, причем, во времени эти опе-

рации выполняются независимо:

L1 =….X: = X + 1;……..

L2 =….X: = X + 1;……..

Такие вычисления могут соответствовать, например, работе сети по прода

же билетов, когда два терминала сообщают в центральный процессор о прода-

же одного билета каждый. На центральном процессоре выполнение каждой

операции заключается в следующем: чтение сожержимого Х в регистр R1, при-

бавление единицы, запись содержимого R1 в ячейку Х. Пусть во времени на

центральном процессоре операции по тактам расположились следующим обра-

зом и начальное значение Х = 0

 

В результате неудачного размещения в такте 2 из ячейки Х читается значение 0 до того, как процесс L1 записал туда единицу. Это приводит к тому, что в такте 4 в ячейку Х будет вместо двух записана единица. Чтобы избежать таких ситуаций, нужно запрещать всем процессам использовать общий ресурс (ячейка Х), пока текущий процесс не закончит его использование. Это называется синхронизацией. Такая ситуация показана в строке L2*.

Семафоры. Чтобы исключить упомянутую выше ситуацию, необходимо

ввести систему синхронизации параллельных процессов.

Выход заключается в разрешении входить в критическую секцию (КС)

только одному из нескольких асинхронных процессов. Под критической секци-

ей понимается участок процесса, в котором процесс нуждается в ресурсе. Ре-

шение проблемы критической секции было предложено в виде семафоров. Се-

мафором называется переменная S, связанная, например, с некоторым ресурсом

и принимающая два состояния: 0 (запрещено обращение) и 1 (разрешено обра-

щение). Над S определены две операции: V и P. Операция V изменяет значение

S семафора на значение S + 1. Действие операции P таково:

• Если S ≠ 0, то P уменьшает значение на единицу;

• Если S = 0, то P не изменяет значения S и не завершается до тех пор, пока некоторый другой процесс не изменит значение S с помощью операции V;

• Операции V и P считаются неделимыми, т. е. не могут исполняться одно

временно.

Приведем пример синхронизации двух процессов, в котором рrocess 1 и process 2 могут выполняться параллельно. Процесс может захватить ресурс только тогда, когда S:=1. После захвата процесс закрывает семафор операции P(S) и открывает его вновь после прохождения критической секции V(S).

Begin

semaphore S;

S:=1;

process 1:

Begin

L 1: P (S);

Критический участок 1;

V (S);

Остаток цикла, go to L 1

End

process 2:

Begin

L 2: P (S);

Критический участок 2;

V (S);

Остаток цикла, go to L 2

End

End

Таким образом, семафор S обеспечивает неделимость процессов L i и, значит, их последовательное выполнение. Это и есть решение задачи взаимного исключения для процессов L i.

Определение требуемого быстродействия памяти по частоте процессора. Для соблюдения баланса вычислений в одном ядре необходимо, чтобы в

этом цикле время вычислений в процессоре равнялось времени обращения к

памяти. Это минимальное условие обозначает следующее:

N*Tпр = M*Tпм

где N – число операций процессора, M – число обращений к памяти, Tпр и Tпм соответственно - время работы процессора и памяти. Следовательно, для нашего примера требуемая частота памяти должна равняться:

Пусть для примера Fпр = 1 ГГц, M = 2, N = 6 (как в программе выше), и из памяти выбираются 64-разрядные числа, тогда Fпм = 0.33*1ГГц = 330 МГц,

а требуемая пропускная способность памяти q равняется

q = 8*Fпм = 8*330 = 2.84 Гбайт/c

 

Следует проводить различие между:

• Системой ОКМД.

• Системой с общей памятью.

• Системой SMP.

Для программирования систем с общей памятью используется высокоуровневый язык OpenMP, который позволяет в явном виде указывать наличие в программа мест, которые можно распараллеливать. Само же распараллеливание производится в процессе трансляции на основе создания потоков, реализующих само распараллеливания.

Пример симметричной мультипроцессорной ЭВМ HP 9000.

Архитектура. Система состоит из нескольких однородных процессоров и массива общей памяти (обычно из нескольких независимых блоков). Все

процессоры имеют доступ к любой точке памяти с одинаковой скоростью.

Процессоры подключены к памяти либо с помощью общей шины (базовые

2-4 процессорные SMP-сервера), либо с помощью crossbar-коммутатора

(HP 9000). Аппаратно поддерживается когерентность кэшей.

Примеры. HP 9000 V-class, N-class; SMP-cервера и рабочие станции на

базе процессоров Intel (IBM, HP, Compaq, Dell, ALR, Unisys, DG, Fujitsu и

др.).

Масштабируемость Наличие общей памяти сильно упрощает взаимо-

действие процессоров между собой, однако накладывает сильные ограни-

чения на их число - не более 32 в реальных системах. Для построения

масштабируемых систем на базе SMP используются кластерные или

NUMA-архитектуры.

Операционная система. Вся система работает под управлением единой

ОС (обычно UNIX-подобной, но для Intel-платформ поддерживается

Windows NT). ОС автоматически (в процессе работы) распределяет про-

цессы/нити по процессорам (scheduling), но иногда возможна и явная при-

вязка.

Модель программирования. Программирование в модели общей памя

ти. (POSIX threads, OpenMP). Для SMP-систем существуют сравнительно эффективные средства автоматического распараллеливания.

 

 

ЛЕКЦИЯ 13.



Поделиться:


Последнее изменение этой страницы: 2016-04-08; просмотров: 1055; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.141.19.115 (0.009 с.)