Флопс как мера производительности 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Флопс как мера производительности



Производительность суперкомпьютеров

Название год FLOPS

Флопс 1941 100

килофлопс 1949 10³

Мегафлопс 1964 106

Гигафлопс 1987 109

Терафлопс 1997 1012

Петафлопс 2008 1015

эксафлопс − 1018

зеттафлопс − 1021

йоттафлопс − 1024

ксерафлопс − 1027

 

Как и большинство других показателей производительности, данная величина определяется путём запуска на испытуемом компьютере тестовой программы, которая решает задачу с известным количеством операций и подсчитывает время, за которое она была решена. Наиболее популярным тестом производительности на сегодняшний день является программа LINPACK, используемая, в том числе, при составлении рейтинга суперкомпьютеров TOP500.

Одним из важнейших достоинств показателя флопс является то, что он до некоторых пределов может быть истолкован как абсолютная величина и вычислен теоретически, в то время как большинство других популярных мер являются относительными и позволяют оценить испытуемую систему лишь в сравнении с рядом других. Эта особенность даёт возможность использовать для оценки результаты работы различных алгоритмов, а также оценить производительность вычислительных систем, которые ещё не существуют или находятся в разработке.

 

 

Границы применимости

Несмотря на кажущуюся однозначность, в реальности флопс является достаточно плохой мерой производительности, поскольку неоднозначным является уже само его определение. Под «операцией с плавающей запятой» может скрываться масса разных понятий, не говоря уже о том, что существенную роль в данных вычислениях играет разрядность операндов, которая также нигде не оговаривается.

Кроме того, величина флопс подвержена влиянию очень многих факторов, напрямую не связанных с производительностью вычислительного модуля, таких как: пропускная способность каналов связи с окружением процессора, производительность основной памяти и синхронность работы кэш-памяти разных уровней.

Всё это, в конечном итоге, приводит к тому, что результаты, полученные на одном и том же компьютере при помощи разных программ, могут существенным образом отличаться, более того, с каждым новым испытанием разные результаты можно получить при использовании одного алгоритма. Отчасти эта проблема решается соглашением об использовании однообразных тестовых программ (той же LINPACK) с усреднением результатов, но со временем возможности компьютеров «перерастают» рамки принятого теста и он начинает давать искусственно заниженные результаты,

поскольку не задействует новейшие возможности вычислительных устройств. А к некоторым системам общепринятые тесты вообще не могут быть применены, в результате чего вопрос об их производительности остаётся открытым.

Так, например, 24 июня 2006 года общественности был представлен суперкомпьютер MDGrape-3, разработанный в японском исследовательском институте RIKEN (Йокогама), с рекордной теоретической производительностью в 1 Пфлопс. Однако данный компьютер не является компьютером общего назначения и приспособлен для решения узкого спектра конкретных задач, в то время как стандартный тест LINPACK на нём выполнить невозможно в силу особенностей его архитектуры.

Также, высокую производительность на специфичных задачах показывают графические процессоры современных видеокарт и игровые приставки. К примеру, заявленная производительность игровой приставки Xbox 360 составляет 1 Тфлопс, а приставки PlayStation 3 и вовсе 2 Тфлопс, что ставит их в один ряд с суперкомпьютерами начального уровня. Столь высокие показатели объясняются тем, что указана производительность над числами 32-битного формата[1][2], тогда как для суперкомпьютеров обычно указывают производительность на 64-разрядных данных[3][4]. Кроме того, данные приставки и

видео-процессоры рассчитаны на операции с трёхмерной графикой, хорошо поддающиеся

распараллеливанию, однако эти процессоры не в состоянии выполнять многие задачи общего назначения, и их производительность сложно оценить классическим тестом LINPACK[5] и тяжело сравнить с другими системами.

Причины широкого распространения

Несмотря на большое число существенных недостатков, показатель флопс продолжает с успехом использоваться для оценки производительности, базируясь на результатах теста LINPACK. Причины такой популярности обусловлены, во-первых, тем, что флопс, как говорилось выше, является абсолютной величиной. А, во-вторых, очень многие задачи инженерной и научной практики, в конечном итоге, сводятся к решению систем линейных алгебраических уравнений, а тест LINPACK как раз и базируется на измерении скорости решения таких систем. Кроме того, подавляющее большинство компьютеров (включая суперкомпьютеры), построены по классической архитектуре с использованием стандартных процессоров, что позволяет использовать общепринятые тесты с

большой достоверностью.

Для подсчета максимального количества FLOPS для процессора нужно учитывать, что современные процессоры в каждом своём ядре содержат несколько исполнительных блоков каждого типа (в том числе и для операций с плавающей точкой) работающих параллельно и могут выполнять более одной инструкции за такт.

Данная особенность архитектуры называется суперскалярность и впервые

появилась ещё в самом первом процессоре Pentium в 1993 году. Современное ядро Intel Core 2 так же является суперскалярным и содержит 4 декодера команд, теоретически позволяющих достичь пиковой производительности до 4-х операций за 1 такт в каждом ядре[6]. Таким образом, для процессора, имеющего в своём составе 4 ядра (Core 2 Quad) и работающего на частоте 3.5ГГц теоретический предел производительности составляет 4х4х3.5=56 гигафлопс, а для процессора имеющего 2 ядра (Core 2 Duo) и работающего на частоте 3ГГц 2х4х3=24 гигафлопс, что хорошо согласуется с практическими результатами, полученными на тесте LINPACK. Типичная производительность теста

LINPACK составляет 80-95 % от теоретического максимума.

 

Обзор производительности реальных систем

Из-за высокого разброса результатов теста LINPACK, приведены примерные величины, полученные путём усреднения показателей на основе информации из разных источников. Производительность игровых приставок и распределённых систем (имеющих узкую специализацию и не поддерживающих тест LINPACK) приведена в справочных целях в соответствии с числами, заявленными их разработчиками. Более точные результаты с указанием параметров конкретных систем можно получить, например, на сайте The Performance Database Server.

 

Суперкомпьютеры

• Компьютер ЭНИАК, построенный в 1946 году, при массе 27 т и энергопотреблении 150 кВт, обеспечивал производительность в 300 флопс

• IBM 709 (1957) — 5 кфлопс

• БЭСМ-6 (1968) — 1 Мфлопс (операций деления)

• Cray-1 (1974) — 160 Мфлопс

• БЭСМ-6 на базе Эльбрус-1К2 (1980-х) — 6 Мфлопс (операций деления)

• Эльбрус-2 (1984) — 125 Мфлопс

• Cray Y-MP (1988) — 2,3 Гфлопс

• Электроника СС БИС (1991) — 500 Мфлопс

• ASCI Red (1993) — 1 Тфлопс

• Blue Gene/L (2006) — 478,2 Тфлопс

• Jaguar (суперкомпьютер) (2008) — 1,059 Пфлопс

• IBM Roadrunner (2008) — 1,105 Пфлопс [7]

• IBM Sequoia (2012) — 20 Пфлопс [8]

 

Персональные компьютеры

• IBM PC/XT (1983) — 6,9 кфлопс

• ПК на основе процессора Intel 80386 (1985) с тактовой частотой 40 МГц — 0,6 Мфлопс

• Intel Pentium 75 МГц (1993) — 7,5 Мфлопс

• Intel Pentium II 300 МГц (1997) — 50 Мфлопс

• Intel Pentium III 1 ГГц (1999) — 320 Мфлопс

• AMD Athlon 64 2,211 ГГц (2003) — 840 Мфлопс[9]

• Intel Core 2 Duo 2,4 ГГц (2006) — 1,3 Гфлопс

Вычислительные

комплексы России Эльбрус 3М Эльбрус 4 Эльбрус 5 Эльбрус 6 Эльбрус 7 (Компания ЗАО МЦСТ- физтех МГУ)

Год выпуска 2007 2011 2013 2016 2019

Производительностть

процессора (Гфлп) 4,8 19,2 64 256 768

Количество

процессоров

на сервере 2 16 64 64 64

Производительность

сервера (Гфлп) 9,6 300 4000 16000 49000

Количество серверов

в комплексе 64

Производительность

комплекса (Тфлп) 0,6 19 256 1000 3000

 

Процессоры

• Intel Core 2 Duo E7300 2.66ГГц — 19.34 Гфлопс При использовании (SiSoftware Sandra Pro Home 2009.SP3) Windows XP sp3

• Intel Core 2 Duo E8400 3.0ГГц (2008) — 18.6 Гфлопс При использовании стандартной версии LINPACK 10

• Intel Core 2 Duo E8400 3.0ГГц @4.0ГГц (2008) — 25 Гфлопс (LINPACK Benchmark 10.0 64-бит) в Windows Vista x64 Ultimate SP1

• Intel Core 2 Quad Q9450 2.66ГГц @3.5ГГц — 48 ГФлопс (LINPACK Benchmark 10.0 64-бит) в Windows 2003sp2 x64

 

Название МП Эльбрус Эльбрус 2С Эльбрус 4С Эльбрус 8С Эльбрус 16С

Год выпуска 2007 2010 2012 2015 2018

Техн. норма (нм) 130 90 65 45 32

Частота (Мгц) 300 600 1000 2000 3000

Производительность

МП (Гфлп) 4,8 19,2 64 256 768

Мощность (Вт) 6 16 25

 

Карманные компьютеры

• КПК на основе процессора Samsung S3C2440 400 МГц (архитектура ARM9) — 1,3 Мфлопс

• Intel XScale PXA270 520 МГц — 1,6 Мфлопс

• Intel XScale PXA270 624 МГц — 2 Мфлопс

Примечание: Приведенные процессоры не имеют аппаратной поддержки вычислений с плавающей

точкой. Более современные процессоры этого класса (I.MX31, OMAP-Lx) с аппаратным FPU имеют на

2 десятичных порядка большую производительность.

 



Поделиться:


Последнее изменение этой страницы: 2016-07-16; просмотров: 7449; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.144.12.205 (0.014 с.)