Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Замечания по архитектуре госта.

Поиск

Общеизвестно, что шифр ГОСТ 28147-89 является представителем целого семейства шифров, построенных на одних и тех же принципах. Самым известным его «родственником» является американский стандарт шифрования, алгоритм DES. Все эти шифры, подобно ГОСТу, содержат алгоритмы трех уровней. В основе всегда лежит некий «основной шаг», на базе которого сходным образом строятся «базовые циклы», и уже на их основе построены практические процедуры шифрования и выработки имитовставки. Таким образом, специфика каждого из шифров этого семейства заключена именно в его основном шаге, точнее даже в его части. Хотя архитектура классических блочных шифров, к которым относится ГОСТ, лежит далеко за пределами темы настоящей статьи, все же стоит сказать несколько слов по ее поводу.

Алгоритмы «основных шагов криптопреобра­зования» для шифров, подобных ГОСТу, построены идентичным образом. Их общая схема приведена на рисунке 7. На вход основного шага подается блок четного размера, старшая и младшая половины которого обрабатываются отдельно друг от друга. В ходе преобразования младшая половина блока помещается на место старшей, а старшая, скомбинированная с помощью операции побитного исключающего или с результатом вычисления некоторой функции, на место младшей. Эта функция, принимающая в качестве аргумента младшую половину блока и некоторый элемент ключевой информации (X), является содержательной частью шифра и называется его функцией шифрования. Соображения стойкости шифра требуют, чтобы размеры всех перечисленных элементов блоков были равны: | N 1 |=| N 2 |=| X |, в ГОСТе и DESе они равны 32 битам.

Если применить сказанное к схеме основного шага алгоритма ГОСТ, станет очевидным, что блоки 1,2,3 алгоритма определяют вычисление его функции шифрования, а блоки 4 и 5 задают формирование выходного блока основного шага исходя из содержимого входного блока и значения функции шифрования.

Рис. 7. Сîäåðæàíèå основного шага криптопреобразования для блочных шифров, подобных ГОСТу.

В предыдущем разделе мы уже сравнили DES и ГОСТ по стойкости, теперь мы сравним их по функциональному содержанию и удобству реализации. В циклах шифрования ГОСТа основной шаг повторяется 32 раза, для DESа эта величина равна 16. Однако сама функция шифрования ГОСТа существенно проще аналогичной функции DESа, в которой присутствует множество перекодировок по таблицам с изменением размера перекодируемых элементов. Кроме того, между основными шагами в циклах шифрования DESа необходимо выполнять битовые перестановки в блоках данных. Все эти операции чрезвычайно неэффективно реализуются на современных неспециализированных процессорах. ГОСТ не содержит подобных операций, поэтому он значительно удобней для программной реализации. Ни одна из рассмотренных автором реализаций DESа для платформы Intel x86 не достигает даже половины производительности предложенной вашему вниманию в настоящей статье реализации ГОСТа, несмотря на вдвое более короткий цикл. Все сказанное выше свидетельствует о том, что разработчики ГОСТа учли как положительные, так и отрицательные стороны DESа, а также более реально оценили текущие и перспективные возможности криптоанализа.

Требования к качеству ключевой информации и источники ключей.

Не все ключи и таблицы замен обеспечивают максимальную стойкость шифра. Для каждого алгоритма шифрования существуют свои критерии оценки ключевой информации. Так, для алгоритма DES известно существование так называемых «слабых ключей», при использовании которых связь между открытыми и зашифрованными данными не маскируется достаточным образом, и шифр сравнительно просто вскрывается.

Исчерпывающий ответ на вопрос о критериях качества ключей и таблиц замен ГОСТа если и можно вообще где-либо получить, то только у разработчиков алгоритма. Соответствующие данные не были опубликованы в открытой печати. Однако согласно установленному порядку, для шифрования информации, имеющей гриф, должны быть использованы ключевые данные, полученные от уполномоченной организации. Косвенным образом это может свидетельствовать о наличии методик проверки ключевых данных на «вшивость». Сам факт существования слабых ключевых данных в Российском стандарте шифрования не вызывает сомнения. Очевидно, нулевой ключ и тривиальная таблица замен, по которой любое значение заменяется но него самого, являются слабыми, при использовании хотя бы одного из них шифр достаточно просто взламывается, каков бы ни был второй ключевой элемент.

Как уже было отмечено выше, критерии оценки ключевой информации недоступны, однако на их счет все же можно высказать некоторые соображения:

1. Ключ должен являться массивом статистически независимых битов, принимающих с равной вероятностью значения 0 и 1. При этом некоторые конкретные значения ключа могут оказаться «слабыми», то есть шифр может не обеспечивать заданный уровень стойкости в случае их использования. Однако, предположительно, доля таких значений в общей массе всех возможных ключей ничтожно мала. Поэтому ключи, выработанные с помощью некоторого датчика истинно случайных чисел, будут качественными с вероятностью, отличающейся от единицы на ничтожно малую величину. Если же ключи вырабатываются с помощью генератора псевдослучайных чисел, то используемый генератор должен обеспечивать указанные выше статистические характеристики, и, кроме того, обладать высокой криптостойкостью, не меньшей, чем у самого ГОСТа. Иными словами, задача определения отсутствующих членов вырабатываемой генератором последовательности элементов не должна быть проще, чем задача вскрытия шифра. Кроме того, для отбраковки ключей с плохими статистическими характеристиками могут быть использованы различные статистические критерии. На практике обычно хватает двух критериев, – для проверки равновероятного распределения битов ключа между значениями 0 и 1 обычно используется критерий Пирсона («хи квадрат»), а для проверки независимости битов ключа – критерий серий. Об упомянутых критериях можно прочитать в учебниках или справочниках по математической статистике.

2. Таблица замен является долговременным ключевым элементом, то есть действует в течение гораздо более длительного срока, чем отдельный ключ. Предполагается, что она является общей для всех узлов шифрования в рамках одной системы криптографической защиты. Даже при нарушении конфиденциальности таблицы замен стойкость шифра остается чрезвычайно высокой и не снижается ниже допустимого предела. К качеству отдельных узлов замен можно предъявить приведенное ниже требование. Каждый узел замен может быть описан четверкой логических функций, каждая из которых имеет четыре логических аргумента. Необходимо, чтобы эти функции были достаточно сложными. Это требование сложности невозможно выразить формально, однако в качестве необходимого условия можно потребовать, чтобы соответствующие логические функции, записанные в минимальной форме (т.е. с минимально возможной длиной выражения) с использованием основных логических операций, не были короче некоторого необходимого минимума. В первом и очень грубом приближении это условие может сойти и за достаточное. Кроме того, отдельные функции в пределах всей таблицы замен должны отличаться друг от друга в достаточной степени. На практике бывает достаточно получить узлы замен как независимые случайные перестановки чисел от 0 до 15, это может быть практически реализовано, например, с помощью перемешивания колоды из шестнадцати карт, за каждой из которых закреплено одно из значений указанного диапазона.

Необходимо отметить еще один интересный факт относительно таблицы замен. Для обратимости циклов шифрования 32–З и 32–Р не требуется, чтобы узлы замен были перестановками чисел от 0 до 15. Все работает даже в том случае, если в узле замен есть повторяющиеся элементы, и замена, определяемая таким узлом, необратима, однако в этом случае снижается стойкость шифра. Почему это именно так, не рассматривается в настоящей статье, однако в самом факте убедиться несложно. Для этого достаточно, используя демонстрационную программу шифрования файлов данных, прилагающуюся к настоящей статье, зашифровать а затем расшифровать файл данных, использовав для этой процедуры «неполноценную» таблицу замен, узлы которой содержат повторяющиеся значения.

Если вы разрабатываете программы, использующие криптографические алгоритмы, вам необходимо позаботиться об утилитах, вырабатывающих ключевую информацию, а для таких утилит необходим источник случайных чисел (СЧ) высокого статистического качества и криптостойкости. Наилучшим подходом здесь было бы использование аппаратных датчиков СЧ, однако это не всегда приемлемо по экономическим соображениям. В качестве разумной альтернативы возможно (и очень широко распространено) использование различных программных датчиков СЧ. При генерации небольшого по объему массива ключевой информации широко применяется метод «электронной рулетки», когда очередная получаемая с такого датчика порция случайных битов зависит от момента времени нажатия оператором некоторой клавиши на клавиатуре компьютера.

Этот подход использован в программе генерации одного ключа, исходный текст которой на языке Си с ассемблерными вкраплениями прилагается к настоящей статье в файле make1key.c. Для выработки случайных чисел из заданного диапазона используется канал 2 системного таймера, информация считывается с него при нажатии оператором какой-либо клавиши на клавиатуре дисплея. За одно нажатие генерируется один байт ключа и на экран выводится точка. Чтобы было невозможно генерировать байты ключа удержанием клавиши в нажатом состоянии, между циклами генерации введена временная задержка и в начале каждого цикла проверяется, было ли во время паузы нажатие клавиши. Если таковое имело место, выдается звуковой сигнал и нажатие игнорируется. Программу целесообразно запускать только из «голого» DOSа, в DOS-сеансе Windows 3.x/95 она также работает, но нет уверенности в обеспечении нужных статистических характеристик, а под Windows NT программа по вполне понятным причинам (лезет напрямую в порты) вообще не работает корректно.

Замечания по реализации.

Три шага оптимизации.

Целью описываемой в настоящей статье реализации ГОСТа было не создание максимального по эффективности кода любой ценой, целью было создание близкого к оптимальному по быстродействию, но при этом компактного и легкого для восприятия программистом кода.

Программирование алгоритмов ГОСТа «в лоб» даже на языке ассемблера дает результат, очень далекий от возможного оптимума. Задача создания эффективной реализации указанных алгоритмов для 16-разрядных процессоров Intel 8088–80286 представляет собой хотя и не сверхсложную, но все же и не вполне тривиальную задачу, и требует очень хорошего знания архитектуры и системы команд упомянутого семейства процессоров. Трудность здесь заключается в том, что для достижения максимальной производительности программная реализация должна как можно большую часть операций с данными выполнять в регистрах и как можно реже обращаться к памяти, а регистров у рассматриваемых процессоров не так много и все они 16-разрядные. С 32-разрядными процессорами этой же линии (Intel 80386 и старше) все намного проще именно в силу их 32-разрядности, здесь не будет трудностей даже у новичка.

В реализации алгоритмов были использованы изложенные ниже подходы, позволившие достигнуть максимальной производительности. Первые два из них достаточно очевидны, настолько, что встречаются практически в каждой реализации ГОСТа.

1. Базовые циклы ГОСТа содержат вложенные циклы (звучит коряво, но по-другому не скажешь), причем во внутреннем цикле порядок использования восьми 32-битных элементов ключа может быть прямой или обратный. Существенно упростить реализацию и повысить эффективность базовых циклов можно, если избежать использования вложенных циклов и просматривать последовательность элементов ключа только один раз. Для этого необходимо предварительно сформировать последователь­ность элементов ключа в том порядке, в котором они используются в соответствующем базовом цикле.

2. В основном шаге криптопреобразования 8 раз выполняется подстановка 4-битных групп данных. Целевой процессор реализации не имеет команды замены 4-битных групп, однако имеет удобную команду байтовой замены (xlat). Ее использование дает следующие выгоды:

· за одну команду выполняются сразу две замены;

· исчезает необходимость выделять полубайты из двойных слов для выполнения замены, а затем из 4-битовых результатов замен вновь формировать двойное слово.

Этим достигается значительное увеличение быстродействия кода, однако мир устроен так, что за все приходится платить, и в данном случае платой является необходимость преобразования таблицы замен. Каждая из четырех пар 4-разрядных узлов замен заменяется одним 8-разрядным узлом, который, говоря языком математики, представляет собой прямое произведение узлов, входящих в пару. Пара 4-разрядных узлов требует для своего представления 16 байтов, один 8-разрядный – 256 байтов. Таким образом, размер таблицы замен, которая должна храниться в памяти компьютера, увеличивается до 4·256=1024 байтов, или до одного килобайта. Конечно, такая плата за существенное увеличение эффективности реализации вполне приемлема.

3. После выполнения подстановок кода по таблице замен основной шаг криптопреобразования предполагает циклический сдвиг двойного слова влево на 11 бит. В силу 16-разрядной архитектуры рассматриваемых процессоров вращение 32-разрядного блока даже на 1 бит невозможно реализовать менее, чем за три ассемблерные команды, а вращение на большее число разрядов только как последовательность отдельных вращений на 1 разряд. К счастью, вращение на 11 бит влево можно представить как вращение на 8 бит, а затем еще на 3 бита влево. Думаю, для всех очевидно, что первое вращение реализуется тремя командами обмена байтовых регистров (xchg). Но секрет третьей оптимизации даже не в этом. Замена одного байта по таблице замен осуществляется командой xlat, которая выполняет операцию над аргументом в регистре AL, для того, чтобы заменить все байты двойного слова, их надо последовательно помещать в этот регистр. Секрет третьей оптимизации заключается в том, что эти перестановки можно организовать так, что в результате двойное слово окажется повернутым на 8 бит влево, то есть в совмещении замены по таблице и во вращении на байт влево. Еще один момент, на который стоит обратить внимание, это оптимальное кодирование трех последовательных вращений на 1 бит, это может быть реализовано по-разному и важно было выбрать оптимальный способ, который оказался вовсе не очевидным, поскольку потребовал выхода за пределы логики битовых сдвигов и использования команды суммирования с битами переноса (adc), то есть бит помещается на свою позицию не командой сдвига, а командой суммирования!



Поделиться:


Последнее изменение этой страницы: 2016-04-20; просмотров: 169; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 13.59.205.182 (0.01 с.)