Обучение алгоритма идентификации 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Обучение алгоритма идентификации



 

Одним из вариантов алгоритма идентификации могут быть нейронные сети. Искусственные нейронные сети получили огромное распространение в различных областях благодаря их возможности обучаться по данным и моделировать функцию практически любой степени сложности. Однако нейросетевые алгоритмы характеризуются огромным числом параметров и длительным обучением. Большой прогресс в области применения нейросетей произошёл в относительно недавнее время после накопления больших коллекций данных и роста вычислительных мощностей.

При решении задач биометрической идентификации и аутентификации нейронные сети также применяются. В частности, когда биометрическим идентификатором является изображение, применяются свёрточные нейронные сети [33]. При этом традиционно используется сиамская архитектура сетей [34]. При такой архитектуре сеть применяется к поступающему изображению и изображению-эталону, и строит компактное векторное представление изображений. Решение о соответствии биометрического образца и эталона принимается либо на основе метрического сходства векторов описания, либо с помощью другой нейронной сети, принимающей на вход два полученных описания [35, 36]. Удобство такой архитектуры заключается в том, что признаковые представления всех объектов из базы можно просчитать заранее и хранить в виде их компактных представлений, а обрабатывать только одно входящее. В случае динамических биометрических данных общая архитектура сети остаётся аналогичной.

Для обработки последовательностей реакций можно использовать и обычные полносвязные сети, если будет построено низкоуровневое признаковое представление данных. Однако при наличии достаточного объёма обучающих данных можно пытаться исключить шаг “feature engineering” и подавать на вход сети необработанные данные. В таком случае для обработки последовательностей традиционно эффективно применяют рекуррентные нейронные сети, в частности LSTM [36] и GRU [37]. В этом случае потребуется больший объём данных, так как сеть будет содержать гораздо больше обучаемых параметров.

В случае изучения динамических реакций требуется поставить в соответствие паре «стимул-реакция» человека, для которого такие реакции характерны. Надо отметить, что задача достаточно сложна, так как предполагается, что стимулы не будут повторяться. Однако способность нейронных сетей к построению обобщений должна позволить выделять в стимулах общие элементы и оценивать степень сходства реакций в близких ситуациях, на основе этой информации и обучающей выборки неявно отражаемой в параметрах сети, определять для какого человека подобные реакции характерны. С другой стороны, в отличие от задачи моделирования нервной системы, в данном случае задача прогнозирования реакции человека на стимул не стоит. Определение схожести реакций является на порядок более простой, дескрименативной задачей, тогда как предыдущая является генеративной.

Технологически, для создания идентифицирующей нейросети нужно собраться коллекцию данных для обучения. Коллекция данных должна содержать пары стимул-реакция. Причём для каждого человека пар должно быть несколько. Ключевая задача по размеченным данным – обучить сеть строить представления для рефлекторных реакций. Представление должно быть таким, чтобы отображать реакции одного и того же человека в близкие точки, а разных людей – в далёкие. Этого можно добиться, например, применением т.н. триплетной функции потерь [35]. После обучения нейросети добавление или удаление новой записи в базу биометрических идентификаторов не потребует переобучения нейросети, а потребует только вычисления представления.

Сложность и количество параметров нейронной сети определяет и безопасность такого подхода. Так как потенциальный злоумышленник не знает какие параметры реакций анализирует нейросеть, то и подделать саму реакцию представляется крайне сложным. С другой стороны, если злоумышленник вдруг получит набор данных, по которым обучалась нейросеть, то это не приведёт к тому, что он сможет её воспроизвести. Даже в том случае если будет построена и обучена сеть аналогичной архитектуры, получаемое представление будет отлично от имеющегося. Результат обучения сети, характеристики нейронов выходных и низкоуровневых слоёв носят стохастический характер, определяется случайными начальными параметрами и порядком поступления данных. К примеру, перестановка выходных нейронов местами не изменит точности работы сети, но принципиально изменит представление реакции, то есть идентификатор человека, который будет сравниваться на сервере с идентификаторами из базы.

Почему это работает?

 

Основой нового подхода является гипотеза о том, что зависимость реакций человека на внешние стимулы существенно зависит от когнитивных и кинезиологических особенностей человека, носит динамический характер и отражается в измерениях в достаточной для анализа степени.

Принципиальными особенностями системы стимул-реакция является:

‒ наличие нервной системы человека как связующего звена между стимулом и реакцией. Если к симуляции интеллекта уже достаточно много подходов, то работ по симуляции нервной системы практически нет. Нервные системы людей крайне сильно отличаются между собой и сложны для моделирования. В отличие от интеллектуальных задач у нервной системы нет «правильного ответа», которому бы можно было научить машину.

‒ случайные, не повторяющиеся стимулы. Такой подход позволит принципиально исключить возможность воспроизведения ранее записанных реакций пользователя, то есть подлога первичных данных.

‒ обработка пары стимул-реакция может производиться на удалённом доверенном устройстве.

При этом:

1. Недоверенность клиентского терминала не влияет на результаты, так как генерация стимула и анализ реакции выполняется на отчужденных доверенных ресурсах, а искажение реакции не даст возможности злоумышленнику получить нужный для него результат

2. Перехватывать стимул нет смысла, так как зная стимул, невозможно сгенерировать реакцию в силу отсутствия модели человека

3. Извлечь параметры нейронной сети путем ее тестирования в заданных условиях невозможно, а акты идентификации постоянно уточняют параметры нейронной сети, и поэтому даже тотальное наблюдение не позволит в полной мере воспроизвести сеть.

Нетрудно видеть, что основная особенность, обеспечивающая безопасность идентификации на недоверенном устройстве, состоит в интерактивности – ни клиентский терминал, ни центр сами по себе не выполнят идентификацию. Процедура существенно интерактивна, что и позволяет генерацию стимула и принятие решения отнести к доверенному центру, а съем информации осуществлять на принадлежащем клиенту персональном устройстве [38].

Конечно, полный анализ безопасности еще предстоит выполнить. Возможно, стоит поискать и альтернативный нейронной сети механизм принятия решений.

 

 



Поделиться:


Последнее изменение этой страницы: 2021-11-27; просмотров: 39; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.221.98.71 (0.006 с.)