Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Взвешенное расстояние Кульбака-Лейблера

Поиск


Некоторые подобласти изображения могут содержать более важную информацию, чем остальные, и в соответствии с этим каждой из них можно назначить свой весовой коэффициент. Так, например, веса могут быть получены с помощью критерия Стьюдента, заключающегося в проверке гипотезы о различиях между двумя выборками, по обучающим данным, представляющих два класса («свои» и «чужие» в случае решения задачи верификации или идентификации).

В качестве меры различия двух гистограмм использовалось взвешенное расстояние Кульбака-Лейблера в симметричной форме:

(4.1)


где (i, j) – индексы подобласти изображения, wij – весовой коэффициент подобласти, S 1, S 2 – гистограммы ЛБШ первого и второго изображений соответственно, k – номер столбца гистограммы ЛБШ, P – число точек окрестности в шаблоне ЛБШ.

При этом задача идентификации решалась с использованием классификатора по методу ближайшего соседа, а задача верификации – путем пороговой классификации.

Расстояние Махаланобиса


Данный подход заключается в использовании расстояния Махаланобиса:

(4.2)


где x, y – случайные векторы с одинаковым распределением и корреляционной матрицей S.

Корреляционная матрица S может быть получена с использованием обучающей выборки изображений. Определяя расстояние Кульбака-Лейблера (4.1) для каждой из подобластей изображений, мы можем получить вектор различий двух изображений. Вычисляя такие вектора для каждой пары изображений обучающей выборки, мы получим два набора векторов различий изображений, соответствующих двум классам – классу «своих» и классу «чужих». После этого мы можем вычислить средние значения векторов, представляющих каждый из классов, а также две корреляционные матрицы.

На практике, для любых двух изображений мы можем вычислить их вектор различий, а затем определить расстояния Махаланобиса d 1 и d 2 между этим вектором и средними векторами классов «свой» и «чужой» соответственно. Идентификация и верификация могут быть произведены путем сравнения двух полученных расстояний либо с использованием дискриминирующей функции f (d 1, d 2) = d 2⁄(d 1+ d 2) и некоторого порогового значения.


 

4.3. Применение линейного дискриминанта Фишера
Следующий подход опирается на использование линейного дискриминанта Фишера (ЛДФ):

(4.3)


где μi — среднее для i -го класса, μ — общее среднее, Ni — число представителей в i -м классе, N — общее число представителей в обучающей выборке, xijj -й представитель i -го класса.

Пусть имеется два набора векторов, соответствующих двум классам. Собственный вектор, соответствующий наибольшему собственному значению матрицы Sw -1 Sb задает преобразование в пространство размерности 1.

Задача идентификации и верификации может быть решена способом, аналогичным предыдущему (путем построения векторов различий изображений с использованием расстояния Кульбака-Лейблера). При этом вместо расстояния Махаланобиса используется отображение вектора в одномерное пространство.

 


 

 

Предобработка изображений


С целью снижения уровня шума использовались медианный и гауссовский фильтры. Кроме того, изображения проходили процедуру нормализации, т.е. кадрировались, масштабировались и доворачивались до горизонтального положения линии, соединяющей центры глаз (рисунок 5.1).

Рисунок 5.1 – Параметры нормализации изображения

 


 

Метод Виолы-Джонса

Метод был разработан и представлен в 2001 году Полом Виолой и Майклом Джонсом, он до сих пор является основополагающим для поиска объектов на изображении в реальном времени.

Метод использует технологию скользящего окна. То есть рамка, размером, меньшим, чем исходное изображение, двигается с некоторым шагом по изображению, и с помощью каскада слабых классификаторов определяет, есть ли в рассматриваемом окне лицо. Метод скользящего окно эффективно используется в различных задачах компьютерного зрения и распознавания объектов.

Метод состоит из 2-х под алгоритмов: алгоритм обучения и алгоритм распознавания. На практике скорость работы алгоритма обучения не важна. Крайне важна скорость работы алгоритма распознавания. По введенной ранее классификации можно отнести к структурным, статистическим и нейронным методам.

Метод имеет следующие преимущества:

  • возможно обнаружение более одного лица на изображении;
  • использование простых классификаторов показывает хорошую скорость и позволяет использовать этот метод в видеопотоке.

Основные принципы, на которых основан метод, таковы:

  • используются изображения в интегральном представлении, что позволяет вычислять быстро необходимые объекты;
  • используются признаки Хаара, с помощью которых происходит поиск нужного объекта (в данном контексте, лица и его черт);
  • используется бустинг (от англ. boost – улучшение, усиление) для выбора наиболее подходящих признаков для искомого объекта на данной части изображения;
  • все признаки поступают на вход классификатора, который даёт результат «верно» либо «ложь»;
  • используются каскады признаков для быстрого отбрасывания окон, где не найдено лицо.


Обучение классификаторов идет очень медленно, но результаты поиска лица очень быстры, именно поэтому был выбран данный метод распознавания лиц на изображении. Виола-Джонс является одним из лучших по соотношению показателей эффективность распознавания/скорость работы. Также этот детектор обладает крайне низкой вероятностью ложного обнаружения лица. Алгоритм даже хорошо работает и распознает черты лица под небольшим углом, примерно до 30 градусов. При угле наклона больше 30 градусов процент обнаружений резко падает. И это не позволяет в стандартной реализации детектировать повернутое лицо человека под произвольным углом, что в значительной мере затрудняет или делает невозможным использование алгоритма в современных производственных системах с учетом их растущих потребностей.
Требуется подробный разбор принципов, на которых основан алгоритм Виолы-Джонса. Данный метод в общем виде ищет лица и черты лица по общему принципу сканирующего окна, однако, метод Виолы-Джонса сложно обучаем, так как для обучения требуется большое количество тестовых данных и предполагает большое время обучения, которое измеряется днями.
Изначально алгоритм был предложен для распознавания только лиц, но его можно использовать для распознавания других объектов.

 

Принцип сканирующего окна


В общем виде, задача обнаружения лица и черт лица человека на цифровом изображении выглядит именно так:

  • имеется изображение, на котором есть искомые объекты. Оно представлено двумерной матрицей пикселей размером w*h, в которой каждый пиксель имеет значение:
    — от 0 до 255, если это черно-белое изображение;
    — от 0 до 2553, если это цветное изображение (компоненты R, G, B).
  • в результате своей работы, алгоритм должен определить лица и их черты и пометить их – поиск осуществляется в активной области изображения прямоугольными признаками, с помощью которых и описывается найденное лицо и его черты:
    rectanglei = {x,y,w,h,a}, (1.1)
    где x, y – координаты центра i-го прямоугольника, w – ширина, h – высота, a – угол наклона прямоугольника к вертикальной оси изображения.


Иными словами, применительно к рисункам и фотографиям используется подход на основе сканирующего окна (scanning window): сканируется изображение окном поиска (так называемое, окно сканирования), а затем применяется классификатор к каждому положению. Система обучения и выбора наиболее значимых признаков полностью автоматизирована и не требует вмешательства человека, поэтому данный подход работает быстро.
Задача поиска и нахождения лиц на изображении с помощью данного принципа часто бывает очередным шагом на пути к распознаванию характерных черт, к примеру, верификации человека по распознанному лицу или распознавания мимики лица.

 



Поделиться:


Последнее изменение этой страницы: 2016-07-16; просмотров: 704; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.22.74.192 (0.008 с.)