Анализ обнаруженных особенностей, вынесение решения о количестве и расположении «лиц». 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Анализ обнаруженных особенностей, вынесение решения о количестве и расположении «лиц».



После того, как на изображении выделены области, обладающие свойствами, характерными для микроорганизмов, производится их комплексная проверка для выявления областей, действительно являющихся микроорганизмами. Сущность этой проверки зависит от характера используемых признаков, а также от избранной исследователями стратегии. Если используется распознавание по цвету, то может быть добавлено дополнительное условие, что рассматриваться в качестве потенциальных микроорганизмов будут только области близкие по цвету к оттенку микроорганизмов. Проверка соотношения обнаруженных признаков микроорганизмов может быть основана на: некотором эмпирическом алгоритме [8], статистике взаимного расположения признаков, собранной по изображениям микроорганизмов [10], моделировании процессов, происходящими в человеческом мозгу при распознавании визуальных образов [9], применении жестких или деформируемых шаблонов [11] и т.д.

1.2 Методы второй категории, моделирование изображения микроорганизмов (для самостоятельной проработки).

Второе семейство методов подходит к проблеме с другой стороны, и, не пытаясь в явном виде формализовать процессы, происходящие в человеческом мозге, стараются выявить закономерности и свойства изображения микроорганизмов неявно, применяя методы математической статистики и машинного обучения. Методы этой категории опираются на инструментарий распознавания образов, рассматривая задачу обнаружения микроорганизмов, как частный случай задачи распознавания. Изображению (или его фрагменту) ставится в соответствие некоторым образом вычисленный вектор признаков, который используется для классификации изображений на два класса - микроорганизм/не микроорганизм. Самый распространенный способ получения вектора признаков это использование самого изображения: каждый пиксель становится компонентом вектора, превращая черно-белое изображение n×m в вектор пространства Rn×m. Недостатком такого представления является чрезвычайно высокая размерность пространства признаков. Достоинство заключается том, что используя все изображение целиком вместо вычисленных на его основе характеристик, из всей процедуры построения классификатора (включая выделение устойчивых признаков для распознавания) полностью исключается участие человека, что потенциально снижает вероятность ошибки построения неправильной модели изображения микроорганизма вследствие неверных решений и заблуждений разработчика.

Обычно поиск микроорганизмов на изображениях с помощью методов математического моделирования и перебора. Поскольку схема полного перебора обладает такими безусловными недостатками, как избыточность и большая вычислительная сложность, применяются различные методы сокращения количества рассматриваемых фрагментов.

Моделирование класса изображений микроорганизмов с помощью Метода Главных Компонент (Principal Components Analysis, PCA)

Метод главных компонент [12] применяется для снижения размерности пространства признаков, не приводя к существенной потере информативности тренировочного набора объектов. Применение метода главных компонент к набору векторов линейного пространства Rn, позволяет перейти к такому базису пространства, что основная дисперсия набора будет направлена вдоль нескольких первых осей базиса, называемых главными осями (или главными компонентами). Таким образом, основная изменчивость векторов тренировочного набора представляется несколькими главными компонентами, и появляется возможность, отбросив оставшиеся (менее существенные), перейти к пространству существенно меньшей размерности. Натянутое на полученные таким образом главные оси подпространство размерности m << n является оптимальным среди всех пространств размерности m в том смысле, что наилучшим образом (с наименьшей ошибкой) описывает тренировочный набор изображений.

В приложении к задаче обнаружения микроорганизмов, МГК обычно применяется следующим образом. После вычисления главных осей тренировочного набора изображений микроорганизмов, вектор признаков тестового изображения проецируется на подпространство, образованное главными осями. Вычисляются две величины: расстояние от проекции тестового вектора до среднего вектора тренировочного набора - Distance in Feature Space (DIFS), и расстояние от тестового вектора до его проекции в подпространство главных компонент - Distance From Feature Space (DFFS). Исходя из этих расстояний выносится решение о принадлежности тестового изображения классу изображений микроорганизмов [13].

Моделирование класса изображений «лиц» с помощью Факторного анализа (Factor Analysis, FA)

Факторный анализ (ФА) [15], как и многие методы анализа многомерных данных, опирается на гипотезу о том, что наблюдаемые переменные являются косвенными проявления относительно небольшого числа неких скрытых факторов. ФА, таким образом, это совокупность моделей и методов ориентированных на выявление и анализ скрытых (латентных) зависимостей между наблюдаемыми переменными. В контексте задач распознавания, наблюдаемыми переменными обычно являются признаки объектов. Факторный анализ можно рассматривать как обобщение метода главных компонент.

Цель ФА в контексте задачи обнаружения микроорганизмов - получить модель изображения микроорганизмов (с обозримым числом параметров), с помощью, которой можно провести оценку близости тестового изображения к изображению микроорганизмов [16].

1.2.3 Проблема сбора контпримеров для тренировки классификаторов

Методы, использующие МГК и ФА требуют для тренировки классификатора только набора положительных случаев распознавания (изображений микроорганизмов), им не требуются контрпримеры (изображения без микроорганизмов). Методы описанные ниже нуждаются также и в контрпримерах, что поднимает еще одну проблему - как найти репрезентативный набор изображений "не микроорганизма" для успешной тренировки классификатора? В работе [17] предложено решение этой проблемы методом самонастройки - он заключается в постепенном формировании набора контпримеров, по результатам проводимых тестов. На первом шаге для тренировки классификатора используется небольшого тренировочного набора изображений-контрпримеров. Затем производится тестирование на некоторой случайной выборке из базы данных изображений. Все изображения, в ходе теста ошибочно распознанные, как микроорганизмы, добавляются в набор контпримеров и тренировка повторяется.



Поделиться:


Последнее изменение этой страницы: 2020-11-28; просмотров: 66; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.17.75.227 (0.006 с.)