Уровни «слово» и «символ». Распознаватели символов ( классификаторы) 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Уровни «слово» и «символ». Распознаватели символов ( классификаторы)



Разделив строку на отдельные слова, FineReader приступает к обработке символов. Разделение слов на символы и собствен­но распознавание букв, как и все остальные механизмы много­уровневого анализа документа, реализованы в виде составных частей единой процедуры. Это позволяет в полной мере исполь­зовать преимущества принципов IPA. Выделенные изображения символов поступают на рассмотрение механизмов распознава­ния букв, называемых классификаторами.

В системе ABBYY FineReader применяются следующие типы классификаторов: растровый, контурный, приз­
наковый, структурный, п р и з н а к о в о - д и ф ф е р е н - циальный и с т р у к т у р н о - д и ф ф е р е н ц и а л ь н ы й.

Растровый классификатор. Классификатор сравнивает сим­вол с набором эталонов, поочередно накладывая изображения друг на друга. Эталонами в данном случае выступают специаль­но подготовленные изображения; каждое из них объединяет в себе очертания множества вариантов написания того или иного символа. Гипотезы выдвигаются в зависимости от того, с каки­ми эталонами точнее совпало изображение буквы. Сами этало­ны строятся методом наложения друг на друга большого коли­чества одних и тех же букв в разных вариантах начертания (рис. 4.7, а).

Контурный классификатор. Представляет собой разновид­ность признакового классификатора. От вышеописанного отли­чается тем, что признаки вычисляются не по полному изображе­нию символа, а по его контуру (рис. 4.7, о). Этот быстродейст­вующий классификатор предназначен для распознавания текста, набранного декоративными шрифтами (например, стилизован­ного под готический, старорусский стиль и т. п.).

Признаковый классификатор. Аналогичен растровому (выдви­гает гипотезы, исходя из степени совпадения параметров симво­ла с эталонными значениями). Оперирует определенными чи­словыми признаками, такими, например, как длина периметра, количество черных точек в разных областях или вдоль различ­ных направлений и т. п. (рис. 4.7, в). Весьма популярен у разра­ботчиков OCR-систем. В определенных условиях способен рабо­тать почти так же быстро, как растровый. Точность работы при­знакового классификатора во многом зависит от качества признаков, выбранных для каждого символа. Под качеством признаков в данном случае понимается их способность макси­мально точно, но без избыточной информации охарактеризовать начертание буквы.

Структурный классификатор. Первоначально был создан и использовался для распознавания рукописного текста, однако в последнее время применяется и для обработки печатных доку­ментов. Этот классификатор проводит структурный анатиз сим­вола, раскладывая последний на элементарные составляющие (отрезки, дуги, окружности, точки) и формируя точную схему анализируемого знака (рис. 4.7, г).

Затем полученная схема (структурное описание буквы) срав­нивается с эталоном. Этот классификатор работает медленнее


КАЛAAAАЛАААAAAАА в АААПAAAAААААПЛАА

ААААаааааааааааА

б



 

 


  120.7S0 1,112 0,081 5,187  
  1.000 1.008 0.008 0.013  
  242.750 11.140 -6.001 0.039  
ч ю.ооо 0.3SS 0,051 4.150  
  -24.ООО -0, 244 -0.001 0.089  
е 0.003 0.000 0.5 8? 11.345  
j г.еэо 0.088 0.013 1,318 )..............
s 1S2.2S0 0.059 -0.332 22,545  
  е. 60s 0.080 0.080 0.000  
IS -128.750 -0.831 -0.338 23.014  
ИТОГО = 6S "> й Сзоб. член - е.ess rz::::::::: ПроТОКОИ СЫЧИСПения ПриОНЗКОО:

■::::::::: РезуПЫйТЫ; Выёр&кзди вариант: й
в

 

 


Рис. 4.7. Распознавание символов: а — растровые эталоны буквы «А»; б — контурные эталонов буквы «А»: в — изображение буквы для признакового классификатора, опре­деляющего определенные признаки (например, количество серого в какой-либо точке буквы); г — пример обучения структурного классификатора (заметен «скелет» буквы «А»); д — пример работы признаково-дифференциального классификатора. Чтобы верно выбрать одну из похожих букв («D» и «О»), классификатор вычисляет признак (наклон линии в ключевой зоне); е — пример работы структурно-дифференциального классификатора — чтобы выбрать одну из похожих букв (сочетание «Л» и «А»), срав­нивается структура букв, обращая особое внимание на внешний профиль

растрового и признакового, но отличается высокой точностью. Более того, он способен «мысленно» восстанавливать не пропе­чатанные или залитые символы.

Признаков!)-дифференциальный классификатор. Предназначен для различения похожих друг на друга объектов, таких, напри­мер, как буква «т» и сочетание «гп». Принципиальное отличие этого классификатора от описанных выше заключается в том, что он не анализирует все изображение. Дифференциальный классификатор обращается только к тем частям объекта, где мо­жет находиться ключ к правильному ответу. В случае с «ш» и «гп» ключом служит наличие и ширина разрыва в месте касания предполагаемых букв. Признаково-дифференциатьный класси­фикатор используется во многих системах распознавания симво­лов (рис. 4.7, д).

Структурно-дифференциальный классификатор. Аналогичен структурному; был разработан и первоначально применялся для обработки рукописных текстов. Как и признаково-дифференци- альный, этот классификатор решает задачи различения похожих объектов, но работает на порядок точнее (за счет анализа струк­туры) и способен «узнавать» искаженные знаки (рис. 4.7, е).

В самых общих чертах процесс обработки символа выглядит так: растровый и признаковый классификаторы анализируют изображение и выдвигают несколько гипотез относительно того, какая буква им представлена. Следует заметить, что при выдвижении каждой гипотезе присваивается определенная оценка (так называемый вес гипотезы). В результате работы растрового и признакового классификаторов система получает список гипотез, отсортированный по весу (т. е. по степени уве­ренности).

Затем, в соответствии с принципами IPA, FineReader при­ступает к целенаправленной проверке имеющихся гипотез с помощью дифференциального признакового классификатора. В тех случаях, когда требуется различить два похожих симво­ла (например, «I» и «1»), к анализу подключается дифферен­циальный структурный классификатор. В самых трудных си­туациях задействуют структурный классификатор. Построив полную схему распознаваемого знака и проанализировав ее на предмет наличия ключевых элементов структуры, этот класси­фикатор изменяет веса гипотез в соответствии с результатами своей работы.



Поделиться:


Последнее изменение этой страницы: 2017-02-22; просмотров: 243; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.222.119.148 (0.006 с.)