ПРИНЦИПЫ РАБОТЫ ЧИТАЮЩИХ АВТОМАТОВ



Мы поможем в написании ваших работ!


Мы поможем в написании ваших работ!



Мы поможем в написании ваших работ!


ЗНАЕТЕ ЛИ ВЫ?

ПРИНЦИПЫ РАБОТЫ ЧИТАЮЩИХ АВТОМАТОВ



Устройства автоматического ввода, или читающие автоматы (ЧА), предназначаются для ввода (в. ЭВМ, в канал связи) текстовой информации с первичного документа. При этом текстовая информация на первичном .документе представляется последовательностью алфавитно-цифровых символов, напечатанных или написанных от руки на исходном носителе - обычно листах бумаги. Такая форма представления информации пригодна для чтения человеком. Последовательности символов располагаются в виде строк параллельно одной из кромок листа. Различие коэффициентов отражения света от участков бумаги, содержащих символ, и от чистых участков фона лежит в основе оптического способа восприятия информации ЧА. Устройства автоматического ввода, использующие оптический способ восприятия, называются оптическими читающими автоматами (ОЧА). Существует также магнитный способ восприятия изображений символов, имеющихся на первичном документе. Знаки наносятся на носитель специальными магнитными чернилами, которые обладают необходимыми оптическими свойствами для восприятия символа человеком но одновременно имеют магнитную проницаемость, существенно отличающуюся от магнитной проницаемости чистой бумаги. Это позволяет воспринимать информацию, об изображении символов с помощью специальных магнитных головок (МГ); устройства, реализующие этот способ, называются магнитными читающими автоматами (МЧА).

Читающие автоматы, ориентированные на специальные шрифты, находят все более широкое применение > торговле, в почтовой связи и в банковском деле.

Принцип автоматического чтения текстовой информации. Задача ЧА состоит в последовательном распознавании и кодировании каждого символа первичного документа для последующей передачи полученного кода непосредственно в ЭВМ или фиксации на промежуточном носителе. Для решения этой задачи в ЧА должны) быть реализованы следующие функции:

1) осмотр и восприятие изображения, в процессе которых вырабатывается электрический сигнал, соответствующий графическому начертанию вводимого символа

2) выделение существенных признаков и составлением описания воспринятого изображения символа;

3) распознавание символа, в процессе которого описание воспринятого изображения вводимого символам сравнивается с описаниями эталонов и принимается решение относительно соответствия символа тому или иному эталону.

В процессе осмотра (оптического или магнитного)" изображения символа осуществляется его <дискретизация>. Для этого формируется развертка, при которой все поле изображения символа как бы покрывается прямоугольной сеткой. Размер ячеек сетки определяется используемыми кодами и разрешающей способностью узла считывания ЧА. Каждой ячейке ставится в соответствие некоторое число, характеризующее интенсивность отраженного от данной ячейки света или значение сигнала от магнитной головки. В простейшем случае могут быть использованы всего два уровня, обозначаемые О (участок фона) и 1 (ячейка, приходящаяся на элемент изображения). Опрос ячеек сетки производится в фиксированном порядке, и поэтому получаемая совокупность чисел характеризует воспринимаемые изображения, т. е. является первоначальным описанием. При осмотре изображения -необходимо выполнять ряд вспомогательных операций, таких, как захват документа, отделение его от других документов, перемещение в позицию осмотра, а также выравнивание строки документа относительно направления развертки и другие операции. Все операции, связанные с перемещением документов, выполняются механическими- узлами ЧА.

Первичное описание изображения символа составляется в процессе его восприятия, когда каждой клетке сетки ставится в соответствие некоторое число, характеризующее ее яркость. Однако объем информации в таком -описании чрезмерно велик, и оно неудобно для обработки Поэтому" возникает необходимость во вторичном описании," т. е. выделении из первичного описания ряда более информативных вторичных признаков. К их числу относят геометрические и топологические признаки. Примерами геометрических признаков могут служить прямой вертикальный* штрих в изображении символа (например, в букве Н), дуга с выпуклостью вправо или влево (например, в изображении цифр 9 или 6). штрих над или под строкой (например, в изображении букв - р или Ь). Примерами топологических признаков могут служить замкнутые контуры различной связности, узлы различной кратности и т. д. Так, изображение буквы О характеризуется контуром нулевой связности, .цифры 8- контуром первой связности из-за наличия пересечения, в изображении буквы А можно выделить два узла первой кратности (нижние концы), узел второй кратности (вершина) и два узла третьей кратности (точки соединения с горизонтальным штрихом). Вторичные признаки должны выбираться так, чтобы описание изображения символа однозначно его определяло и было по возможности инвариантным к размерам и ориентации символа, а также нечувствительным к небольшим полиграфическим дефектам.

Полученному описанию изображения ставится в соответствие код символа из системы кодов, принятой в ЭВМ. В памяти ЧА хранятся эталонные описания всех распознаваемых устройством символов; каждому эталонному описанию однозначно соответствует стандартный код одного символа алфавита, являющийся как бы именем эталонного описания. В процессе распознавания вычисляются меры сходства введенного описания каждому эталону и принимается решение о принадлежности вводимого символа эталону, для которого эта мера оказалась максимальной. Последовательность логических л вычислительных операций над описаниями вводимых символов и эталонными описаниями, в результате которой описанию изображения ставится в соответствие один из эталонов, называется алгоритмом распознавания, который может быть реализован как программно- аппаратными средствами ЧА, так и программными средствами ЦП.

Из-за помех (типографские дефекты, плохое качество бумаги) полного совпадения описания вводимого символа и одного из эталонных описаний обычно не происходит. Если значение меры сходства для одного из эталонов значительно выше, чем для остальных, то вводимому символу приписывается код - имя данного эталона.' Если значения меры сходства для двух или нескольких эталонов совпадают или различаются незначительно, то ЧА оказывается неспособным распознать предъявленный ему символ. По этим причинам ЧА принято характеризовать:

• вероятностью (частотой) ошибок распознавания, т.е. Относительным числом неправильных решений;.

• вероятностью (частотой) отказов от распознавания, т.е. относительным числом символов, для которых ЧА Не находит нужного соответствия эталону.

Специальные шрифты для ЧА. Вид шрифта определяется областью использования ЧА. Выделяют кодированные, стилизованные и нормализованные шрифты. В кодированных шрифтах знаки представляют собой различные комбинации точек, или штрихов, наличие или отсутствие которых и является признаками для составления описания. Обычно алфавит кодированных шрифтов ограничен десятичными цифрами. Наиболее распространены штриховые коды, используемые, в частности, в системах автоматизированной продажи и учета товаров (на складах, в магазинах).

Одним из наиболее распространенных, кроме цифр почтового индекса, является стилизованный шрифт (РОС-А. Первичное описание символа составляется в соответствии со значением сигнала, получаемого при отражении света от отдельных элементов прямоугольной сетки; вторичное описание представляет собой набор структурных признаков: наличие или отсутствие вертикального, горизонтального или наклонного штриха или их взаимное расположение.

Нормализованные шрифты предназначены для нанесения изображении символов от руки в строго определенных местах специально отведенного прямоугольника. Прямоугольники предварительно печатаются на бланке документа тонкими или цветными линиями, которые не воспринимаются фотодетекторами при автоматическом считывании. Примером стилизованного шрифта может служить шрифт для нанесения почтового индекса. Суть нормализованного шрифта - свободное рисование цифр внутри очерченного прямоугольника.

 



Последнее изменение этой страницы: 2016-12-12; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.215.77.193 (0.005 с.)