Система оптического распознавания FineReader (FR) 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Система оптического распознавания FineReader (FR)



FR предназначена для автоматизации ввода в ПК типографских документов. Работает в среде Windows. Обеспечивает распознавание до 99,6% символов. Время обработке 1-й страницы < 1 мин.

Главное окно системы (как и все WS - приложения) включает управляющее меню, инструментальные панели и рабочее поле.

Работа в FR выполняется в три этапа: сканирование, распознавание, редактирование.

Сканирование выполняется при физически и программно установленном сканере, регистрация которого в системе выполняется через пункт Сервис /Опции /Сканер.

Для качественности распознавания перед началом работы в диалоговом окне установки сканера (пункт Scаn&Read) задаются необходимые параметры: тип изображения, формат, ориентация, разрешение и яркость.

Выполнение сканирования производится по команде: пункт Scаn&Read/Сканирование.

После завершения процесса в рабочем окне появляются окна: "Изобра-жение", "Крупный план" и "Текст". Полученный файл для дальнейшей обработки необходимо сохранить в формате FRF (пункт Файл/Сохранить как...).

Распознавание, т.е. формирование системой истинного образа документа, включает настройку системы на документ, разбиение документа на блоки и распознавание блоков. Настройка заключается в задании параметров распознавания (язык текста, тип и расположение) в диалоговых окнах Сервис/Опции/Распознавание и Сервис/Опции/Страница.

Разбиение документа на блоки (текстовые, табличные и т.д.), т.е. зоны, ограниченные рамками с соответствующей нумерацией выполняется автоматически или вручную командами пункта Редактор/Выделить блоки.

Распознавание разделенного на блоки документа выполняется командой Scаn & Read/Распознавание.

Во время распознавания обработанная часть выделяется цветом в окне "Изображение", а после окончания появляется окно "Текст" с содержанием документа.

Редактирование документа включает корректировку, орфографический контроль и сохранение текста. Корректировка выполняется для первичного уточнения текста командами пункта Редактор, т.е. средствами встроенного текстового редактора.

Проверка орфографии производится с помощью встроенной в FR системы Lingvo Corrector, которая позволяет находить ошибки и неуверенно распознанные слова, корректировать ненужные пробелы и т.п. Эта операция выполняется через пункт Сервис/Орфография.

Сохранение документа (пункт Файл/Сохранить как...) может быть выполнено:

для текстовых блоков - в форматах ТХТ, RTF;

для таблиц и форм - в форматах CSV, DBF, XLS.

К дополнительным возможностям FR можно отнести:

1.Обучение системы распознанию "плохих" текстов.

При хорошем полиграфическом качестве документа используется режим омнифонт (см. Сервис/Опции/Распознавание), в котором каждый символ автоматически сравнивается с имеющимся в базе данных образцами.

При некачественности сканируемого документа используется распознавание с обучением (включается соответствующий флаг в окне "Сервис/Опции/Распознавание"). При этом пользователь, просматривая документ, выделяет плохо различимые символы и объявляет их названия системе, которая использует их при дальнейшей работе.

2. Режим пакетной обработки.

Используется при вводе больших объемов однотипных документов практически без участия пользователя. Реализуется со сканером, имеющим механизм автоподачи страниц. Включается кнопкой Scan&Read на ИП. Этот режим очень удобен для подготовки табличных файлов перед вводом их в БД.

3. Распознавание форм.

Обеспечивает ввод переменной информации с однотипных документов.

Здесь блоки делятся на реперные (нераспознаваемые) и распознаваемые, затем формируется шаблон:

Фамилия  
Группа  
Факультет  
Год поступления  

 

Набор подобных форм обрабатывается в пакетном режиме и результаты распознавания передаются в БД.

4. FR может быть встроен в интегрированный пакет Stylus Lingvo Office, реализующий законченную технологию обработки иностранных текстов: распознавание, перевод, проверка орфографии, что обеспечивает получение готового документа на необходимом языке.

 



Поделиться:


Последнее изменение этой страницы: 2017-02-10; просмотров: 323; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 52.14.240.178 (0.006 с.)