Тема: Возможности систем распознавания текстов. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Тема: Возможности систем распознавания текстов.

Поиск

Цель. Изучить возможности и порядок работы с программой распознавания текста FineReader.

Оборудование: ЛВС, персональный компьютер, среда MS Word, программа FineReader.

 

Краткая теория

FineReader - это система оптического распознавания текстов (OCR), которая преобразует полученное с помощью сканера графическое изображение (картинку) в текст (т. е. в коды букв, «понятные» системе).

Процесс ввода текстов в компьютер осуществляется в несколько этапов: сканирование; выделение блоков на изображении; распознавание; проверка ошибок; сохранение результата распознавания (передача его в другое приложение, в буфер и т. п.).

Программа Fine Reader выпускается отечественной компанией ABBYY Software (www.bitsoft.ru). Эта программа предназначена для распознавания текстов на русском, английском, немецком, украинском, французском и многих других языках, а также для распознавания смешанных двуязычных текстов.

Программа имеет ряд удобных возможностей. Она позволяет объединять сканирование и распознавание в одну операцию, рабо­тать с пакетами документов (или с многостраничными докумен­тами) и с бланками. Программу можно обучать для повышения качества распознавания неудачно напечатанных текстов или сложных шрифтов. Она позволяет редактировать распознанный текст и проверять его орфографию.

Fine Reader работает с разными моделями сканеров. В частности, Программа поддерживает стандарт TWAIN.

 

Порядок выполнения работы

 

1. Выполните сканирование предложенного Вам документа и сохраните его в папке «…. Группа» на Рабочем столе центрального компьютера.

2. Скопируйте папку «…. Группа» в Общую папку на центральном компьютере.

3. По локальной сети откройте эту папку на вашем компьютере. Скопируйте свой документ в свою папку.

4. Запустите программу FineReade r (Пуск – Программы)

5. В окне FineReader выполнитекоманду Файл – Открыть изображение, найдите свой документ и откройте его в окне программы FineReader.

6. Выберите язык для распознавания документа.

7. Выполните распознавание графического файла, сегментируйте текстовые блоки, таблицы и рисунки.

8. Выполните проверку отсканированного документа. Ошибки исправляйте в окне Текст или в диалоговом окне Проверка.

9. Сохраните отсканированный документ в формате Word.

10. Задайте параметры страниц документа (вкладка Разметка страницы – группа Параметры страницы): ориентация альбомная, левое поле 1,5 см, правое 1,5 см, верхнее 3см, нижнее 2 см., расстановка переносов Автоматическая. Параметры абзацев: выравнивание по ширине, отступ первой строки 1,5см, интервал перед абзацем 6пт, интервал между строчками 1,15. Для картинки используйте команду Обтекание текстом – по контуру.

11. В верхний колонтитул запишите дату и номер работы. В нижний колонтитул запишите виши фамилию, имя и группу. В готовый документ запишите тему и цель работы.

12. Выведите готовый документ на печать.

 

Контрольные вопросы

1. Перечислите основные элементы окна программы Fine Reader.

2. Дайте понятие сегментации изображения.

3. Как выполняется настройка операций, выполняемых программой Fine Reader?

 


 

 

Практическая работа №21. Использование систем проверки орфографии и грамматики.
  1. Цель работы: выработать практические навыки использования систем проверки орфографии и грамматики.     2. Оборудование, приборы, аппаратура, материалы: персональный компьютер, текстовый процессор MS Word.   3. Краткие теоретические сведения. Проверка орфографии Одним из важных качеств текста является отсутствие грамматических ошибок. Грамматические ошибки в тексте могут возникнуть, во-первых, по незнанию человека, во-вторых, в результате опечатки при наборе текста. Для устранения грамматических ошибок в среду Word встроена автоматизированная система проверки правописания. Основу этой системы составляет база данных — вариантов написания русских и английских слов, и база знаний — правил грамматики. Эта система сверяет каждое написанное слово с базой данных, а также анализирует правильность написания словосочетаний и предложений (согласованность падежей, расстановку запятых и т. д.). При обнаружении ошибок система выдает подсказку и в некоторых случаях — варианты исправления ошибок. Эта система является примером системы искусственного интеллекта. По умолчанию Microsoft Word проверяет орфографию и грамматику автоматически при вводе текста, выделяя возможные орфографические ошибки красной волнистой линией, а возможные грамматические ошибки — зеленой волнистой линией. Система проверки орфографии по умолчанию включена всегда. Исправлять ошибки можно по мере ввода текста, а можно провести проверку сразу во всем тексте по окончании ввода. Для исправления ошибки по мере ввода щелкните правой кнопкой мыши на тексте, подчеркнутом волнистой зеленой или красной линией, а затем выберите предложенный вариант или соответствующую команду в контекстном меню. При исправлении орфографической ошибки в контекстном меню часто предлагаются слова, близкие по написанию. Но лучше осуществить проверку правописания сразу во всем тексте по окончании ввода. Это существенно сэкономит время. Следует заметить, что не всегда слово, подчеркнутое красной линией, написано неправильно. Вполне возможно, что это какой-нибудь специальный термин, которого нет в словаре. Очень часто подчеркиваются имена собственные, а также составные лова (например, «автотекст», «автозамена» и пр.), которые также отсутствуют в базе данных приложения. Если слово написано правильно, но подчеркнуто красной линией, можно добавить его в пользовательский словарь, и больше не будет выделяться подчеркиванием. Если в результате опечатки получается слово, имеющееся в словаре, то программа проверки орфографии его не пометит, например, если вместо слова «кот» написано слово «кто» или вместо слова «парта» написано слово «пара». Чтобы устранить такие ситуации, следует внимательно перечитать текст самому или, что еще лучше, попросить об этом другого человека. Автозамена и Автотекст Для автоматизации ввода и исправления текста в среде Word существуют инструменты Автозамена и Автотекст. Бывает, что при вводе текста с клавиатуры вместо нужной клавиши нажимается соседняя или две буквы нажимаются в обратном порядке. Инструмент Автозамена имеет встроенный словарь наиболее типичных опечаток и ошибочных написаний. При обнаружении таких опечаток слово автоматически заменяется на правильное. Словарь автозамены можно пополнять. Практически у каждого пользователя есть свои особенности набора и «индивидуальные» опечатки и ошибки. Если в процессе набора вы ввели слово с опечаткой, то можно не только исправить его, но и включить в словарь автозамен. Для этого в контекстном меню следует выбрать команду Автозамена. Инструменты Автотекст и Автозамена можно использовать для быстрого ввода стандартных фраз по нескольким первым буквам. Инструмент Автотекст содержит список фраз длиной до 32 символов, которые среда автоматически предлагает вставить, когда набраны первые несколько букв. Эти фразы можно выбирать из списка элементов автотекста. Кроме того, в этом списке содержатся элементы для вставки служебной информации, которая, как правило, вставляется в колонтитул, например имя автора, дата создания, дата печати, имя файла. Иногда ошибки в словах исправляются без выделения и предупреждения, несмотря на то, что они не записаны в словарь автозамен. Это происходит в тех случаях, когда есть только один вариант исправления слова, например, в причастиях и прилагательных с двойными согласными («вызванный», «переданный», «деревянный» и пр.), или если вместо одной буквы написаны одинаковые буквы подряд («теекст», «слуучай»).   4. Задание   Задание 1. Опишите основные команды MS Word, позволяющие проверить правописание текста, и действия, которые нужно сделать для проверки.   Задание 2. 1. 1. Подберите фрагмент текста из истории города Рославля (3 листа формата А4, шрифт - 14 пт, абзац - 1,5), внесите в него ошибки различного типа – орфографические, грамматические, пунктуационные, стилистические и т.п. Сохраните файл с ошибками в вашей папке на Рабочем столе в папке ПР13 под именем ПР13_1.doc. 2. Проверьте правописание этого фрагмента средствами MS Word. 3. Убедитесь, что Word находит и выделяет ошибки, исправьте ошибки в процессе ввода текста с помощью контекстного меню. 4. Убедитесь, что при вводе текста в нем автоматически появляются переносы слов по слогам. Сохраните этот файл в вашей папке на Рабочем столе в папке ПР13 под именем ПР13_2.doc.   Задание 3. Наберите следующие слова, нажмите пробел и проследите за исправлениями: пРИМЕР, напирмер, нелзя.   Задание 4. Для проверки Автозамены наберите следующие слова в 1),2),3) пунктах, достаточно набрать несколько символов, пока не появится все слово и нажать ENTER, в 4),5) пунктах набрать полностью и нажать пробел. 1. 1. Текущую дату (ДД.ММ.ГГГГ) 2. Пятница 3. Апрель 4. ПРимер 5. НОМЕР   В файле ПР13_2.doc сделайте подпись (используя автозамену) текущей даты.   5. Содержание отчета   Отчет должен содержать: 1. 1. Название работы. 2. Цель работы. 3. Задание и его решение. 4. Ответы на контрольные вопросы. 5. Вывод по работе.   6. Контрольные вопросы     1. Каковы возможности MS Word для проверки ошибок различного рода в текстовых документах? 2. Каков порядок проверки орфографии и грамматики в MS Word? 3. Для каких целей нужны функции автозамены и автотекста?    







 

 

Практическая работа №22



Поделиться:


Последнее изменение этой страницы: 2019-12-14; просмотров: 972; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.118.30.153 (0.008 с.)