Тема: . Сканирование и оцифровка печатных и графических текстов 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Тема: . Сканирование и оцифровка печатных и графических текстов



Цель: изучить технологию сканирования и оцифровки текстов

Время: 4 часа

Вопросы:

1. Конверсия печатного материала в электронный формат

2. Изготовление цифровых фото- или аудио-, видеодокументов

3. Оцифровка микрофильмов.

4. Сжатие данных (компрессия) и форматы оцифровки.

5. Оптическое распознавание букв.

 

Методика выполнения:

Конверсия печатного материала в электронный формат

Существует несколько синонимов для обозначения этого процесса: оцифровывание, оцифровка и даже по терминологии, принятой у связистов, — цифровизация. В английской литературе также используются два схожих термина и четыре способа их написания — digitization, digitizing, digitisation, digitising. Оцифровка чаше всего осуществляется путем сканирования печатных или рукописных материалов.

Изготовление цифровых фото- или аудио-, видеодокументов

Изготовление цифровых фото- или аудио-, видеодокументов осуществляется с помощью цифровых фотоаппаратов, видеокамер, других оптико-электронных технических средств. Этот процесс быстро находит массу приверженцев и, по сути, очень близок к сканированию: изображение разбивается на небольшие участки (пиксели), яркость и цвет которых фиксируется. Типичное число пикселей в современных аппаратах — несколько миллионов (от 1 до 7—8 млн пикселей на кадр). Сменное устройство памяти (memory stick) или память типа «flash» позволяет записать от 100 до нескольких тысяч кадров, которые впоследствии можно перенести на компьютер, обработать, послать по электронной почте друзьям или распечатать на принтере.

Обмен или предоставление своих услуг по публикации гостевых материалов. Этот процесс в чем-то близок к традиционному межбиблиотечному абонементу (МБА) или книгообмену.

Автоматическое производство переведенных с других языков материалов. Это очень интересная и перспективная отрасль автоматической обработки текстов. Фактически осуществляется многократная переработка печатного текста: конверсия в машиночитаемую форму, оптическое распознавание символов и автоматизированный перевод содержания.

Рассмотрим этот процесс подробнее.

Оптико-механическое считывающее устройство с точной фокусировкой начинает проходить над листом по горизонтальной строчке, останавливаясь для замеров по заранее заданной программе. При остановке измеряется коэффициент отражения данного маленького участка (пикселя): если задано считывание черно-белого материала, то это просто двоичный режим, при котором фиксируется черное/белое (или да/нет, или единица/ноль). При учете градации серого цвета или при сканировании цветных изображений фиксируются более сложные параметры. Шаг сканера между остановками для замеров называется пространственным разрешением. Завершив просмотр строчки, считывающая головка возвращается к началу строки, сдвигается на небольшой промежуток вниз, и процесс повторяется до конца листа. Интервал перемещения вниз также определяет величину пространственного разрешения. Количественно величина пространственного разрешения выражается в числе остановок (точек) на дюйм (dots per inch, dpi). Достаточно широко применяются 200, 300. 400... 1200 dpi, а в некоторых случаях используются различные параметры пространственного разрешения по горизонтали и по вертикали, и тогда запись выглядит, допустим, 600 х 1200 dpi. Если вспомнить, что дюйм — это 2,54 см, то типовое разрешение в 300 dpi означает пространственное разрешение лучше, чем 1/10 миллиметра.

В зависимости от назначения, требующейся производительности и приемлемой цены используются различные типы сканеров:

• планшетные сканеры для листа размером А4 — пожалуй, самые простые и недорогие (100—300 долларов), работают с единичным листовым материалом. В более сложных моделях используется автоподача листов, что в 2—3 раза увеличивает стоимость сканера;

• барабанные сканеры, которые удобнее для работы с большим количеством листового материала;

• планетарные сканеры предназначены для работы с переплетенными документами; специальное устройство (колыбель). в котором книга лежит не полностью открытой, позволяет обеспечивать сохранность редких изданий. Возникающая при этом кривизна поверхности книжного листа компенсируется специальной программой; при необходимости можно также «очищать» программными средствами отсканированное изображение от случайных загрязнений, имеющихся на оригинале. Другие меры по обеспечению сохранности печатного материала и защите оператора при сканировании состоят в компьютерном контроле уровня освещенности поверхности документа. Подобные сканеры, как правило, стоят 20—35 тыс. долларов;

• последнее время получили распространение большие сканеры со считывающей головкой, перемещающейся плоскопараллельно над документным столом; такие устройства хороши для сканирования карт, чертежей и других документов большого формата. Стоимость таких устройств вместе с программным обеспечением обработки изображений составляет около 30—45 тыс. долларов.

Задание №1

Изучить конструктивную схему книжных сканеров и их технические характеристики. Создать презентацию на тему «Книжные сканеры: устройство и технические характеристики».

Оцифровка микрофильмов

По поручению Немецкого научного общества (DFG) и при поддержке Европейской комиссии по сохранности и доступу группа ведущих специалистов Германии исследовала проблему «Как защищать ветхие (нестабильные) книги и архивные материалы — оцифровкой или микрофильмированием?».

Конверсия поврежденных, ветхих книг или архивных материалов является эффективным и экономичным способом обеспечения сохранности. Более того, в противовес стремлению просто сохранить или восстановить оригиналы перенос информации с носителя, находящегося в опасности, на не знающий старения носитель означает также обеспечение более широкого и удобного доступа.

Наиболее распространенным носителем в мире, обеспечивающим страховые копии библиотечных и архивных документов, является микрофильм. Микрофильмы имеют то преимущество, что они не подвергаются фундаментальным технологическим преобразованиям и тем самым являются устойчивыми по отношению к будущим переменам. Информация, хранящаяся в аналоговой форме, непосредственно (или с весьма небольшими дополнительными устройствами) доступна человеческому глазу. Усиливающаяся в национальных и международном масштабах стандартизация систем микрофильмирования обеспечивает возможность их применения, невзирая на границы между странами. Создание, дублирование и распространение микроформы стоит недорого, и в то же время микрофильм можно эффективно оцифровать с помощью соответствующих сканеров. Возможность экономичной оцифровки микрофильма позволяет считать его носителем с принципиально растущей совместимостью с требованиями к качеству.

По указанным выше причинам немецкие специалисты предлагают вначале микрофильмировать ветхие материалы, а затем делать оцифровку с микрофильма. Этот подход оправдан и с финансовой точки зрения, даже в том случае, если единственной целью оцифровки является обеспечение более высокого уровня доступа и обслуживания. И при этих обстоятельствах микрофильм как носитель для долговременного хранения, совместимый с любой другой средой, будет в течение длительного срока оправдывать средства, затраченные на его изготовление и обслуживание. Тем самым удастся избежать очень серьезных затрат, связанных с миграцией данных и частыми технологическими и организационными мерами по сохранению читаемости на новых системных платформах.

Задание № 2

Рассмотреть устройство сканеров и технические характеристики для оцифровки микрофильмов. Выработать рекомендации по сканированию печатного текста с графиками и схемами, рукописей, рисунков карандашом и пером, цветных репродукций, цветных диафильмов. Привести требования к компьютеру и программному обеспечению при сканировании вышеуказанных материалов. Результаты представить в виде доклада.



Поделиться:


Последнее изменение этой страницы: 2016-09-05; просмотров: 379; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.239.239.71 (0.007 с.)