Пошук тексту книги в електронному вигляді 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Пошук тексту книги в електронному вигляді



Після того як ви оберете тему проекту, для подальшої роботи вам знадобиться текст книги в електронному вигляді. Є кілька шляхів отримання такого тексту.

· Ви можете знайти його в мережі Інтернет за допомогою пошу­кової системи або в одній з електронних бібліотек, наприклад у бібліотеці Максима Мошкова, розташованій за адресою lib.ru.

· Якщо ви маєте паперовий варіант тексту, його можна скану­вати та розпізнати за допомогою пакета оптичного розпізна­вання тексту.

Пошук електронного тексту в мережі Інтернет можна здійснювати через веб-каталоги або пошукові системи за ключовими словами. Однією з найпопулярніших таких систем в Інтернеті є пошуко­ва система www.google.com. Це міжнародна система пошуку, яка надає можливість задати мову більшості країн світу. У країнах СНД популярності набули пошукові системи Яндекс (мллпллуапсіех. ги), Рамблер (www.rambler.ru), Апорт (www.aport.ru). Найбільша українська система пошуку — Мета (www.meta-ukraine.com.ua або www.meta.com.ua). Оберіть систему, яка вас найбільше влаштовує; якщо пошук буде невдалим, звертайтеся до інших пошукових систем.

1. Запустіть Internet Explorer, у рядку адреси введіть адресу пошукової системи і натисніть клавішу Enter. Коли заванта­житься відповідний сайт, виконайте пошук за ключовими словами.

2. Введіть у рядок пошуку назву обраної вами книги та прізви­ще автора і натисніть клавішу Enter або клацніть кнопку Шукати, що зазвичай розташована справа від рядка пошуку. В результаті ви отримаєте список сайтів, де зустрічаються слова, які ви ввели.

3. Послідовно відкриваючи посилання у списку, знайдіть сайт, на якому зберігається текст книжки, а не лише зустрічається її назва. Посилання на сайти, як правило, відображаються не всі одразу, а групами, по 10 посилань на сторінці.

4. Якщо вам не вдалося знайти текст книги на перших десяти сайтах, переходьте на наступні сторінки. Щоправда, практика свідчить: якщо об’єкт пошуку не знайдено на перших трьох сторінках посилань, необхідно змінити ключові слова для по­шуку. Наприклад, ви можете додати у рядок пошуку слова «текст» або «скачати» чи інші уточнюючі терміни і повтор­но задати пошук. Найкращий спосіб — ввести якусь фразу з книги (якщо існує її паперовий варіант).

Коли сайт з текстом книги знайдено, у вас з’являється можли­вість або скачати файл із текстом (зазвичай він зберігається у файловому архіві з розширенням гаг чи zip), або, якщо текст на­ведено на сайті, виділити його, скопіювати в буфер обміну та, відкривши програму Word, вставити до нового документа, після чого зберегти його на жорсткому диску.

Альтернативою загальним пошуковим системам може слугувати електронна бібліотека.

 

Усі етапи роботи розглядатимемо на прикладі книги Павла За- гребельного «Роксолана», що зберігається в бібліотеці Максима Мошкова за адресою http://www.lib.ru/SU/UKRAINA/ZAGREBEL_NIJ/ roksolan.txt. Ми завантажили її текст і зберегли в папці проекту.

Перетворення тексту формату TXT на текст формату Microsoft Word

Найчастіше тексти в мережі Інтернет зберігаються саме у цьому форматі, тому ми розглянемо його докладно. У разі відкриття такого файлу в програмі Word ви можете перейти у вікно вибору кодування. Справа в тому, що значна частина ТХТ-файлів, що зберігаються в мережі Інтернет, записана в кодуванні MS-DOS. Тому, якщо вікно вибору кодування відкрилося, потрібно вибра­ти саме це кодування. У текстовому полі в нижній частині вікна можна побачити початковий фрагмент тексту файлу. Якщо коду­вання обрано вірно, цей текст можна буде прочитати.

Текст у форматі TXT має такі особливості:

· для переходу до наступного рядка в ньому використовується клавіша Enter, що призводить до введення символу абзацу, тобто кожен рядок перетворюється на окремий абзац;

· замість довгого тире у тексті набрано знак дефісу;

· відступи абзаців утворені в результаті введення кількох сим­волів пробілу або символу табуляції;

· для вирівнювання тексту за шириною між словами може використовуватися не один, а два чи три символи пробілу;

· часто для вирівнювання тексту за шириною використовують­ся переноси, що у разі переведення тексту у формат Microsoft Word може призвести до спотворення слів або заважає фор­матуванню документа;

· у деяких текстах перед знаками пунктуації (крапкою, ко­мою, знаком оклику тощо) міститься символ пробілу, що є помилкою;

· можливі випадки, коли текст з обох боків виділено за допомо­гою символів підкреслення (_слово_), що означає курсивне написання, або за допомогою зірочок (*слово*), що означає напівжирний шрифт.

Більшість із перелічених проблем проілюстровано на рис. 2.3.

У процесі редагування необхідно позбутися всіх недоліків тексту в форматі TXT і забезпечити дотримання наведених далі правил.

Правила верстки тексту

· У тексті між словами має бути не більше одного символу пробілу.

· У абзаці не повинно бути коридорів, тобто пробілів між словами, розташованими один під одним у трьох і більше суміжних рядках.

· Абзацні відступи в усьому тексті мають бути однаковими.

· Останній рядок абзацу повинен бути довшим за абзацний відступ не менш ніж у 1,5 рази.

· Якщо набір виконується без абзацного відступу, останній рядок в абзаці повинен бути неповним.

· Довжина рядка має становити не більше 60-65 символів.

· Сторінка повинна містити 30-40 рядків.

· Нижня межа тексту на лівій сторінці розвороту книги має бути розташована нижче, ніж верхня межа тексту на правій його сторінці.

· Остання сторінка розділу (якщо розділи починаються з нової сторінки) повинна бути заповненою хоча б на третину.

Правила переносу слів

· Переноси, які спотворюють значення слова, не допуска­ються.

· Не можна переносити абревіатури, які пишуться велики­ми буквами, тобто абревіатури на зразок УНР, КПІ, МФО.

· Не можна розривати переносами такі скорочення, як «і т. д.», «і т. п.» та їм подібні.

· Не можна розривати переносами цифри, які складають одне число. За необхідності можна розривати числа, спо­лучені знаком тире (наприклад, 2008-2010, Х-ХІ ст.), але тире має залишитися в попередньому рядку.

· Відокремлювати ініціали від прізвищ небажано.

· Небажано відокремлювати від імен і прізвищ скорочені слова: проф. Петренко, доц. Іванов.

· Цифру з дужкою або крапкою не можна відокремлювати від наступного слова.

· Цифри небажано відокремлювати від наступних скороче­них слів і одиниць вимірювання.

· Не можна відокремлювати від наступних або попередніх цифр такі знаки, як «%», «№», «$» тощо.

· Небажано, щоб знаки переносу стояли більш ніж у трьох суміжних рядках.

· Не допустимо, щоб між знаком переносу і частиною слова був пробіл.

· Не допустимо, щоб рядок починався знаком переносу.

· Переносити знаки пунктуації не можна.



Поделиться:


Последнее изменение этой страницы: 2016-06-29; просмотров: 72; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.15.147.215 (0.011 с.)