Розробка текстових і табличних документів 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Розробка текстових і табличних документів

Поиск

 

Створення АЕІС супроводжується розробкою відповідних доку­ментів, комплектність яких установлена ми розглядали у розділі 3.3. Залежно від змісту документи також можемо поділити на кілька видів (табл. 14.1).

Таблиця 14.1 Види документів ІС

 

Вид документу Код документу Призначення документу
Відомість В Перерахування у систематизованому виг­ляді об'єктів, предметів і т. п.
Схема С Графічне зображення форм документів, частин, елементів системи і зв`язків між ними у вигляді умовних позначень
Інструкція І Викладення складу дій і правил їх виконання персоналом
Обгрунтування Б Виклад відомостей, що підтвержують доцільність прийнятих рішень
Опис П Пояснення призначення системи, її частин, принципів їх дій і умов застосування
Конструкторський документ   По ГОСТ 2.102
Програмний документ   По ГОСТ 19.101
Організаційно-розпорядні документи   Акти, накази, протоколи, плани, програми

 

Отже, стандарти вимагають підготовки величезної кількості текстових і графічних документів. Ці документи можемо розробляти по традиційній (ручна) технології або враховуючи велику трудомісткість цих робіт розробляти автоматизовано їх у САПР ІС.

Традиційна (ручна) технологія розробки проектних текстових до­кументів передбачає виконання операцій у такій послідовності.

1. Складання плану документа.

2. Підготовка чернеток документа в рукописі.

При цьому

2.1. Постійні частини документа з допомогою редактора беруть (або переклеюються) з аналогічних до­кументів або еталонів, що їх було оформлено раніше.

2.2. Результати розрахунків заносять у таблиці, форма яких стан­дартизована, раніше підготовлена і розмножена.

3. Оформлений з допомогою редактора (або рукописний) документ переглядається і коригується перевіряючою особою.

4. Передрук машинного (рукописного) документа здійснюється у необхідній кількісті примірників.

5. Виправлення помилок у машинописному доку­менті.

6. Складання і друкування змісту документа.

7. Перевірка оформленого машинописного документа відповідаль­ним виконавцем, керівником розробки й адміністрацією та внесення у разі необхідності правок.

8. Передрук окремих сторінок і розділів, зміна нумерації сторінок, переоформлення змісту документа.

Дана технологія розробки документів має недоліки і вони зумовлені:

1) неохайним оформлення рукописного документа, значна кількість виправлень і вставок, нерозбірливий почерк — усе це призводить до великої кількості помилок у машинописному тексті доку­мента;

2) помилки необхідно виправляти в усіх надрукованих примірни­ках;

3) якість оформлення документа значною мірою залежить від кваліфікації оператора;

4) якщо у документі в основному тексті трапляються фрази на іноземній мові, то друкувати одну і ту саму сторінку необхідно на двох машинках по черзі;

5) традиційна технологія вимагає значних затрат ручної праці на

а) рукописні та машинописні роботи;

6) пошук і підготовку шаблонів і прототипів;

в) перевірку і коригування документації;.

6) введення і використання листків змін у разі великої кількості виправлень, що вносяться, робить документ нерозбірливим і важким для читання.

Зберігання та обробку текстових документів традиційно забезпе­чують автоматизовані системи одного з таких класів:

СУБД;

інформаційно-пошукові системи;

документально-архівні системи.

СУБД за­безпечують зберігання, пошук і обробку згрупованих і по особливому зв'язаних даних. Доступ до даних організовується на основі ієрархіч­них мережевих або реляційних моделей даних.

ІПС забезпечують тривале зберігання документів; обробка здійс­нюється переважно на рівні груп документів. Пошук в ІПС вико­нується як за формальними атрибутами, так і за змістом (контекстний пошук). База даних в ІПС організовується як сукупність слабкозв'язаних файлів (файлів текстів, атрибутів).

Документально-архівні системи забезпечують оперативне введен­ня коригування і оновлення архівних документів; доступ - ієрархічний; операції виконуються переважно над одним документом.

Процеси підготовки та видачі всіх видів проектних документів у САПР ІС забезпечуються спеціальною підсистемою. Цю підсистему часто називають автоматизованою системою текстового документу­вання (АСТД).

АСТД призначена для автоматизації процесів ведення і виготов­лення проектної, конструкторської, організаційно-розпорядної та екс­плуатаційної документації.

Підсистема текстового документування має виконувати такі основні функції.

І. Зберігати в пам'яті ЕОМ структуру і текст еталона документа, його постійної і умовно постійної частин, прототипів і шаблонів,

2. Автоматично вносити зміни в текст документа, який розроб­ляється.

3. Забезпечувати розроблювачу можливість вносити зміни у план документа, задаючи, виключаючи, об'єднуючи окремі розділи доку­ментації, яку складають.

4. Використовувати один текст для видачі кількох документів, що відображують вихідну інформацію з різних боків.

5. Оформляти прийняті проектні рішення у вигляді таблиць зада­ної структури та форми.

6. Використовувати фрагменти одного й того самого тексту при складанні різних документів, роблячи автоматичну вставку відрізків тексту.

7. Скорочувати кількість слів тексту, що готується, введенням Ідентифікаторів найменувань і фраз, які часто зустрічаються.

8. Робити машинне роздрукування документації.

9. Створювати та вести архіви текстової проектної і програмної до­кументації на магнітних носіях.

10. Форматувати вихідний документ (нумерацію сторінок, автоматичне укладання змісту і списку таблиць, виконання граматичних пра­вил переносу, виділення абзаців і нових розділів, автоматичне форму­вання рамки, штампів, заголовків).

АСТД повинна дозволяти розробляти:

а) стандартизовані документи (ТЗ і ТЕО, обгрунтування розрахунків), що підлягають випуску в короткі терміни;

б) документи тривалого циклу виготовлення (програмна й експлуатаційна документація), що підлягають деталізації і частим змінам.

Технологія автоматизованої розробки текстових документів реалізується у два етапи.

Перший етап - підготовчий. На цьому етапі готується і створюється архів на магнітних дисках еталонних, постійних і умовно постій­них частин розроблюваних документів, їх прототипів, бланків для запитів.

У підготовлених документах виділяються і позначаються місці змінних фрагментів, вставок і результатів розрахунків. У кінцевому підсумку формується структура готового документа. Після цього робиться налагодження створеної бібліотеки постійних, умовнго постійних частин документів.

Другий етап — робочий. На цьому етапі здійснюється випуск тек­стових і табличних документів на основі створених архівів.

Змінні фрагменти вводяться проектувальником з екрана терміна­ла. Проектувальник вносить у бібліотечні розділи зміни, «вирізає», пе­реписує або дописує окремі частини документів.

Відредаговані фрагменти документа заносяться до бібліотеки. Далі проектувальник збирає в один текст різні частини з різних бібліотек. Зібраний текст проглядається на екрані термінала. Після перевірки і уточнення відбувається роздрукування остаточного варіанта тексту.

Збільшення кількості документів, пов'язаних як з процесами обміну інформацією, так і проектування вимагає залучення засобів об­числювальної техніки для складання і обробки документів. Це, в свою чергу, вимагає побудови формальних структур документів на базі ви­користання різних моделей документів.

Один з підходів полягає у побудові об'єктної моделі документа. Документ подається як об'єкт, складений у вигляді ієрархії примітивніших об'єктів.

Такими об'єктами є символ, слово, пропозиція, лан­цюжок символів, абзац, позначений фрагмент тексту, розділ (підроз­діл, пункт), документ в цілому.

Сформулюємо визначення зазначених об'єктів — елементів доку­мента.

Символ — елементарна одиниця тексту. Це будь-яка буква, цифра або Інший знак, який: можна ввести з клавіатури термінала або магнітного носія.

Слово - послідовність символів, відокремлена пробілами з обох боків. Наприклад: 837.081 або сторона або 1\#472.

Речення - послідовність слів, що закінчується крапкою, за якою йде принаймні один пробіл.

Ланцюжок символів - спеціально виділена сукупність слів, яка на відміну від слова, може мати всередині пробіли.

Абзац - група рядків тексту (одна або група пропозицій). відокремлена зверху або знизу проміжними рядками чи спеціально по­значена.

Позначений фрагмент тексту - спеціальна виділена сукупність ланцюжків символів або пропозицій тексту.

Розділ - спеціально виділений набір пропозицій тексту, що відділений одним або кількома порожніми рядками, і має унікальний ідентифікатор.

Великі документи складаються з дрібніших структурних одиниць: розділів, підрозділів, пунктів і підпунктів, які, у свою чергу, поді­ляються на абзаци, текстові фрагменти, пропозиції, ланцюжки сим­волів, слова, символи.

Беручи за основу визначення елементів документа, сформулюємо визначення логічної і геометричної моделей.

Логічна модель текстового документа — це сіткова або ієрархічна модель, що визначає вхід дрібніших структурних оди­ниць документа до структур вищих рівнів ієрархії.

Геометрична модель текстового документа — це мо­дель, що визначає розміщення текстового матеріалу на терміналах і друкувальник пристроях:

розміщення тексту на сторінці і в рядку;

виділення абзаців, розділів, підрозділів, пунктів і підпунктів, виділення окремих слів і фрагментів;

оформлення таблиць.

Відображення логічної моделі документа на його ге­ометричну модель називається алгоритмом формування текстових до­кументів.

Наступним кроком на шляху до формалізації документа є фор­малізація його змісту. Суть такої формалізації полягає у тому, щоб розбити кожний кінцевий компонент структури документа на елемен­ти, кожний з яких має нести певне смислове (семантичне) наванта­ження. При цьому розглядаються елементи трьох видів:

аї елементи, що мають відношення тільки до даного документа;

б) елементи, що повторюються у багатьох документах;

в) елементи, що повторюються кілька разів в одному документі. Елементи групи (в), у свою чергу, можуть поділятися на елементи

виду (а) або (б).

Таким чином, у пам'ять ПЕОМ заносяться І зберігаються шаблони документів, що містять у собі:

текстові елементи, що є унікальними для даного виду документа;

«порожні» елементи, що заповнює проектувальник для кожної конкретної версії документа даного виду;

посилання на елементи, що повторюються.

Перевага такого підходу полягає у натуральному поданні повно-текстового документа для розроблювача, а також у простоті зміни структури документа пря його реалізації.

Аналіз видів і типів документів ІС, вимог до їхнього змісту по­казує, що багатьом технічним документам на ІС властива наявність однакових розділів і підрозділів. Для багатьох розділів характерне дуб­лювання однойменних фрагментів тексту. Дублювання призво­дить до зростання трудомісткості розробки, збільшення обсягу робіт з підготовки технічної документації за рахунок:

1. Багаторазових описів одних і тих самих процедур обробки даних.

2. Багаторазового опису правил використання доку­ментів» порядку роботи фахівців.

3. Опису загальні правила експлуатації технічних і програмних засобів у різних документах.

При цьому зміст окремих компонентів документів не формалізо­вано. З іншого боку, у процесі підготовки проектної документації ви­конуються однотипні повторювані роботи з написання фрагментів тек­сту. Часто ці фрагменти бувають понаповнені копіями, а мають лише певну частку повторення.

Традиційним засобом автоматизації підготовки документів є тек­стові редактори і програми-форматизатори. Текстові редактори забез­печують автоматизоване введення, коригування, збереження і виве­дення текстових документів. Програми-форматизатори забезпечують правильне розміщення тексту і його елементів на друкованій сторінці, виділення заголовків, оформлення таблиць.

Проте, можливостей текстових редакторів виявляється недостатньо для автоматизації процесів, підготовки комплексів технічної документації на ІС.

Існують такі недоліки:

ї. Відсутня можливість автоматичного встановлення зв'язків між вікнами.

2. Відсутній апарат перехресних посилань між фрагментами текстів.

3. Функції з блоками тексту не виконуються автоматично.

4. Текстова база даних являс собою набір незв'язних текстових файлів.

5. Виділення і копіювання блоків тексту вручну - рутинна робота.

6. Неможливо подати документ у вигляді деякого структурованого щаблону.

7. Швидке коригування комплекту докуменації утруднене.

Проведений аналіз показує, що існуючі засоби автоматизації підготовки документації практично вичерпали можливості свого розвитку. Тому необхідний пошук і розвиток нових інформаційних технологій у цьому напрямку.

Так розрізняють чотири послідовні стадії написання тексту:

генерація ідей або думок;

організація (ідей або думок);

переведення думок у слова і речення;

редагування.

Друга стадія дуже важлива - при написанні тексту змістова організація і обробка плану займають близько двох третин усього часу. Розумові процеси, що проходять у голові автора моделюються у термінах семантичної сітки. У вузлах такої сітки знаходяться судження (думки).

У подальшому осмисленні автором своєї задачі сітка зорганізовуеться в ієрархічну структуру.

Дослідження показують, що візуалізація, винесення назовні цих розумових сіткових структур і можливість маніпулювати ними допомагають авторові краще справлятися з другою стадією написання тексту. Причому це дозволяє поєднувати другу та третю стадії.

Потім на чергу стає проблема лінеаризації сітки, формування з неї вузлів змістової послідовності. Це проблема, яка стосується вже не рівня слів, а понять.

Стратегії лінеаризації, перекладені в інструкції для комп'ютера, на сьогодні є не вирішеною науковою проблемою.

Наведена модель процесу підготовки текстової документації ба­зується на поняттях системи, структури, елементів, зв'язків. Але з цього не випливає, що проблема упорядкованого викладу думок і рішень. Необхідно створити систему, здатну допомогти кожному, ко­му треба з досить великої сукупності окремо записаних думок, вислов­лювань, фактів, ілюстрацій утворити послідовність, зрозумілу як ціле.

Існують підходи до рішення даної проблеми у перспективних інформаційних технологіях.

Технологія гіпертексту

Перспективу розвитку будь-якої нової інформаційної технології визначає ЇЇ відповідність загальним тенденціям розвитку. Такою тен­денцією в інформатиці є відмова від жорстких «системних» методів та ієрархічної організації систем даних і знань. Однією з нових техно­логій, що знаходяться на початкових етапах свого розвитку є гіпертекстова технологія. Сформулюємо визначення гіпертексту як основи нової гіпертекстової технології.

Гіпертекст — це спеціальна форма (різновид) елект­ронного документа, в якому:

інформація зберігається у сітковій структурі, кожний вузол якої містить фрагмент документа або будь-який набір елементів даних;

доступ до інформації здійснюється шляхом інтерактивного пере­гляду і вибору зв'язків для переходу до наступних вузлів.

У понятті «гіпертекст» (hурег — над) знаходять відображення наче б то два зміста. По-перше, гіпертекст — деяка одиниця інформації, частинами якої є тексти. По-друге, говорячи про гіпертекст, розуміємо текст, частини якого мають «надзв'язки», тобто з'єднані один з одним безліччю різних відношень, що представлені у багатовимірному про­сторі. (У звичайному тексті окремі його частини з'єднані лінійним відношенням прямування.)

Якщо вузли містять не тільки текстову, а й графічну, звукову, відеоінформацію або комбінації цих видів інформації, то така форма подання Інформації в ЕОМ називається гіпермедіа.

У найзагальнішому вигляді гіпертекст можна визначити як СУБД, що дозволяє користувачеві поєднувати асоціативними зв'язками інформацію, яка відображується на екрані, і здійснювати прямий (не­послідовний) доступ до зв'язаних між собою окремих записів тексту. Вузли у гіпертекстовій базі даних являють собою структурні одиниці тексту (аналогічно електронним карткам у каталозі) на відміну від за­писів у звичайних БД.

У таких системах доступ до інформації здійснюється шляхом інтерактивного перегляду і вибору зв'язків для переходу до наступних вузлів. Тому у гіпертекстових системах важливим компонентом є структурний редактор для інтерактивного зв'язування вузлів, мо­дифікацій або додавання зв'язкін між вузлами.

Зв'язки встановлюються виходячи з вимог зручного та швидкого доступу до інформації. Використовується, як правило, два типи зв'яз­ків - посильні та ієрархічні. З використанням ієрархічних зв'язків вузли організовуються у структури на основі принципу підпорядко­ваності «предок - нащадок». Посильні зв'язки слугують для зв'язу­вання одержаних структур.

Оргнізація доступу до інформації в гіпертекстових системах може бути забезпечена одним з таких трьох способів:

у початкових вузлах гіпертексту розміщується коротка таблиця змісту;

для перегляду інформації приймається спеціальна програма;

проводиться індексація вузлів інформації і пошук здійснюється за вказаними індексами.

Традиційні найпростіші операції, що їх виконує проектувальник, працюючи з базою даних - пошук, перегляд, виведення документів. У гіпертекстовій системі ці операції набувають статусу пізнавальних аналітичних операцій зі смисловим змістом документів. Наступний фрагмент користувач вибирає на основі професіонального аналізу змісту поточного фрагмента. У разі необхідності користувач-проекту­вальник може породжувати нову асоціацію, яка потім приводить до конкретних дій за вибором наступних фрагментів.

1987 року розробники з Університету Північної Кароліни (США) представили систему WЕ (А Wгіtіпg Епvігопmепt fог Ргоfеssіопаls).

В основу моделі системи WЕ покладено таку ідею: читання і пись­мо розглядаються як симетричні в цілому процеси, які у своїх стадіях змінюють їх за взаємопротилежною черговістю.

Виходячи з цього на екрані системи користувачеві пропонується два головних вікна, а саме:

візуалізація мережі (сітки) для підтримки ранньої стадії створен­ня тексту ("мозкового штурму");

вікна ієрархій для подальшої концептуальної організації.

У третьому вікні користувач може редагувати текстові начерки у вузлах сітки.

Зберігання, змінювання і пошук вузлів і зв'язків сітки здійсню­ються у реляційній базі даних. Для запитів до реляційноЇ БД виді­ляється четверте вікно.

Система WЕ орієнтована на створення науково-технічних текстів.

Лабораторією «Сіменс» (Відень) розроблена система Нуреr Аuthог. В основу системи покладено підтримку трьох фаз авторського процесу:

ІДЕЇ,

ПЛАН,

ТЕКСТ.

У першій фазі система забезпечує збирання ідей, які коротко за­писуються у вузлах. Змістові асоціації ідей фіксуються у вигляді гіпертекстових зв'язків, тобто будується неформальна база знань.

Далі система дозволяє надати одержаній сітці ієрархічну органі­зацію. Для цього структура проблемної сфери упорядковується від «за­гального до окремого» (таксономією). Таксономія зберігається у ма­шині і розглядається як засіб навігації створеної сітки.

У другій фазі документ проходить більш конкретне планування, яке не обов'язково повторює базову таксономію. При цьому сукупність ідей, що утворюють «базу знань»» перетворюється на лінійний ланцю­жок блоків, які підлягають заповненню текстом.

У третій фазі відбувається заповнення блоків текстом.

Система Нурег Аuthог побудована як додаток до комерційної гіпер-текстової системи Нурег Shell.

Зростаючі вимоги проектувальників, конструкторів, аналітиків до можливостей автоматизованих систем підготовки документації вже нині виходять за межі можливостей суто гіпертекстових систем. Так, перелік вимог до систем автоматизованого проектування може вклю­чати такі положення:

зберігання текстових і географічних документів;

можливість додавання s виключення документів;

автоматичне виділення ключових слів у тексті;

пошук документів за ключовими словами і за змістом документа;

перехід від текстового або графічного документа до зв'язаних з ним інших документів;

зв'язок документів з цифровими даними, побудова діаграм графіч­них документів.

ГІпертекстова система забезпечує легкість переходу від одного до­кумента до іншого. Але залишається ряд невирішених питань:

вручну роблять посилання у документах (відсутнє автоматичне індексування);

засоби пошуку дозволяють знаходити тільки такі слова і словоспо­лучення, які точно збігаються;

прив'язка до баз даних відсутня.

Для реалізації зазначених вимог s усунення недоліків в існуючих системах роботи з документами за рубежем стали створювати системи нового класу — системи «text management systems» ("системи уп­равління документацією"), в яких поєдналися різноманітні методи зберігання та обробки інформації.

У загальному випадку системи управління документацією забез­печують таке:

звичайний логічний пошук інформації за ключовими словами;

деякі системи дозволяють проводити пошук за зразком, який містить, крім букв, спеціальні символи (wilcards), наприклад «?» або «*»;

найбільш розвинені системи забезпечують пошук не лише задано­го слова, але і його синонімів або зв'язаних з ним за змістом слів;

групи слів і синонімів знаходяться у словниках системи;

під час пошуку слів усі системи використовують індекс. Індекси можуть вказувати лише ім'я документа або файла, який його утримує, або зберігати також місцезнаходження слова у тексті;

користувач може вказувати, які слова не слід включати в індекс.

Системи управління документацією знаходять все ширше застосу­вання. Про це свідчить, наприклад, той факт, що 1992 року в США на персональних комп'ютерах працювало від 80 до 100 тисяч таких систем.

 

Контрольні запитання

1. Рівні управління проектуванням інформаційних систем

2. Склад тимчасового колективу по розробці інформаційних систем

3. Контур управління

4. Види документів та їхнє призначення.

5. Охарактеризуйте операції традиційної (ручної) розробки проек­тної документації.

6. Які Існують способи автоматизованого зберігання і обробки тек­стових документів?

7. Основні функції АСТД.

 



Поделиться:


Последнее изменение этой страницы: 2016-06-26; просмотров: 566; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.21.12.122 (0.017 с.)