Визначення мови та її функцій. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Визначення мови та її функцій.



Лекція 1

Визначення мови та її функцій.

Напрямки дослідження мови.

Розуміння терміну «прикладна лінгвістика».

Методи прикладної лінгвістики.

 

Напрямки дослідження мови.

Лінгвістика – академічна дисципліна, яка має справу (вивчає) мову взагалі.

Лінгвістика у широкому розумінні слова (пізнання мови та передача результатів цього пізнання іншим людям) поділяється на:

§ теоретичну лінгвістику: наукова, передбачає побудову лінгвістичних теорій;

§ прикладна лінгвістика: спеціалізується на вирішенні практичних завдань, пов'язаних з вивченням мови, а також на практичному використанні лінгвістичної теорії в інших областях.

Теоретична лінгвістика

Теоретична лінгвістика досліджує мовні закони та формулює їх як теорії. Вона акумулює та ставить під сумнів висновки щодо мови. Наприклад, піддає сумніву та перевіряє, що мова:

1) є системою;

2) керується певними правилами;

3) базується на підсвідомих знаннях;

4) має компоненти: фонологію, синтаксис та семантику.

Кожне з цих тверджень може бути перевіреним, підтвердженим або запереченим. Це – інтерпретація фактів, а не самі факти. Завдання: зрозуміти те, за чим вони спостерігають та пояснити чому людська мова є тим, чим вона є. Для цього створюються моделі мови (графічні портрети структури мов).

Вона буває:

емпіричною (декскриптивною): описує реальне мовлення, цікавиться мовною поведінкою та знаннями людей через те, що вони говорять і як вони це роблять. У дескриптивній лінгвістицінемає поняття правильно-неправильно;

нормативною (прескриптивною, регулятивною): вказує, як «потрібно» говорити і писати, визначає стандартний варіант мови для функціонування у головних сферах життя держави: освіта, уряд, торгівля, право, спілкування між людьми, розділеними великими відстанями, з великими культурними відмінностями та відстанню у часі. Функціонує через створення граматик, словників та підручників зі стилю.

Таким чином теоретичні лінгвісти намагаються сформулювати загальні положення про те, що можливо і що неможливо стосовно мов. Вони визначають загальні принципи, які керують мовою. Також теоретичні лінгвісти визначають принципи деяких під дисциплін у межах лінгвістики: фонетика, фонологія, морфологія, синтаксис, семантика, прагматика, дискурсивний аналіз.

 

Прикладна лінгвістика напрям у лінгвістиці, який опрацьовує методи розв’язання практичних завдань, пов’язаних із використанням мови і зорієнтований на задоволення суспільних потреб.

3.   Розуміння терміну «прикладна лінгвістика». Покликання прикладної лінгвістики та напрями її досліджень.

Прикладна лінгвістика є повноправним розділом мовознавства, спрямованим на розв'язання практичних завдань різних галузей науки й техніки, повсякденного життя людини, суспільства на підставі теоретичного доробку досліджень мови й мовлення.

Об'єктом прикладної лінгвістики є практичні завдання, для розв'язання яких потрібно залучення доробку мовознавства, а предметом - способи їхнього розв'язання.

Як самостійна лінгвістична дисципліна прикладна лінгвістика виокремилася у другій половині XX ст., хоч завдання прикладного характеру (приміром, створення алфавітів, систем письма, орфографії, різних словників і довідників, транслітераційних і транскрипційних систем, навчання іноземній мові, тлумачення й коментування текстів, перекладу тощо) мовознавство вирішувало ще з давніх-давен.

Термін «прикладна лінгвістика» з'явився наприкінці 20-х p. p. XX ст. (в англомовній традиції термін «applied linguistics)), як вважають, почав використовуватися у другій половині 50-х p. p.). У 1956 році в університеті Единбурга було відкрито школу прикладної лінгвістики під керівництвом Дж. Кетфорда, а у 1957 році у Вашингтоні було засновано Центр прикладної лінгвістики під керівництвом Ч. Фергюсона. Ці дві установи відрізнялися спектром завдань, але головною метою обох було поширення навчання англійській мові по всьому світу. Сьогодні англо-американська прикладна лінгвістика набула нових дослідницьких векторів, зокрема, розробки проблем мовної політики, мовного планування, лексикографії, мовної терапії, білінгвізму та полілінгвізму, методики викладання іноземних мов, застосування мовних особливостей у сфері судочинства тощо. Деякі мовознавці залучають до прикладних лінгвістичних досліджень проблеми стилістики, генристики, аналізу дискурсу, перекладу, соціолінгвістики, конверсаційного аналізу і т. ін. [Grabe, Kaplan 1992]. Англійською мовою виходять періодичні наукові журнали «Прикладна лінгвістика», «Міжнародний журнал прикладної лінгвістики», «Щорічний огляд із прикладної лінгвістики», «Міжнародний огляд прикладної лінгвістики».

У СРСР термін «прикладна лінгвістика» почав широко використовуватися із 50-х p.p. XX століття, що насамперед пов'язувалося не з методикою викладання мови, як це було на початку становлення прикладної лінгвістики в зарубіжному мовознавстві, а з розробкою комп'ютерних технологій, зокрема, автоматизованих систем інформаційного пошуку, обробки тексту тощо.

В англо-американській лінгвістичній енциклопедії зазначено, що, можливо, немає такої сфери гуманітарних і суспільних наук, яка б викликала стільки дискусій, як прикладна лінгвістика [The Linguistic encyclopedia 2004, 22]. Дискусійними є питання статусу прикладної лінгвістики як окремої мовознавчої галузі, наявності в цій дисципліні теоретичного компонента, розмежування прикладних і неприкладних лінгвістичних досліджень, співвідношення між прикладним мовознавством і комп'ютерною лінгвістикою, перекладознавством, методикою викладання мови, соціо- та психолінгвістикою тощо.

Існують різні підходи до розгляду співвідношення лінгвістичних галузей і прикладного мовознавства.Чимало дослідників протиставляють теоретичну лінгвістику прикладній на підставі використання комп'ютерних технологій. Представники різних країн (представник Единбурзької школи X. Відовсон, українська дослідниця Н. Бардіна, росіяни А. Баранов, Б. Городецький, І. Арнольд) включають різноманітні дослідження до сфер прикладної лінгвістики: переклад (його теорія та практика), методику викладання іноземних мов лінгводидактику, психолінгвістику, термінознавство, соціолінгвістику, лексикографію, практичну стилістику, теорію штучних мов, прикладну риторику, теорію масової комунікації, текстологію, нормування мови й мовне планування, польову лінгвістику, теорію писемності, методи лікування мовних дефектів тощо.

Такі розбіжності у тлумаченні прикладного мовознавства зумовлюють висновок про те, що його сфера залишається нечіткою через невизначеність межі між теоретичним і прикладним аспектами мовознавчих досліджень, а також через загальну тенденцію сучасної лінгвістики до експансіонізму, який виявляється як у вторгненні до лінгвістичних студій знань різних галузей науки, так й у використанні мовознавчого доробку щодо інших галузей знань.

Прикладна лінгвістика не є широкою науковою програмою, «парасольковою» галуззю, як когнітивна наука або комунікативна лінгвістика, не є вона й маргінальною галуззю, як психолінгвістика, соціолінгвістика, - прикладне мовознавство є унікальною лінгвістичною дисципліною, інструментом множинної інтеграції мовознавства й різноманітних галузей науки й техніки. Це визначає широкий спектр напрямів прикладних досліджень лінгвістики.

З функціональної точки зору прикладна лінгвістика – наукова дисципліна, в якій вивчаються і розробляються способи оптимізації функціонування мови.

Комунікативна функція:

- теорія перекладу;

- машинний переклад;

- теорія і практика викладання рідної та нерідної мови;

- теорія та практика інформаційно-пошукових систем;

- створення інформаційних та штучних мов;

- теорії кодування.

Соціальна функція (частина комунікативної функції):

- соціолінгвістика;

- мовне планування та політика;

- орфографія та орфоепія;

- теорія впливу;

- політична лінгвістика.

Епістемна функція:

- лексикографія;

- термінологія та термінографія;

- корпусна та польова лінгвістика.

Когнітивна функція:

- комп’ютерна лінгвістика;

- лінгвістична кримінологія;

- психолінгвістика;

- квантативна лінгвістика.

Дискусійною проблемою є розмежування прикладної й комп'ютерної лінгвістики, що через майже одночасне їхнє становлення та спільне спрямування на розв'язання прикладних задач спершу ототожнювалися.

 

4) Методи прикладної лінгвістики.

Кожна конкретна прикладна дисципліна має свій унікальний набір методів:

квантативна лінгвістика – використовує кількісні (простий підрахунок частоти вживання мовних одиниць) та статистичні (використання різних формул для виявлення правил розподілу мовних одиниць у мовленні, для виміру зв’язків між мовними елементами, для встановлення залежності між якісними та кількісними характеристиками мови) методи.

комп’ютерна лінгвістика – методи теорії програмування і представлення знань.

 


Лекція 2 -3

1. Оптимізація когнітивної функції мови.

2. Комп’ютерна лінгвістика.

3. Когнітивний інструментарій комп’ютерної лінгвістики.

4. Напрямки комп’ютерної лінгвістики.

 

Когнітивна функція мови – функція, в якій мова виступає як знаряддя пізнання світу, за допомогою якого формуються поняття, усвідомлюються логіко-понятійні зв’язки між поняттями, вербалізуються ситуації.

Комп’ютерна лінгвістика (computational linguistics) – є маргінальною галуззю мовознавства, спрямованою на розробку автоматизованих методів зберігання, обробки, переробки й використання лінгвістичних знань й інформації, репрезентованої знаками природної мови. Метою комп'ютерної лінгвістики є реконструкція знань про мову і в мові, яка б забезпечувала автоматизацію інтелектуальних функцій і когнітивної діяльності людини, автоматизоване породження мовлення та його комп'ютерну обробку й розпізнавання і т. ін. А. Баранов розглядає комп'ютерну лінгвістику як широку галузь використання комп'ютерних інструментів - програм, комп'ютерних технологій організації й обробки даних -для моделювання функціонування мови в тих чи інших ситуаціях, проблемних сферах, а також застосування комп'ютерних моделей мови не лише в лінгвістиці, а й у суміжних із нею дисциплінах. Лише в останньому розумінні мова йде про прикладну лінгвістику у строгому розумінні, оскільки комп'ютерне моделювання мови може розглядатися і як сфера теорії програмування в галузі лінгвістики [2003, 13]. Отже, комп'ютерна лінгвістика, як і прикладна, є мовознавчою дисципліною, що інтегрує різні наукові сфери, а її прикладний напрям визначає використання її доробку для розв'язання практичних завдань.

Комп'ютерна лінгвістика почала формуватися у 50-ті p. p. XX ст. на базі комп'ютерної науки, теорії інформації і структурно-математичної лінгвістики. Проте, як зазначають дослідники, прикладна лінгвістика перебуває з комп'ютерною лінгвістикою в різних епістемологічних площинах: комп'ютерна вказує на інструментарій досягнення наукового результату, а прикладна лінгвістика орієнтована на результат. В. Звегінцев ще у 1968 році зауважував: «Прикладну лінгвістику розуміють як усі види автоматичної обробки мовленнєвої інформації (Language-data Processing) - машинного розпізнавання усного мовлення, машинний переклад, автоматичну класифікацію технічних й ін. документів, автоматичне анотування текстів, автоматичне кодування тощо. Дійсно, автоматична обробка мовленнєвої інформації складає сьогодні головну дослідницьку проблематику прикладної лінгвістики [...]. Однак усе ж було б неправильним замикати прикладну лінгвістику в межах цієї проблематики» [1968, 24]. На наш погляд, комп'ютерна лінгвістика є настільки частиною прикладної лінгвістики, наскільки вона може розв'язувати конкретні завдання повсякденного життя людини й суспільства. Сьогодні не підлягає сумніву той факт, що широкий спектр проблем прикладної лінгвістики вирішується за допомогою ЕОМ. Однак, по-перше, існує чимало інших завдань прикладного характеру, які безпосередньо не застосовують комп'ютерних технологій, а, по-друге, комп'ютерна лінгвістика має власний об'єкт, мету й завдання й може постачати так само, як й інші мовознавчі дисципліни, свої технології й теоретичний доробок прикладній лінгвістиці як окремій галузі.

Становлення комп'ютерної лінгвістики пов'язане з появою терміна «штучний інтелект». Поштовхом для її формування стала дискусія, яка розгорнулася на той час із приводу так званого тесту, або критерію, англійського математика А. Тьюринга [Turing 1950]. Цей тест являв собою мисленнєвий експеримент із приводу питання про наявність інтелекту в комп'ютера. Експеримент передбачав розпізнавання людиною-інформантом співрозмовника (спочатку жінки чи чоловіка, згодом людини чи комп'ютера). Якщо таке розпізнавання є неможливим, а результати експерименту адекватні для ЕОМ і для людини, то їхній інтелект може бути ототожненим. Американський логік Дж. Сьорль висунув альтернативний принцип «китайської кімнати» (Chinese room), яким заперечив головний принцип тесту Тьюринга -наявність у ЕОМ інтелекту. Дж. Сьорль представив людину, яка не знає китайської мови, замкненою в кімнаті з китайськими ієрогліфами. За допомогою поданих їй зразків ця людина інтерпретує й породжує китайські фрази. Така людина є ілюстрацією комп'ютера із закладеною до нього програмою, але знань китайської мови вона не має. На захист критерію виступив у полеміці У. Рапапорт, який у 1988 р. запропонував принцип «корейської кімнати» (Korean room). Дослідник представив відомого корейського професора-шекспірознавця, який не володіє англійською, однак розбирається у творчості У. Шекспіра. Так само і в китайській кімнаті людина досягає певного розуміння законів китайської мови, якщо вона породжує й інтерпретує фрази цією мовою. Це розглядалося як свідчення можливості машини мислити й визначило головний дослідницький вектор комп'ютерної лінгвістики - прагнення до досягнення подібності між людською інтелектуальною діяльністю та комп'ютерним моделюванням.

Виокремлення комп'ютерної лінгвістики відбулося у 60-ті р. р. XX ст. Першими її лінгвістичними орієнтирами були розробки трансформаційного й дистрибутивного методів 3. Харриса, генеративна концепція Н. Хомського, формальні граматики генеративного типу, спроби машинного перекладу та створення інформаційно-пошукових систем і мов. Комп'ютерна лінгвістика суттєво вплинула на становлення когнітивної лінгвістики, на визначення нею головних принципів представлення мовно-мисленнєвої діяльності - когнітивізму та модуляризму - з огляду на комп'ютерну метафору цієї галузі. Інтелект із позицій когнітивізму розглядався як цілеспрямована діюча символьна система, а пам'ять як системно організована й символьно-конвенційна ієрархія знань. Розробка формального апарату цієї системи з метою його інтерпретації й обробки комп'ютером стала першочерговим завданням комп'ютерної лінгвістики на той час.

Когнітивний інструментарій комп’ютерної лінгвістики

Існують загальні принципи комп’ютерного моделювання мислення, які так чи інакше реалізуються в будь-якій комп’ютерній моделі. Вони формують так звану метамову комп’ютерної лінгвістики. В основі цієї мови лежить теорія знання. Основний тезис теорії знання – мислення – це процес обробки та породження знань.

Під знанням розуміємо певний тип інформації, який використовується як знаряддя для оптимального розв’язання інтелектуальних та мовних завдань у моделях інтелектуальної діяльності (прийняття рішень, експертні рекомендації, розуміння повідомлень, синтез відповідей у діалозі).

У якості «процесора», який обробляє знання виступає когнітивна система людини.

Види знання: декларативні (знання що…) – тлумачення слів у тлумачних словниках;

                        процедурні (знання як …) – послідовність (список) операцій, дій, які слід виконати: інструкція по використанню пристрою.

Декларативні знання – істина-неправда.

Процедурні знання – успішність-неуспішність алгоритму.

Для того, щоб знання можна було ефективно використовувати в системі, їх треба формалізувати. Для цього застосовується спеціальний математичний апарат.

В основі подання знання полягає логічна форма його вираження. У зв’зку з цим його елементарною одиницею можна вважати судження, або твердження. Сукупність тверджень про предмети, процеси, явища, що стосуються певної предметної області, утворює знання деякої системи. Для його подання зазвичай використовується апарат формальної логіки. Засоби подання знання, що базуються на застосуванні такого математичного апарату, називають логічними.

Останнім часом все більш поширеними стають засоби подання знань, що називаються семіотичними. Така назва пояснюється тим, що опис зовнішнього світу тут здійснюється за допомогою природної мови. Сюди ж відносяться семантичні сітки та фрейми.

Структури знань: фрейми, сценарії, плани.

Фрейм – структура, що репрезентує стереотипні ситуації у свідомості (пам’яті) людини або інтелектуальної системи і призначена для ідентифікації нової ситуації, що базується на такому ситуативному шаблоні.

Із теорією фреймів пов’язують імена американських вчених Марвіна Мінського (дослідник штучного інтелекту) та Чарльза Філлмора. Вперше поняття фрейма було введено у лінгвістичну науку у середині 1970-х років. Проте досі не визначено, хто з них вжив даний термін вперше. Зазначимо, що використання терміну «фрейм» (англ. frame – каркас, кістяк, будова, структура, система, рамка) дозволило Філлмору використовувати його як елемент опису семантики лексем, граматичних категорій та тексту, що стало значним внеском у розвиток лексичної семантики. Сам Філлмор визначав фрейм як будь-яку систему лінгвістичного вибору – найпростішого випадку сукупності слів, що керуються граматичними правилами, чи лінгвістичними категоріями – які можуть асоціюватись з типовими прикладами сценаріїв.

Важливою й не менш суперечливою є позиція вчених щодо структури фрейму. М. Мінський, наприклад, вважає, що фрейм можна представити у вигляді сітки, яка складається з вузлів та зв’язків між ними, що утворюють фреймову систему. «Верхні рівні» фрейму чітко визначені, оскільки утворені такими поняттями, які завжди правдиві по відношенню до очікуваних ситуацій. На «нижчих рівнях» є безліч вершин-терміналів чи «слотів», які повинні бути заповнені характерними прикладами або даними. Можна лише додати, що фрейм можна використовувати для аналізу знань різної природи та різного ступеню абстракції. Зосереджена у фреймі інформація може включати як вроджені, так і набуті знання, т ак само як і ключові елементи фрейму можуть бути наповнені інформацією з різних концептуальних площин – онтологічної (знання про матеріальний та духовний світи), аксіологічної й модальної (оцінка світу суб’єктом і модус його свідомості), лінгво-прагматичної (володіння канонами лінгвокомунікації).

Це означає, що тоді фрейм розглядався як сукупність лінгвістичного вибору, який асоціювався з так званими «сценаріями», поняттям, яке відноситься до сучасного терміну «ситуації». З лінгвістичної точки зору розуміння терміну «фрейм» пізніше змістилося у бік когнітивної науки. Це стає очевидним з подальших характеристик фрейму. У 1985 році Філлмор розглядає фрейм як «специфічні об’єднання структури знань, або логічні, послідовні схеми досвіду». Пізніше він бачить фрейм як «когнітивні структури знань, які мають на меті поняття, що кодується словами». З вище сказаного стає зрозумілим, що спершу фрейм розглядався як лінгвістична конструкція, пізніше отримавши когнітивну інтерпретацію.

Теорія фреймів Марвіна Мінського була опублікована у 1974 році й відразу набула широкого резонансу, викликавши зацікавленість таких лінгвістів як Р. Шенк, Р. Абельсон та вітчизняних дослідників Д.А. Поспєлова, Є.Н. Єфімова та Н.Н. Перцової.

За визначенням Мінського фрейм – ієрархічно впорядкована репрезентація певної стандартної ситуації дійсності. У своїй теорії Мінський відмовляється формувати модель зовнішнього світу на основі окремих, розрізнених фактів чи понять. Ключовим моментом його теорії є ствердження того, що будь-яка модель, яка відображає складні реалії світу, повинна будуватися увигляді великої сукупності певним чином сформованих даних – фреймів, що є моделями стереотипних, часто повторюваних ситуацій. Мінський розуміє ситуацію у суспільному сенсі, тобто це може бути дія, роздум, зоровий образ, розповідь і т.д. Фрейм представляє собою не одну конкретну ситуацію, а найбільш характерні, свідомі моменти цілої низки схожих ситуацій.

Важливим фактом даної теорії є те, що людина, намагаючись позначити для себе нову ситуацію, чи переглянути вже відомі їй речі, вибирає зі своєї пам’яті певну структуру даних (образ), який Мінський називає фреймом, з розрахунком зміни у ній окремих деталей, зробити її придатною для розуміння широкого класу процесів чи явищ. Фрейм є структурою даних для представлення стереотипних ситуацій. З кожним фреймом асоціюється інформація певних видів. Певна її частина вказує, яким чином повинен використовуватись даний фрейм, інша – що можна очікувати від його здійснення, і нарешті – що потрібно робити, якщо наші очікування не здійсняться.

У формальній нотації фрейм може бути представлений у вигляді таблиці:

 

Ім’я слоту Зміст слоту
   

 

або кортежу: 

{ (ім’я фрейму > < ім’я слоту1 > < значення слоту1 >…, < ім’я слотуn > < значеня слотуn >) }

Вважається, що в довгостроковій пам’яті людини зберігається великий набір різноманітних фреймів, що актуалізуються під час пред’явлення нових сцен. Для розпізнавання сцени в пам’яті людини має актуалізуватися саме той фрейм, що якнайбільше відповідає гіпотезі про об’єкт, який сприймається. У такий спосіб здійснюється ідентифікація об’єкта у свідомості людини.

Фрейм «кімната» має змоделювати здатність людини, що входить до кімнати, охопити все єдиним поглядом, скласти уявлення про те, що є у кімнаті, як розставлені меблі, скільки вікон…

Фрейм – декларативні значення.

У сучасному мовознавстві термін фрейм широко використовується, насамперед, коли йдеться про концептуальний аналіз. З точки зору концептуального аналізу, фрейм розглядається як один із способів «конвертування» інформації представленої в семантиці одиниць мови і мовлення. Поряд із фреймом використовують інші структуровані «пакети», такі як: пропозиції, сітки, схеми, схемати, плани, сценарії та скрипти. Незважаючи на велику кількість термінів, все ж можна прослідкувати загальну тенденцію: дослідники акцентують необхідність розгляду концептуальних структур як статичних, так і динамічних, тобто представити концепт в його потенції, чи реалізації. При цьому центральною структурою, яка тим чи іншим чином пов’язана з іншими моделями, залишається фрейм.

Найбільш поширені різновиди фреймів – сценарії та плани, або скрипти поведінки.

Сценарій – вперше введено Р. Шенком та Р. Абельсоном на поч. 70-х рр. Показують, як створюється сюжет, як зв’язуються між собою події з яких він складається.

Сценарій – формалізований опис стандартної послідовності фактів, подій або процедур, визначають типову ситуацію у певній предметній галузі.

До сценаріїв входять назва ситуації, імена учасників ситуації, перелік причин виникнення ситуації та набір сцен або певних дій. Сценарії визначаються як абстрактні, схематичні, ієрархічно організовані набори пропозицій, кінцеві позиції яких є незаповненими. Тому такі сценарії можна застосовувати до будь-яких ситуацій шляхом заповнення термінальних позицій конкретною інформацією. Плани служать для встановлення причино-наслідкових зв’язків між сценаріями (послідовність дій). Вони складаються зі сцен і сценаріїв, які ведуть до певної мети.

Сценарій «довідкове бюро». Мета: «отримання довідки».

Сцена 1. – «вхід»: увійти до помешкання,

                           підійти до вікна, де видають довідки,

                           взяти чистий бланк,

                           відійти до столу для відвідувачів,

                           сісти та приготуватися оформлювати документ.

Сцена 2. – «заповнення бланка документа»: підготувати ручку, послідовно заповнити графи.

Сцена 3. – «замовлення довідки»: підійти до довікового віконця,

                                                      простягнути заповнений бланк,

                                                      оплатити послугу.

Сцена 4. – «очікування замовлення довідки»…

Плани – засіб, за допомогою якого встановлюються причино-наслідкові зв’язки між сценаріями. План описує стандартну послідовність дій людини в тому чи іншому конкретному випадку.

Модель світу – сукупність певним чином організованих знань про світ, притаманних когнітивній системі чи її комп’ютерній моделі.

Прикладні напрями комп'ютерної лінгвістики

Сучасна комп'ютерна лінгвістика розв'язує широке коло завдань з удоско­налення комп'ютерних технологій моделювання мовної й комунікативної компетенції людини. У статті 1990 р. російський дослідник Ю. Городецький узагальнив три класи проблем комп'ютерної лінгвістики.

Перший об'єднує фундаментальні проблеми, пов'язані із представленням і моделюванням мовної системи, тезаурусів знань, із комп'ютерною репрезентацією граматики й рольової структури висловлень в автоматичних системах, із взаємодією вербаліки й невербаліки, мовних і фонових знань у комунікації, із метафоричним моделюванням та процесами розпізнавання повідомлень тощо.

Другий клас охоплює суто лінгвістичні проблеми штучного інтелекту: розпізнавання й синтез мовлення, тексту; розробка метамов і мов репрезентації знань, 648 лінгвістичних процесорів, здатних опрацьовувати тексти у стандартний спосіб для будь-якої системи перетворення мовної інформації; інтелектуальних інтерфейсів, баз даних, моделювання діалогу тощо.

До третього класу проблем відноситься лінгвістичне забезпечення різних прикладних систем: оброблення письмового тексту, автоматичного анотування (упорядкування стислих відомостей про документ), індексування (перекладу на інформаційно-пошукову мову), редагування (виправлення помилок) й реферування (стислого викладу змісту документа), перекладу, аналізу запитів користувача природною мовою до інформаційної системи, інтелектуальних машинних словників, машинних фондів мовних одиниць, інтелектуального інтерфейсу на базі природної мови, моделювання дослідницької лінгвістичної діяльності, автоматизованих робочих місць лінгвіста і т. ін. [1990].

 

Одним із головних прикладних напрямів комп'ютерної лінгвістики є автоматична обробка природної мови, що передбачає створення, перетворення й аналіз текстів із застосуванням природної або штучної (комп'ютерної) мов, результатом чого може бути формування машинних фондів національних мов, автоматичних словників, термінологічних банків, комп'ютерних картотек, баз даних, комп'ютерних граматик, багаторівневих лінгвістичних процесорів тощо. І. Штерн кваліфікує автоматичну обробку мови як «загал теоретичних і прикладних напрямків лінгвістики, зв'язаних із комп'ютерним опрацюванням текстів» і залучає до цього напряму дослідження та моделювання механізмів синтезу речень; створення моделей та систем автоматичного перекладу, автоматичного реферування, документального інформаційного пошуку, розуміння природної мови; створення лінгвістичних процесорів, систем автоматичного редагування орфографії, побудову машинних фондів національних мов, комп'ютерних граматик, автоматичних словників, термінологічних банків, лінгвістичних баз тощо [1998, 15]. Чимало з цих проблем оформилися у вигляді галузей прикладної лінгвістики на межі із традиційними мовознавчими дисциплінами, як-от: машинний переклад, корпусна лінгвістика, комп'ютерна лексикографія, комп'ютерне термінознавство тощо.

Перші спроби розробки теорії та прикладних систем автоматичної обробки природної мови відносять до 50-х р. р. XX ст. (США, Франція, ФРН, СРСР та ін.). Головними процедурами автоматичної обробки природної мови є автоматичний аналіз, синтез і перетворення текстів.

Автоматичний аналіз мовних структур визначається кінцевим результатом завдання й передбачає членування тексту на одиниці, доступні комп'ютерній лексикографічній обробці, виділення пошукових образів, ключових (опорних) слів, персоналій, термінів, присвоєння одиницям у складі речення граматичних характеристик, визначення семантичних і синтаксичних валентностей, місця у складі дерева залежностей, структурі безпосередніх складників, графі, семантичній сітці, фреймі, Семпі, Ситі і т. ін.; виокремлення фрагментів логіко-композиційної структури тексту та зв'язків між ними. Аналіз текстів є складовою операцією машинного перекладу з однієї мови на іншу, а також перетворення текстів природною мовою на мови програмування, комп'ютерні кодові системи.

Аналіз і синтез текстів здійснюється на базі лінгвістичних процесорів - програмно-лінгвістичних комплексів багаторівневого типу, орієнтованих на граматичний, семантичний або когнітивний аналіз, синтез і перетворення текстової інформації та діалог із користувачем. І. Штерн головною відмінністю сучасних лінгвістичних процесорів порівняно з попередніми системами обробки інформації вважає орієнтацію на семантичний аналіз текстової інформації, наявність у них семантичного блоку, що забезпечує вилучення смислу з тексту та подальше оперування смисловими одиницями [1998, 261]. Сучасні лінгвістичні процесори передбачають послідовне або паралельне оброблення рівнів вихідного тексту й доповнюються рівнем прагматичної компетенції, інформаційної репрезентації (фонових, енциклопедичних знань) й афективно-тематичними блоками (емоційними компонентами інформації). Процесори найсучаснішої генерації є когнітивними, що грунтуються на структурації знань і застосовуються для їхньої обробки, переробки й використання в різних предметних галузях. Цікавий проект когнітивного процесора розробляється в Казанському університеті О. Невзоровою. Він запрограмований накопичувати знання й самонавчатися граматиці природної мови на підставі верифікації гіпотез відносно явищ і категорій мови [1994].

Створення текстів відбувається у процесі автоматичного синтезу на підставі семантичного, синтаксичного й лексемно-морфологічного представлення вихідної інформації. Прикладом є комп'ютерна програма TALE, що моделює породження сюжету казки відповідно до концепції структурного аналізу чарівної казки В. Проппа [Гаазе-Рапопорт, Поспелов, Семенова 1980]. Програма має такі блоки: експозиції, у якому обирається тип сюжету, персонажі й початок казки; персонажів, що надає інформацію про героїв казки; їхні особистісні характеристики; і блоки локусів (казкових світів) та їхніх описів. Останній блок збирає фрагменти казки докупи. Американська дослідниця штучного інтелекту К. Маккьюін запропонувала схему синтезу тексту, що передбачає 4 головних схеми його аналізу: атрибутивну (attributive schema) - зразок приписування властивостей, якісних ознак різним об'єктам; конститутивну (constituency), яка зумовлює опис текстом об'єктів у термінах їхніх складників і різновидів; ідентифікаційну (identification), спрямовану на встановлення класу, до якого належать об'єкти, й контрастивну (contrastive), яка визначає негативну протилежність головного уявлення тексту. Така схема синтезу тексту має різні аналоги в інших теоріях текстопородження. Широко відомими є впроваджені у 80-ті р. р. сюжетно-породжувальні моделі афективних сюжетних одиниць (Affective Plot Units) В. Ленерт [Lehnert 1982], у яких сюжет формується на підставі послідовності емоційних станів героїв; сюжетні моделі X. Олкера, В. Ленерт і Д. Шнайдера, що реінтерпретують євангельські сюжети [Alker, Lehnert, Schneider 1985]. Кожна сюжетна одиниця представлена бінарним відношенням оцінок персонажами певних подій. Такі одиниці встановлюються на підставі сюжетної граматики Дж. Мандлера і Н. Джонсона.

Перетворення текстів здійснюється при автоматизованому редагуванні -внесенні виправлень і доповнень, форматуванні - членуванні тексту, уведенні заголовка, нумерації сторінок і т. ін.; при лексикографічній обробці - уведенні щодо кожного слова словникової дефініції й іншої потрібної інформації або підготовці на базі текстів автоматизованих лексикографічних систем (лематизації); реферуванні - скороченні вихідного тексту відповідно до програми.

Процедури аналізу, синтезу та перетворення текстів застосовуються в комп 'ютерних моделях розуміння мовних повідомлень. Залежно від механізму розуміння виокремлюються чотири типи таких моделей.

Перші ґрунтуються на діалогових кліше як реакціях на лексичні сигналізатори реплік людини,

другі - на шаблонах логічних каузальних зв'язків,

треті - на граматичному аналізі повідомлень, і лише

четверті - на змісті, установленому шляхом семантичного аналізу тексту чи повідомлення.

Таким чином, розробка систем розуміння мови відбувалася від найпростіших клішованих систем діалогу до найсучасніших лінгвістичних процесорів, головним блоком яких є семантичний або когнітивний. Моделями розуміння уважаються діалогові системи (ELIZA Дж. Вейценбаума, США, 1966 р.; ПОЕТ, АІСТ Е. Попова, Росія, 80-ті p. p.; STUDENT Д. Боброу, SEMANTIC MEMORY P. Куільяна, ДИСПЕТЧЕР A. Кібрика, ЗАПСІБ О. Нариньяні, TULIPS Г. Мальковського й ін.), системи мовленнєвого керування діями комп'ютера (SHRDLU Т. Винограда, США, кінець 60-х р. р.) і системи смислового аналізу тексту (LUNAR У. Вудса).

А. Баранов підсумовує результати діалогового спілкування з ЕОМ у відомому експерименті М. Макгайра (24 учасники вели діалог за допомогою телетайпа з комп'ютерною програмою ELIZA, із них 15 були впевнені, що розмовляють із людиною, 4 впевнені, що розмовляють з ЕОМ, а 5 мали сумніви при визначенні партнера по комунікації). Програма ELIZA була створена в середині 60-х р. р. американським дослідником Дж. Вейценбаумом як імітація бесіди між лікарем-психотерапевтом і пацієнткою й побудована на формально-структурних засадах. У цій програмі застосовані принципи рекурсивного зв'язку репліки з попередньою, ключових слів, перепитування, що виконують функцію підтримання контакту. Дослідник наводить чотири висновки як результати цього експерименту: 1) природний дискурс є надмірним і стійким до перешкод, тобто толерантним до збоїв та помилок; 2) пріоритет при спілкуванні мають метакомунікативні параметри, зокрема, інституційні процедури, статуси комунікантів, стандартні стратегії; 3) висновок про існування різних типів спілкування (наприклад, цільового й фатичного); 4) неуніверсальність правил комунікативної взаємодії [2003, 22­25]. Загалом, навіть поверховий аналіз демонструє, що програма не розуміє співрозмовника в точному сенсі: вона не має власної моделі світу, не будує в ній відображення уявлень / знань співрозмовника, не модифікує модель світу з кожним новим висловленням, не накопичує інформацію, хоч у неї є деякі аналоги короткочасної та довгочасної пам'яті [Баранов 2003, 22].

І. Штерн виділяє серед діалогових моделей чотири групи: у першій відсутній семантичний та логічний аналізатори (BASEBALL Дж. Карбонела, STUDENT Д. Боброу), друга представлена семантично-орієнтованими моделями (приміром, моделі Є. Попова [1982; 1987], М. Мальковського [1985], Р. Куільяна, у яких застосовується спрощений семантичний аналізатор); до третьої групи належать моделі з логічним аналізатором (SIR Б. Рафаеля), четверта група об'єднує мод



Поделиться:


Последнее изменение этой страницы: 2021-12-15; просмотров: 144; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.222.239.77 (0.059 с.)