Проблема розуміння текстових повідомлень у системах автоматичної обробки інформації 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Проблема розуміння текстових повідомлень у системах автоматичної обробки інформації



 

Інтелектуалізація процесів АОІ загалом і АР зокрема передбачає моделювання процесу розуміння текстової інформації. Існує окремий напрям у науці, що отримав назву «когнітологія» (cognitive science) [47], який досліджує проблеми розуміння.

 

Проблема розуміння текстової інформації має давню історію. Вона є логічним продовженням проблеми розуміння взагалі і розв’язується по-різному

в різних галузях знань. Міждисциплінарний характер даної проблеми зумовлює існування безлічі різних підходів до неї. Найбільш поширеними підходами до розуміння є [48]:

 

розуміння як декодування;

 

розуміння як переклад на «внутрішню мову»;

 

розуміння як інтерпретація;

 

розуміння як результат пояснення;

 

розуміння як оцінка;

 

розуміння як осягнення унікального;

 

розуміння як побудова мислених моделей.

 

Складність самого об’єкта й ізольованість різних наук одна від одної пояснюють ту різноманітність підходів до даного питання, яка існує сьогодні. Єдине, з чим згодні всі дослідники без винятку, це те, що проблема актуальна,

і пошук її розв’язання необхідний.

 

У проблемі розуміння виділяють три групи теорій [49]:

 

об’єктні

 

суб’єкт-об’єктні

 

суб’єктні.

 

У теоріях першої групи розуміння прирівнюється до свого об’єкта і, відповідно, переважає структурно-семантичний аналіз. У суб’єкт-об’єктних теоріях до синтаксично-семантичного аналізу додається опис психологічних процесів під час створення й аналізу мовного знака (прагмалінгвістичний опис).

Теорії, що входять до третьої групи, акцентують увагу на оцінці реципієнтом результатів розуміння. Об’єкт розуміння обирається відповідно до завдання

та варіюється від слова, різноманітних видів тексту до ситуації.

 

Прикладна лінгвістика також не залишається осторонь від проблеми розуміння. Дослідники в даній галузі схильні погодитися тут з низкою філософів, які вважають, що «основними процедурами розуміння є тлумачення – переклад у зміст, формування змісту повідомлення» [50] або «розуміння тексту можна розглядати як процес розв’язання, головним завданням якого є з’ясування змісту тексту» [51], і постійно роблять спроби формалізації змісту мовних висловлювань, текстових повідомлень і моделювання процесу розуміння мови для задоволення зростаючих потреб комп’ютерних технологій, що стрімко розвиваються. Розуміння тексту можна розглядати як одну з проблем «чорної шухляди»: на вході маємо текст, усередині шухляди відбувається «розуміння», а на виході отримуємо деякі відомості, почерпнуті з тексту [17]. Ідеальна модель розуміння, необхідна, наприклад, для систем автоматичного реферування і машинного перекладу, має враховувати складну ієрархію якісно різних видів розуміння: раціонального, моторного, образного, мовного і психологічного. Це означає, що така модель у будь-якому випадку має «антропологічний» (людський) характер [52] і ставиться в безпосередню залежність від самого феномена людини. «…Світ розуміння – це передусім світ людини, світ, неможливий без людини…» [53, c. 223]. Зрозуміти, наприклад, текст – означає відкрити і засвоїти його зміст (смисл), пережити той духовний стан, в якому перебував автор

у момент його створення.

 

Складність полягає ще й у тому, що смисл, який приписується об’єктам розуміння, кожна людина черпає зі свого, суто особистого внутрішнього світу, так званого «індивідуального смислового контексту» [54, c. 92], який можна представити як систему взаємопов’язаних смислових одиниць, зміст яких визначений їх зв’язками з іншими одиницями і ставленням до індивідуального Я. Але це, швидше, об’єкт досліджень психолінгвістів, соціолінгвістів і філософів. Філософи, до речі, мають досить чітке визначення ролі мови у світі.

Не тільки світ є світом остільки, оскільки він отримує мовне вираження, але й справжнє буття мови в тому тільки і полягає, що в ньому виражається світ.

Дане Х.-Г. Гадамером бачення співвідношення «світ – мова» можна проілюструвати таким чином [55]:

Рис. 1.1. Співвідношення «світ – мова» (за Х.-Г. Гадамером)

 

 

А значить, світ є тим цілим, з яким співвіднесений схематизований мовою досвід [56, c. 59].

 

Поки що вчені ставлять перед собою завдання навчити машину «розуміти» настільки, щоб зробити її максимально ефективним помічником людини.

 

Яке б широке значення не вкладалося в уявлення про те, що таке «розуміння мови», очевидно, необхідною умовою розуміння є виведення з тексту його безпосереднього, буквального смислу, тобто тієї сукупності значень, яка передається суто мовними засобами. Питання ж «що таке смисл» виділяється

в окрему проблему, яка давно є об’єктом дослідження багатьох учених у різних галузях науки.

 

Для формування такого смислу необхідно мати у своєму розпорядженні смисли всіх одиниць мови й уміти поєднувати ці смисли в єдину картину. Обидва ці аспекти перебувають у колі лінгвістичної семантики. Якщо значення окремих слів вивчають – кожна зі свого боку – лексична і граматична семантики, то поєднання цих значень у сукупне значення всього речення на основі його синтаксичної структури описує синтаксична семантика.

 

Семантична складова слова і його граматичних категорій були об’єктами уваги вчених на початкових кроках формування лінгвістичного знання. Більш або менш адекватне уявлення про семантичну сторону речення є результатом діяльності дослідників другої половини ХХ сторіччя. Сьогодні зростає інтерес до історії розвитку лінгвістичної думки взагалі і формування лінгвістичної семантики зокрема. Сам термін «семантика» ніколи не відрізнявся чіткістю змісту. Різні автори давали щодо нього суперечливі визначення: «Семантика – це вивчення смислу» [57], «Семантика – це вивчення смислу слів» [58], «Семантика – це вивчення смислу слів, речень і висловлювань» [59], «…об’єктом семантики є смисл» [60], «галузь семантики – вивчення відношення знака до десигнанта (або сигніфіката)» [61, c. 133]. Визначення семантики як «вивчення смислу» навряд чи можна назвати загальним, адже сам термін «смисл» усвідомлюється по-різному. Однак очевидним є те, що «…семантика – це явище такої складності, яку навіть важко собі у явити» [62, c. 38].

 

В історії семантики слід виділити три основні етапи:

 

порівняльно-історична семантика (1883–1931): історія значення окремих слів;

 

співіснування лексичної і структурної семантики (1931–1963): історія змін у лексиці та питання структурної організації лексики;

 

моделювання і формалізація мови (з 1963р.): побудова семантичних моделей.

 

Третій етап можна назвати «революційним», оскільки саме в той період відбувалися кардинальні зміни, що привели до появи безлічі різноманітних семантик: формальної, операційної, аксіоматичної, аргументативної тощо. Це зумовлено впровадженням інформатики та комп’ютерних досліджень і вимагає від прикладної лінгвістики розробки логіко-операційних моделей значення, що передбачають його програмування. Нові напрями зводяться до двох класів:

 

а) семантичні теорії речення-висловлювання;

 

б) прагматичні теорії смислу висловлювання.

 

Якщо прийняти те, що семантика являє собою діяльність, яка полягає

в роз’ясненні смислу людського висловлювання, то метою її є виявлення думки, прихованої за зовнішньою формою мови. А це можливо далеко не завжди. «Мова переодягає думки. І притому так, що за зовнішньою формою цього одягу не можна здогадатися про форму перевдягнутої думки, бо зовнішня форма одягу створюється зовсім не для того, щоб виявляти форму тіла»

[63, c. 44]. Тому цілком зрозуміла наявність кардинальних розбіжностей між представниками різних напрямів у дослідженнях семантики, а відсутність загальноприйнятої, єдиної думки робить будь-які нові спроби вивчення питань семантики для людино-машинних систем вельми актуальними.

 

У сучасних підходах до розв’язання основних питань семантики можна визначити певний конфлікт між теоретиками комунікації-інтенції та теоретиками формальної лінгвістики. Спробуємо стисло сформулювати основні позиції і тих, і інших.

 

Представники формальної семантики (Г. Фреге, Б. Расселл, Дж. Остін) вважають, що:

 

смисл речення детермінований умовами його істинності;

 

завданням умов істинності є спосіб надання значення реченню;

 

синтаксичні й семантичні правила спільно детермінують значення всіх речень мови за допомогою детермінації умов їх істинності (це не стосується наказових і питальних речень);

 

правила, що детермінують значення речень мови, є тими правилами, що визначають, яке переконання конвенціонально висловлюється тією людиною, яка за даних контекстуальних умов вимовляє те або інше речення. Встановити, яким є переконання, – означає з’ясувати, яке твердження висловлено.

 

Представники теорії комунікації-інтенції (наприклад, Р. Карнап) вважають, що:

 

конкретні значення слів і речень зумовлені правилом або домовленістю, загальну природу яких можна зрозуміти лише за допомогою поняття комунікації-інтенції;

 

поняття комунікації-інтенції не опирається на поняття лінгвістичного значення;

 

значення речення є синтаксичною функцією значень його частин

і їх розташування;

 

система семантичних і синтаксичних правил, які детермінують значення речень, не є системою правил для комунікації;

 

первинні комунікації-інтенції дають поштовх для виникнення обмеженої конвенціональної системи значень, яка створить можливість свого власного збагачення і розвитку.

 

Однак представники обох сторін погоджуються з думкою щодо таких положень:

 

Значення речень мови значною мірою детерміноване семантичними

і синтаксичними правилами або узгодженнями цієї мови.

 

Члени будь-якого співтовариства людей можуть впливати на переконання, схильності та поведінку один одного завдяки володінню загальною лінгвістичною компетенцією.

 

Люди, які спілкуються за допомогою мови, змушені звертати увагу

на конвенціональні значення речень, що вимовляються ними.

 

Наведемо приклади конкретних теорій представників обох сторін.

 

У логіко-семантичній теорії Г. Фреге, представника формальної семантики, семантика визначається так: «Власна назва (слово, знак, комбінація знаків, висловлювання) виражає свій смисл і заступає або означає свій денотат»

[64, c. 19]. Поняття смислу, на його думку, має більш фундаментальний статус, ніж поняття референції. Назви можуть не мати денотатів, але не володіти смислом вони не можуть. Якщо назва не має референції, то вона посилається на свій денотат лише за допомогою смислу. Поняття смислу формулюється через поняття денотату як способу вказівки. Референція як така обумовлюється нашими інтенціями і необхідна для визначення істинності (рис. 1.2).

 

 

.

 

Теорія Г. Фреге зазнавала безпідставної критики з боку логічних семантиків, які пропонували взагалі відмовитися від поняття значення на користь денотації [65] або від поняття референції [66] як нелогічного.

 

Можна було б приділити фрегівській теорії більше уваги, якби було доведено, що всі слова є іменами, тобто фактично власними назвами. Але ми схильні вважати таке припущення помилковим, а значить, погоджуємося

з тим, що загальні назви не мають денотату, як його мають власні, а власні,

у свою чергу, не мають конотації, як загальні назви.

 

Представник теорії комунікації інтенції Р. Карнап, наприклад, вважає, що якщо слово має значення, то кажуть, що воно означає «поняття»; але у випадку, коли тільки здається, що слово має значення, а насправді воно таким не володіє, то ми говоримо про «псевдопоняття» [67, c. 12] (рис. 1.3).

Речення, що вміщує в собі псевдопоняття, є «псевдореченням». Псевдореченням, крім того, може бути речення, яке складається зі слів, що мають значення, але об’єднаних у такому порядку, що вони виявляються позбавленими значення (рис.1.4). Синтаксис мови обумовлює, які поєднання слів припустимі, а які ні. Граматичний синтаксис природної мови не скрізь виконує завдання усунення безглуздих словосполучень.

 

Той факт, що у звичайній мові можна утворити безглузду низку слів без порушення правил граматики, доводить те, що граматичний синтаксис є недостатнім. Звідси випливає важливість завдання створення логічного синтаксису.

 

Результати досліджень Р. Карнапа щодо даного питання, на наш погляд,

є більш корисними для прикладних лінгвістів, ніж результати Г. Фреге. У той час як, Г. Фреге шукає різницю між референцією, денотатом і значенням висловлювання, Р. Карнап, намагаючись з’ясувати смисл значення, звертається до синтаксису, що є цілком співзвучним з останніми дослідженнями з семантики.

 

Це пов’язано з розвитком так званої генеративної граматики, що народилася з виходом у світ у 1957 р. роботи Н. Хомського «Синтаксичні структури» [68]. Згідно з даною теорією, семантика переносить центр зацікавлень на синтаксичний рівень. Як наслідок, з’являється «революційна» формальна лінгвістична семантика, що має очевидні синтаксичні корені. Продуктом саме цього порівняно нового напряму є формалізація опису на основі логіко-математичного апарату, чим безпосередньо і займаються фахівці в галузі прикладної

лінгвістики.

 

При дослідженні смислу до синтаксису звертаються як представники теорії комунікації-інтенції, так і теоретики формальної лінгвістики. На підтвердження наведемо думку представника логічної семантики Дж. Остіна. Поняття «значення слова», як він вважає, є сумнівним. Тільки речення має значення. Знати ж значення, які мають слово або фраза, означає знати значення речень,

в яких вони містяться (рис. 1.5). Смисл, в якому слово або словосполучення «мають значення», вільний від смислу, в якому «мають значення» речення.

А на запитання «Що є значенням слова Х?» можна дати дві відповіді:

 

1) «синтаксичне пояснення» (запропонувати приклади речень, в яких слово Х використовується, або речення, в яких Х не використовується);

 

2) «демонстрація семантики» (продемонструвати ситуації, які коректно описуються реченнями, котрі містять слово Х або його похідні) [69].

Дослідження представників будь-яких семантичних теорій, зрештою, тим або іншим чином спрямовані на виконання глобального завдання – створення «ідеальної мови». «Прагнення втілити ідею довершеної мови в життя властиве всім мовам, і завдання дослідника полягає якраз в осягненні того, якою мірою та якими засобами різні мови наближаються до цієї ідеї» [56, c. 59]. «Ідеальна мова», виходить, має являти собою акуратне розмежування синтаксису і семантики, експліцитно сформульовані правила і конвенції, а також точне визначення меж їх застосування.

 

Саме з цією метою в 1960-ті роки з’явилася теорія семантичних примітивів, що розвивається деякими відомими дослідниками (наприклад

А. Вежбицькою [70]) і стоїть осібно від інших теорій. Суть її полягає в тому, щоб виділити найменшу частину природної мови, саме такий мінімальний список слів і висловів, якого буде достатньо для того, щоб представити значення всіх інших слів і їхній взаємозв’язок. Г. В. Лейбніц аргументував це так: «Хоч кількість понять, які можна собі мислено уявити, нескінченна, ймовірно, однак, що невеликою є кількість таких, які ми мислено уявимо самі собою. Бо через комбінації незначного можна отримати нескінченну множину» [71]. Процедура семантичного аналізу полягає у зведенні словника до мінімального набору знаків, з яких можуть бути утворені всі знаки словника.

 

Ідея зрозуміла і навіть видається дуже цікавою, але складність полягає

в тому, як визначити ті слова і вислови, що мають входити до цього мінімального списку, і які критерії використовувати. Це, власне, і є головним завданням семантиків, які підтримують таку теорію. Незважаючи на те, що вже існує низка словників семантичних примітивів, укладених цілком обґрунтовано й логічно, результати досліджень, що існують на даний момент у цій галузі, на жаль, жодним чином не можуть бути використані під час створення систем автоматичної обробки текстової інформації. Ця теорія взагалі навряд чи може знайти практичне застосування, оскільки «…не існує такої замкненої множини «примітивів», виходячи з якої можна було б визначити все, що завгодно. Визначення «циркулярні», циклічно пов’язані між собою, значення кожного з них залежить від інших понять» [72, c. 48]. Однак, віддавши належне творцям даної концепції і беручи до уваги її «теоретичну красу», можна припустити, що представникам цієї теорії коли-небудь вдасться створити «ідеальну мову» – ідеальну

як для спілкування між людьми, так і для спілкування з машиною.

 

Можна без кінця наводити приклади на доказ того, що представники різноманітних течій і окремих напрямів у лінгвістиці прямо або опосередковано звертаються до проблеми розуміння. Безсумнівно, найбільш пильну увагу

їй приділяють семантики, детально і прискіпливо вивчаючи всі поняття, пов’язані з нею. Там, де є проблема розуміння, неминуче з’являється проблема значення, а «значення – просто біда структурної лінгвістики... Над кожним, хто так чи інакше займається мовою як фахівець, висить, як дамоклів меч, проблематика, що стосується значення» [73, c. 206]. Будучи вжитим у мовленні, слово отримує можливість збуджувати у свідомості тих, хто спілкується, не лише узагальнені образи, але й уявлення про конкретні предмети або ситуації.

Той зміст, який отримує мовна одиниця при її вживанні у мовленні, називають смислом [74]. Значення неминуче тягне за собою смисл, який інтегрує конкретні значення [25, c. 87], а безмежність поля смислу призводить до такої різноманітності його розуміння, що доводиться визнати неможливість його визначення з якої-небудь однієї позиції. Не варто шукати абсолютне й універсальне визначення смислу. Таким чином, проблема розуміння – вічна проблема, й актуальною вона буде доти, доки існує сама людина. Але це зовсім не означає, що розв’язання цієї проблеми взагалі не існує, навпаки, існує безліч розв’язань, що відповідають різним вимогам.

 

Проаналізувавши існуючі напрями досліджень у семантиці, можливо відзначити, зокрема, формальну семантику, засновану на синтаксичній семантиці, як найбільш перспективний напрям для розв’язання проблеми моделювання розуміння мови в системах автоматичної обробки тексту.



Поделиться:


Последнее изменение этой страницы: 2016-06-06; просмотров: 248; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.145.119.199 (0.049 с.)