Предикационная структура предложения 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Предикационная структура предложения



 

Наличие предикативно связанных грамматических субъекта и предиката многие исследователи считают обязательным свойством предложения. Эти члены предложения квалифицируются как главные, поскольку они формируют предикативную основу предложения, его конструктивный минимум. Но в конструктивный минимум некоторые исследователи включают, кроме подлежащего и сказуемого, также дополнение. В конструкциях с безобъектными, непереходными (в широком смысле) глаголами отсутствует позиция дополнения (иначе выражаясь, представлена нулём). Точно так же может отсутствовать и позиция подлежащего, когда предложение развёртывается на основе бессубъектного глагола (Темнеет; Морозит). Субъектная позиция здесь также представлена нулём. В ряде языков появляется нечто вроде формального подлежащего. Бессубъектными следует признать предложения, ядром которых являются событийные имена и имена состояний (Война; Пожар; Мороз; Морозно).

Тем самым предикативная основа предложения может пониматься трояко:

- как единство подлежащего и сказуемого;

- как единство подлежащего, сказуемого и дополнения;

- как только сказуемое само по себе.

В связи с этим все предложения могут делиться на двукомпонентные и однокомпонентные. Примеры украинских двукомпонентных подлежащно-сказуемостных предложений: Отец – учитель; Ночь темна; Отец в саду; Задание – победить. Примеры двукомпонентных предложений, не содержащих подлежащего (в обычно принятом смысле): Можно ехать; Приказано наступать. Примеры однокомпонентных (сказуемостных) предложений: Светает; Морозит; Стучат; Тишина; Народу!; Закрыто.

Предикативность – это одна из важнейших характеристик простого предложения. И ни одна теория или концепция синтаксической организации предложения не обходит стороной свойство предикативности, хотя и трактуется эта особенность далеко не однозначно.

Рассмотрим предикативную структуру атомарного предложения. Атомарное предложение – это, прежде всего, двусложная конструкция воссоздания произвольной ситуации, которая сочетает субъект с определенным предикатом.

Приведем главные свойства атомарного предложения:

- атомарному предложению присущее свойство предикативности,

- элементарное предложение – это монопредикатная конструкция,

- атомарное предложение не является трансформацией или перифразой какой – то другой структуры,

- значение (суть) отдельного сообщения состоит из совокупности значений составных предикатных выражений.

Атомарное предложение – это базовая конструкция языкового материала, на основе которого строится любое сообщение. Термины «атомарное предложение», «синтаксический блок» в дальнейшем будем считать синонимическими.

Таким образом, на синтаксическом уровне предикат – это ядерная структура, которая включает в свой состав п актантов. Само ядро – это глагольная конструкция, а актанты объединяются с ядром системой отношений. Узлами в этой конструкции являются имена (существительное, местоимение, числительное) в их атрибутивной форме. Синтаксические отношения реали­зуются определенным образом, а их количество может достигать не более 7. Это магическое число (семь) – предел возможности человека одновременно воспринимать разные характеристики одной ситуации или объекта. Синтаксис реали­зации отношений будет рассмотрен более детально ниже; здесь лишь уместно подчеркнуть еще раз, что синтаксис – это форма реализации семантики и часто – очень жесткая схема. Синтаксис – это система языковых средств, которые позволяют однозначно идентифицировать связи между отдельными составляющими конкретного сообщения.

Синтаксис предиката для атомарного предложения принимаем в следующей интерпретации (см. рис. 10.1).


Рисунок 10.1 – Структура предиката: Subj – субъект, Obji – актанты предиката, Ri – отношения предиката, R0 отношение «быть субъектом»

 

Ядро предиката (предикатор), в общем случае, - это глагольная конструкция, которая может иметь дополнительно атрибутивные компоненты. Актанты могут быть представлены или в виде отдельных объектов, или в форме конкретных характеристик предикатора, представленных наречиями (вчера, сегодня, там, здесь и т.п.).

Составляющие окружающей среды (объекты, субъекты и действие) человек всегда воспринимает как некоторую целостность, которая всегда реализуется через совокупность своих признаков. Язык имеет средства для описания этих признаков (атрибутов, которые, например, помечают цвет, материал, отдельные стороны динамических ситуаций). Подобные языковые средства будем обозначать как Attr (Obj/Subj) и Attr (Mov) (см. табл. 10.1).

 

Таблица 10.1. Соответствие языковых средств элементам внешнего мира

№ п/п Составляющие внешнего мира Языковой уровень
Название Условное обознач. Часть речи
  Объект Объект Obj Существительное
  Субъект Субъект Subj Существительное
  Действие Действие Mov Глагол
  Признак объекта Признак объекта Attr(Obj) Прилагательное
  Признак действия Признак действия Attr (Mov) Наречие
  Признак признака Мера признака Attr (Attr) Наречие

 

Таким образом, четырех частей речи (существительное, глагол, прилагательное, наречие) достаточно для описания произвольной ситуации внешнего мира, потому что местоимение и числительное всегда функционально эквивалентные существительному, а другие части речи выполняют служебные функции.

Здесь явно прослеживаются три уровня формирования описания:

- ядро конструкции – имя Obj, Subj или Mov;

- атрибутивный уровень – список атрибутов (Attr1(Obj), Attr2(Obj) и тому подобное);

- уровень меры признака (перечень элементов Attr(Attr)).

Совокупность этих трех уровней полностью определяет атрибутивный уровень описания объекта или действия и полностью адекватно представляет языковую деятельность человека. Упрощенная графическая интерпретация составляющих предикатной структуры изображена на рисунке 10.2, где лишь очерчены отдельные атрибутивные уровни.

 


Рисунок 10.2 – Обобщенная схема описания составляющих предикатной структуры: атрибутивный уровень описания объекта (слева), атрибутивный уровень описания действия (справа)

 

Дадим четкую классификацию всех отношений, которые используются на уровне реализации базовой синтаксической структуры атомарного предложения. В иерархической зависимости связей предикатной структуры четко прослеживаются три группы отношений:

- отношение R0, как центральное отношение двухсоставной предикатной конструкции;

- отношение атрибутивного уровня описания составляющих предложения;

- отношение предиката Р.

Атрибутивный уровень формирования описаний объектов/субъектов реализуется с помощью использования хорошо известной схемы связи, которая определяется как согласование. В этом случае необходимо, чтобы сочетаемые элементы имели одинаковую переменную МИ. Сочетаемыми элементами в этом случае будут имена объектов/субъектов и их признаки.

Рассмотрим по очереди определенные классы связей между отдельными составляющими структуры атомарного предложения на примере:

 

Старый Рыбак до рассвета ТОЧНО Размеренными движениями уверенно направил свою верную лодку на Самую БЫСТРИНУ

 

Для нашего примера атрибутивный уровень формирования связей используется для описания отдельных составляющих сообщения:

Старый Рыбак – субъект;

свою верную лодку – объект;

Размеренными движениями – инструмент;

Самую Быстрину – пространственная координата.

Полученная структура отображена на рисунке 10.3.

 

Рисунок 10.3 – Предикативная структура предложения:

Старый Рыбак до рассвета ТОЧНО Размеренными движениями уверенно направил свою верную лодку на Самую БЫСТРИНУ

 

В первом случае МИ существительного Рыбак сочетают с МИ прилагательного Старый (м. род, ед. число, им. падеж). Полная тождественность (согласование) МИ как раз и обеспечивает сочетание двух элементов сообщения между собой. Имя РЫБАК дополняется атрибутивным членом СТАРЫЙ и формирует некоторый целостный объект. Таким же образом реализуется объединение других компонентов, а именно:

Размеренными движениями – мн. число, м. род, тв. падеж;

Самую Быстрину – ед. число, ж. род, предл. падеж;

свою верную лодку – ед. число, м. род, вин. падеж.

Для последнего случая специфическим является то, что одному объекту отвечает два признака на атрибутивном уровне (то есть роль МИ в этом случае является уже сложнее сравнительно со случаем объединения двух составляющих).

Схема согласования морфологических средств здесь использовалась для объединения составляющих атрибутивного уровня описания объекта Obj и Attr (Obj). Но мы знаем, что встречается еще один уровень организации атрибутивных связей, когда Attr (Obj) дополняется в свою очередь атрибутивным членом Attr (Attr). В нашем случае такой связью сочетают составляющие ТОЧНО и Размеренными. Следовательно, после учета такой связи целостный узел структуры будет иметь вид ТОЧНО Размеренными движениями. В роли Attr (Attr) выступает, конечно, наречие, и если он в сообщении встречается рядом с прилагательным, то обязательно присоединяется к последнему. Это мы рассмотрели лишь атрибутивной уровень описания объекта.

Атрибутивный уровень описания ядра конструкции – предикатора реализуется несколько иным образом. Здесь надо связать Mov или Attr (Mov); связь эта реализуется на семантическом уровне и привлекает к своей реализации только постоянную МИ.

Для нашего случая предикатором выступает объединение слов уверенно направил. Как признак Attr (Attr) появляется, конечно, наречие или короткая форма прилагательного или причастия. Иначе говоря, здесь используется постоянная МИ, но согласования их не происходит да и не нужно (это неизменная часть речи – наречие). Следовательно, реализация связей типа Attr (Mov) – Mov, Attr (Attr) – Attr (Obj), Attr (Attr) – Attr (Mov) происходит однообразно и выполняется на синтаксическом уровне.

Как же реализуются отношения предиката? Влияние предикатора на его окружение реализуется на семантическом уровне. В течение языковой практики выкристаллизовалась устоявшаяся форма использования языкового окружения для конкретного предиката. Да, предикатор НАПРАВИЛ при реализации отношения «быть объектом» требует использования винительного падежа, а реализация отношения «быть инструментом» требует творительного падежа. Другими словами, каждый предикатор имеет свою постоянную форму реализации связей с языковым окружением. Отсюда опять выплывает, что значительную весомость при реализации отношения приобретает база знаний пользователя языка, где хранятся все известные предикаты и схемы их использования.

Схема формирования связи будет такой: предикатор требует конкретного предлога, семантика которого уже определяет использование того или другого отдельного актанта. Тут предикатор Направил требует пространственной актуализации актанта, который требует предлога НА, семантика которого требует использования соответствующего актанта в винительном падеже.

Формирование ситуационных отношений происходит несколько иным путем. Когда предикативные отношения реализуются исключительно в зависимости от выбранного предикатора, то формирование ситуационных отношений будет всегда одинаковым и не зависит от предикатора. Это отношение типа «быть временем», «быть пространством», «быть причиной», «быть следствием» и тому подобное. Языковая практика проработала постоянные формы реализации этих отношений.

Ситуационные отношения очень распространены в языковом материале, потому что воссоздают пространственно-временные и причинно-следственные связи. В явном или неявном виде они почти всегда присутствуют в сообщении. Однако пути и особенности их реализации основаны на семантическом анализе – особенность формирования пространственно-временных отношений сводится к тому, что при их реализации используются отдельные составляющие семантического поля времени и пространства, что формируются на базе знаний пользователя при восприятии и осознании этих категорий. Семантическому анализу ЕЯ-текстов посвящены следующие лекции.

 

ЛЕКЦИЯ 11

 

СЕМАНТИЧЕСКИЙ АНАЛИЗ ЕЯ-ТЕКСТОВ

 

На данный момент разработано множество моделей лингвистического процессора, которые способны в той или иной степени выполнять анализ ЕЯ-текста, определять смысл и генерировать высказывания. При этом подходы к моделированию процесса общения весьма разнообразны. Основные отличия этих подходов заключаются в методах реализации компонента понимания смысла, используемых средствах анализа, а также в объеме и способах представления знаний, поскольку именно знания, представленные в различной форме, являются базой, от которой зависит процесс общения, глубина проникновения в смысл и, соответственно, качество самой модели семантического анализатора.

В задачу семантического анализа входит выделение смысла входного текста (под смыслом будем понимать семантику – информацию, которую пользователь хотел передать системе) и выражения этого смысла на внутреннем языке системы. Интерпретация заключается в отображении входного текста на знания системы. Одним из основных параметров анализа текста является понимание смысла входного предложения, включающее в себя описание сущностей входного текста, определение их свойств и отношений между ними. От этого параметра часто зависит глубина проникновения в смысл входного текста.

В существующих моделях лингвистического процессора можно выделить следующие способы выделения и представления смысла: компонентный анализ; сеть концептуализаций; идентификация смысла по образцу; интегральный подход.

Одна из первых попыток формализации входного текста принадлежит компонентному анализу, который исходит из предпосылки, что семантика естественных языков может быть выражена в терминах конечного неструктурированного набора семантических множителей (атомов смысла). В процессе рассмотрения слов выделяются признаки (одушевленность, неодушевленность и т.п.), которые разбивают слова на отдельные группы. При кажущейся естественности данный метод связан с существенными трудностями при реализации и не лишен слабостей. Он становится сложным при выражении смысла целого предложения и громоздким при анализе многозначных слов, при этом нет достаточного объяснения слова, что может привести к неправильному его употреблению. Но в отличие от предыдущей модели в предикатах указывается не только аргументная структура и количество, но и их семантическое содержание (роли). Филмор выделяет следующие семантические роли: агент, контрагент, объект, адресат, пациенс (объект действия, жертва), результат, инструмент, источник. В модели предложена более детальная концепция смысла высказывания. Каждое понятие расщепляется на две сущности: значение и пресуппозицию. Различия между пресуппозицией и значением в собственном смысле слова проявляются, например, в различном влиянии на них отрицания. В область действия отрицания попадает только значение, а не пресуппозиция. В результате исследований была разработана классификация семантических элементов, что привело к пересмотру обычной схемы словарной статьи в толковом словаре (словарь стал основным средством задания семантических структур и правил их перевода в поверхностные структуры).

Продолжением данной теории явился метод падежной грамматики (Филмор). При этом для записи содержания входного высказывания используются специальный синтаксический язык, словари и правила, устанавливающие соответствие между естественно-языковыми выражениями и их семантическим представлением.

Ко второму классу относятся модели, в которых смысл текста представляется в виде сети концептуализаций. В таких моделях явления рассматриваются только на одном уровне детальности, что не позволяет как описывать сложные события в терминах более простых подсобытий, так и дробить при необходимости примитивные действия (атомы). Чаще всего эти модели являются моделью языка, а не моделью общения, что приводит к нечеткому выделению языковых средств и средств для описания моделируемого окружения. Среди моделей данного класса наибольший интерес представляет модель «Концептуальной зависимости».

Основой семантического представления модели «Концептуальной зависимости» (Р. Шенк) является сеть концептуализаций. Сеть концептуализаций есть квазиграф, подобный размеченному ориентированному графу, в котором, кроме бинарных отношений, есть тернарные и кварнарные, а дуги связывают не только вершины, но и другие дуги.

Концептуализация в модели концептуальной зависимости определяется как основная единица семантического уровня, из таких единиц конструируются мысли. Концептуализация включает в себя действие, множество его концептуальных падежей и участников действия (их состояний).

Будучи моделью языка, она не учитывает модели пользователя, что приводит к полному перебору при построении умозаключений. Наличие модели пользователя позволило бы определить его цели (намерения) в диалоге и использовать их для направления процедуры построения умозаключений.

Другая модель - «Семантик предпочтения» относится к классу моделей, идентификация смысла в которых осуществляется по образцам. Отличительной чертой таких моделей является то, что в них отсутствуют блоки морфологического и синтаксического анализов, что является принципиальным их недостатком, так как не обеспечивается глубина анализа значений слов, необходимая для точного установления семантической связности текста.

В этой модели (Уилкс) текст характеризуется следующими сущностями: смыслами 90 слов, сообщениями, фрагментами текста и семантической совместимостью. Сообщение рассматривается как теоретический конструкт, посредством которого для каждого слова, входящего во фрагмент текста, может быть выбран один из смыслов слова, посредством чего снимается многозначность. Слову назначается тот из его многих смыслов, который образует «сообщение», согласующееся, в конце концов, с рассматриваемым фрагментом текста. Если слово может подойти к нескольким сообщениям, то выбирается такое, которое согласуется с рассматриваемым текстом.

Анализ фрагмента текста протекает по следующей схеме. С помощью специальных слов-маркеров выполняется фрагментация текста, затем словам приписывают из словаря все их значения. Далее на анализируемый фрагмент текста поочередно накладываются простые шаблоны, известные системе. С помощью специальных правил расширения простой образец преобразуется в полный образец путем добавления слов из текста, которые не вошли в образец. Указанная процедура осложнена тем, что может подойти не один простой образец.

Используя процедуры установления семантической близости полученных образцов, формируется окончательное представление обрабатываемого текста. К недостаткам анализа следует отнести то, что анализ текста осуществляется с помощью словаря шаблонов, которые способны различать только класс событий, а не сами конкретные события.

Другой подход к способу анализа по образцу представлен в моделях, использующих табличный метод. Он основан на анализе ключевых слов, встречающихся в предложениях. Суть табличного метода состоит в идентификации смысла всего предложения на основании нескольких ключевых слов или их групп. После процесса идентификации слова предложения заменяются на их каноническую форму - коды. Замена осуществляется с помощью словаря словоформ. При этом также выделяются некоторые группы слов, несущие тематическую нагрузку. Далее производится распознавание и замена стандартных словосочетаний. Данный метод обладает рядом недостатков, преимуществом является его простота для однозначных естественно-языковых предложений, в которых не требуется полного понимания смысла предложения (например, запросы к базе данных). Модели, в которых достаточно глубоко продуманы процедуры морфологического, синтаксического и проблемного анализов, можно отнести к моделям, основанным на интегральном подходе описания языка. Это модель «Смысл-текст» и модель контекстного фрагментирования.

Модель «Смысл-текст» (И.А. Мельчук) представляет собой многоуровневый транслятор текстов в смыслы и наоборот. Выделяются четыре основных уровня – фонетический, морфологический, синтаксический и проблемный. Каждый из них, за исключением проблемного, подразделяется на два других уровня – поверхностный и глубинный. Данная модель может быть применима в системах, где необходимо понимание текста в полном смысле (например, вопросно-ответные системы, системы принятия решений). Но для реализации полной схемы анализа и синтеза модели «Смысл-текст» придется учесть индивидуальные свойства сотен тысяч словарных, морфологических и лексических единиц и 91 индивидуальные свойства громадного числа пар единиц. Их полное формальное описание представляет собой громадную и объемную теоретическую работу, поставленную в лингвистике в последнее время и еще далекую от решения.

Модель контекстного фрагментирования разрабатывалась для анализа и синтеза естественно-языкового предложения, но ее проработка касается в основном анализа. Задача лингвистической трансляции естественно-языкового текста рассматривается отдельно от других задач общения на естественном языке и от задач самой вычислительной системы.

Анализ и трансляция текста осуществляются при наличии достаточно мощных средств описания и фрагментации лингвистических знаний. Основу модели контекстного фрагментирования составляет трехуровневая система: лингвистическая модель, базовые механизмы обработки предложений и ассоциированные процедуры. Лингвистическая модель содержит информацию о морфологии, синтаксисе и семантике подмножества естественного языка. В модели выполняется очень глубокий синтаксический анализ с одновременным преобразованием распознаваемых синтаксических отношений в семантические.

Достоинством данного метода является то, что существует возможность динамически изменять стратегию обработки естественно-языкового текста в зависимости от необходимой глубины и последовательности этапов трансляции и расширять метод при включении новых конструкций естественного языка и редуцировать его для упрощенных подмножеств естественного языка и проблемных областей.

В заключение обзора различных подходов и направлений реализации моделей лингвистического процессора можно сделать вывод о том, что к настоящему времени модели способны: извлекать знания из заданного текста и строить правильные предложения естественного языка по заданным значениям смысла; перефразировать эти предложения; оценивать их с точки зрения связности и выполнять ряд других задач.

 

 



Поделиться:


Последнее изменение этой страницы: 2017-02-07; просмотров: 401; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.17.110.58 (0.049 с.)