История возникновения языка, его основные функции 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

История возникновения языка, его основные функции



Лекция 1

В данной лекции будут рассмотрены происхождение языка, его основные функции, особенности формирования и восприятия речевых образов у человека.

Лекция 2

В данной лекции будут рассмотрены архитектура лингвистического процессора, который лежит в основе всех ЕЯ-систем, описаны этапы анализа и синтеза ЕЯ-текстов, область применения и основные классы естественно-языковых систем, их функциональные компоненты, дана их сравнительная характеристика.

Естественный язык служит человеку для выражения собственных мыслей и для понимания мыслей других людей. Первому виду языковой деятельности соответствует производство ЕЯ-текстов, а второму - понимание таких текстов. Если обозначить множество текстов через {Т}, а множество выражаемых ими смыслов через {С}, то модель естественного языка можно определить как транслятор, устанавливающий соответствие между этими двумя множествами: {Т} ⇔ {С}. Формальные модели языка рассматриваются как компоненты различных прикладных ЕЯ-систем. Компонента системы, реализующая формальную лингвистическую модель и способная работать с ЕЯ во всем его объеме, называется лингвистическим процессором (ЛП). Две основные функции ЛП состоят в извлечении смысла из заданного текста и в выражении заданного смысла текстом на ЕЯ, иначе это функции: ‒ моделирования понимания (анализ); ‒ моделирования производства текстов (синтез). Наиболее полная модель класса «Смысл ⇔ Текст» обеспечивает получение связных синтаксических структур для всех предложений обрабатываемых текстов, независимо от степени их сложности, и переработку текстов на естественном языке без смысловых потерь. Структура и состав лингвистического процессора Со стороны своего внутреннего устройства ЛП представляет собой многоуровневый преобразователь. В нем различаются три уровня пофразного представления текста, которые соответствуют уровням языка -морфологический, синтаксический и семантический. Каждый из уровней обслуживается соответствующим компонентом модели - массивом правил и определенным словарем. На каждом из уровней предложение имеет формальный образ, именуемый в дальнейшем его структурой - морфологической (МорфС), синтаксической (СинтС) и семантической (СемС). Синтез представляет собой обратный переход от СемС предложения к его записи в обычном орфографическом виде. Структура лингвистического процессора представлена на рисунке 1. Под морфологической структурой понимается последовательность входящих в анализируемое предложение слов с указанием части речи и морфологических характеристик (падежа, числа, рода, одушевленности, вида и т.п.). Под синтаксической структурой понимается дерево зависимостей, в узлах которого стоят слова данного естественного языка с указанием части речи и грамматических характеристик, а дуги соответствуют специфичным для данного естественного языка Рис. 2.1. Структура лингвистического процессора ЛП в целом должен обеспечивать выполнение следующих преобразований: предложение на ЕЯ ⇒ МорфС ⇒ СинтС ⇒ СемС (при анализе) СемС ⇒ СинтС ⇒ МорфС ⇒ предложение на ЕЯ (при синтезе) Таким образом, чтобы построить ЛП, необходимо разработать: ‒ формальные языки для записи (образов) предложений на морфологическом, синтаксическом, семантическом уровнях представления; ‒ формальное понятие структуры предложения для каждого из этих уровней; ‒ массивы правил для преобразования структур смежных уровней друг в друга; ‒ морфологический, синтаксический и семантический словари, включив в них всю информацию о каждой лексеме, необходимую для осуществления соответствующего преобразования. Цель анализа предложения на естественном языке - перевод их на М-язык вычислительной системы. Функциями анализатора являются: ‒ распознавание правильно построенных предложений ЕЯ; ‒ фиксация, локализация и возможность исправления ошибок в ЕЯ-тексте; ‒ декомпозиция предложения на составляющие (фрагменты) и построение соответствующей синтаксической структуры предложения; ‒ семантическая интерпретация фрагментов ЕЯ-предложения во фрагменты М- языка; ‒ композиция фрагментов М-языка в структуру, описывающую ситуацию проблемной среды. Реализация этих функций осуществляется на этапах морфологического и синтаксического анализов, семантической интерпретации и проблемного анализа. Во многих моделях ЛП два последних этапа объединяются в один этап семантического анализа. В большинстве случаев вместо полного синтеза используется синтез по шаблонам. Суть его состоит в том, чтобы для конкретной системы рассмотреть все типы сообщений, относящиеся как к процессу общения, так и к процессу выдачи результатов работы ВС, и для каждого типа разработать шаблон, который заполняется при обращении к пользователю. Задача синтеза заключается в переводе «текста» М-языка в ЕЯ-текст и состоит из следующих этапов: ‒ разбиение текста М-языка на фрагменты, соответствующие будущим фразам; ‒ определение лексем для синтезируемой фразы; ‒ построение синтаксической структуры фразы; ‒ приписывание морфологической информации вершинам синтаксической структуры фразы; ‒ определение порядка слов; ‒ осуществление морфологического синтеза лексем. Суть семантического синтеза заключается в таком преобразовании текста М-языка, при котором его части могли бы соответствовать будущим фразам и предложениям ЕЯ. При этом требуется учет как языкового, так и смыслового факторов. Фраза должна быть приемлемой по размерам, быть стилистически доступной и т.п. Иногда для этого достаточно использовать простые правила с учетом ограничений, например, на число существительных, на число определений, выражаемых придаточными предложениями, и т.п. Такие преобразования осуществляются за счет правил фрагментирования текста М-языка. Результатом семантического синтеза будет структура М-языка, разбитая на фрагменты, соответствующие будущим фразам. Задача синтаксического синтеза - определить порядок следования фраз, сформировать их синтаксические структуры, заполнить эти структуры соответствующими лексемами и, учитывая отношения между лексемами, конкретизировать синтаксические структуры. На этапе синтаксического синтеза выбираются форма фраз по морфологическим характеристикам лексем. Выбор лексем может зависеть от истории общения. Например, при работе в системе типа «вопрос - ответ» синтезатор может использовать те лексемы, которые применялись пользователем в вопросе.Цель морфологического синтеза - построение конкретных словоформ ЕЯ по словарю и заданной морфологической информации. Морфологический синтез завершает процесс синтезирования, после чего сообщение на естественном языке выдается пользователю.

 

Основные классы ЕЯ-систем

Компьютеры вошли в жизнь человека, а потому естественно его стремление преодолеть языковой барьер, разделяющий два разных мира, выразить себя в алгоритмических устройствах. Язык, человек, реальность неразрывно связаны между собой, поэтому обучение компьютера ЕЯ — задача чрезвычайно сложная, связанная с глубоким проникновением в законы мышления и языка.Попытки формализовать интеллектуальную деятельность человека привели к постановке фундаментальной лингвистической задачи, состоящей в моделировании его языкового поведения, т.е. в построении функциональной модели естественного языка. Естественный язык служит человеку для выражения собственных мыслей и для понимания мыслей других людей. Первому виду языковой деятельности соответствует производство ЕЯ-текстов, а второму - понимание таких текстов.В конце 60-х годов в исследованиях по искусственному интеллекту сформировалось самостоятельное направление, получившее название «обработка естественного языка» (Natural Language Processing). Задачей данного направления является исследование методов и разработка систем, обеспечивающих реализацию процесса общения с компьютерными системами на естественном языке (систем ЕЯ - общения или ЕЯ-систем). Следует отметить, что проблематика коммуникативного взаимодействия, и в частности ЕЯ-общения, находится в центре внимания многих наук, например, лингвистики, психологии, логики и философии. Однако все они исследуют лишь отдельные аспекты процесса общения. В отличие от них искусственный интеллект, как прикладная дисциплина, вынужден моделировать в рамках ЕЯ-систем все или, по крайней мере, основные аспекты ЕЯ-общения, правда, может быть, не на столь глубоком уровне.Сложность создания средств общения, предназначенных для конечных пользователей, обусловлена в значительной степени отсутствием единой теории языкового общения, охватывающей все аспекты взаимодействия коммуникантов. Поэтому при разработке средств общения конечных пользователей на процесс взаимодействия часто налагаются различные «спонтанные» ограничения, последствия которых не до конца осознаются разработчиками. Эти ограничения приводят к тому, что многие человеко-машинные системы, на разработку которых тратятся огромные средства, не удовлетворяют требованиям конечных пользователей.Естественно-языковые системы (ЕЯ-системы) используются для поиска в текстах, распознавания речи, голосового управления и обработки данных. Их доля на рынке составляет около 14%. В данном направлении выделяются следующие категории информационных продуктов:- средства, обеспечивающие ЕЯ-интерфейс к базам данных;- средства ЕЯ поиска в текстах и содержательного сканирования текстов (Natural Language text retrieval and Contents Scanning Systems);- масштабируемые средства для распознавания речи (Large-Vocabulary Talkwriter);- средства голосового ввода, управления и сбора данных (Voice Input and Control Products and Data Collection Systems);- компоненты речевой обработки (Voice-Recognition Programming Tools).Программные продукты первой категории преобразуют ЕЯ запросы пользователя в SQL-запросы к базам данных. Средства ЕЯ поиска в текстах осуществляют по запросам пользователей поиск, фильтрацию и сканирование текстовой информации. В отличие от продуктов предыдущей группы, где поиск осуществляется в базах данных, имеющих четкую и заранее известную структуру, средства данной категории осуществляют поиск в неструктурированных текстах, оформленных в соответствии с правилами грамматики того или иного естественного языка. Средства для распознавания речи распознают голосовую информацию и преобразуют ее в последовательность символов. Они ориентированы на работу со словарями объемом от 30000 до 70000 слов. В отличие от этого, средства голосового ввода ориентированы на работу со словарем около 1000 слов и существенно ограничены в возможностях распознавания. Программные средства этого типа предназначены для ввода голосовых команд, управляющих работой некоторого продукта, например, программы сбора данных в тех приложениях, в которых у исполнителей заняты руки.Компоненты речевой обработки предназначены для программистов, которых хотят добавить возможности по распознаванию речи в разрабатываемые ими приложения.В зависимости от назначения прикладных систем, в состав которых входят конкретные реализации ЕЯ-систем, задачи, решаемые отдельными функциональными компонентами (как по постановке, так и по методам решения), могут в значительной степени варьироваться. Исходя из этого, а также с учетом истории развития ЕЯ-систем, различают следующие основные классы систем общения:- интеллектуальные вопрос - ответные системы;- системы общения с базами данных;- диалоговые системы решения задач;- системы обработки связных текстов;- системы машинного перевода.Исторически ЕЯ-системы происходят от информационно-поисковых систем, с одной стороны, и систем машинного перевода - с другой. Поэтому на начальном этапе ЕЯ-системы представляли собой макеты информационно-поисковых систем, демонстрирующие принципиальную возможность ввода данных (фактов) и обработки запросов на естественном языке. Такие системы часто назывались интеллектуальными вопрос-ответными системами. Название можно, по-видимому, объяснить стремлением их разработчиков подчеркнуть, что в отличие от обычных информационно-поисковых систем и систем машинного перевода того времени в данных системах широко используются концепции, выработанные в исследованиях по искусственному интеллекту.Основное внимание при разработке интеллектуальных вопрос-ответных систем уделялось не столько возможностям их практического использования в реальных задачах, сколько развитию моделей и методов, позволяющих осуществлять перевод ЕЯ-высказываний, относящихся к узким и заранее фиксированным проблемным областям, в формальное представление, а также обратный перевод. Накопленный опыт разработки интеллектуальных вопрос-ответных систем позволил, с одной стороны, углубить понимание процесса ЕЯ-общения и, следовательно, поставить новые проблемы (в том числе и специфичные для общения в различных классах проблемных областей), требующие дальнейшей проработки, а с другой - оценить перспективы практического применения ЕЯ-систем.Первые предпосылки для практического использования ЕЯ-систем создало появление баз данных (БД). В связи с этим возникла проблема обеспечения доступа к информации, хранящейся в БД, широкому классу неподготовленных конечных пользователей, к которым относят специалистов в той или иной предметной области, как правило, не обладающих знаниями о логической структуре БД, о системе представления информации в БД и не умеющих пользоваться формализованными языками запросов. Для решения этой проблемы стали создаваться системы общения с базами данных, основная задача которых (в простейшем случае) заключается в выполнении перевода запросов неподготовленных конечных пользователей с ЕЯ на формализованные языки запросов к БД.Диалоговые системы решения задачи в отличие от систем общения с БД берут на себя не только функции ЕЯ-доступа к БД, но и функции интеллектуального монитора, обеспечивающего решение заранее определенных классов задач (например, планирование путешествий, боевых операций, составление контрактов и т. п.). В этом случае разбиение задач на подзадачи и распределение ролей между участниками, т. е. определение, кто из участников (пользователь или система) решает ту или иную подзадачу, осуществляется не пользователем (как в случае применения систем общения с БД), а диалоговой системой.Решение подзадач, «порученных» системе, может осуществляться как на основе использования собственных знаний и механизмов вывода, так и в результате обращения к прикладным программам и пакетам, не входящим в состав ЕЯ-системы. Основным направлением практического использования ЕЯ-систем данного класса является реализация ЕЯ-общения с экспертными системами.Возникновение последнего класса ЕЯ-систем — систем обработки связных текстов, обусловлено возрастанием объема хранимой в ЭВМ текстовой информации (газетные статьи, сообщения о различных событиях, патенты, авторские свидетельства и т. п.) и необходимостью извлечения из нее разнообразных сведений (например, о структуре некоторых объектов, о действующих лицах некоторых событий, о мотивах их поступков и т. д.).Каждый из классов ЕЯ-систем обладает специфическими особенностями, которые хорошо заметны при рассмотрении характера задач, решаемых основными функциональными компонентами этих систем. Функциональные компоненты естественно-языковых систем Традиционные средства общения не позволяют обеспечить взаимодействие конечных пользователей с компьютером. Чтобы быть полноправным участником общения, ЕЯ-система должна выполнять некоторые обязательные функции. К этим функциям относятся:- ведение диалога - определение его структуры и ранга роли, которую система и пользователь выполняют на текущем шаге диалога;- понимание - преобразование поступающих от пользователя высказываний на естественном языке в высказывания на языке внутреннего представления;- обработка высказываний - формирование или определение заданий на решение задач или подзадач на данном шаге диалога;- генерация - формирование выходных высказываний на ЕЯ.Приведенные функции имеют обобщенный характер. Поэтому необходимо подчеркнуть, что при реализации конкретных ЕЯ-систем суть этих функций может в значительной степени варьироваться. В соответствии с выделенными функциями обобщенная схема ЕЯ-системы (рис.2.2) может быть представлена в виде трех компонентов: диалоговый; компонент понимания высказываний; компонент генерации высказываний. Рис. 2.2. Обобщенная схема ЕЯ-системы Сравнительная характеристика основных классов ЕЯ-систем Приведенная выше классификация ЕЯ-систем охватывает лишь функционально полные системы, т. е. такие, в которых представлены все основные функциональные компоненты. Однако помимо функционально полных систем ведется интенсивная разработка систем, которые можно назвать фрагментарными. Цель их создания - исследование или реализация новых методов решения достаточно узких задач (например таких, как анализ, интерпретация, определение целей пользователя и т. п.).Благодаря модульности структуры ЕЯ-систем и, как правило, универсальному (т. е. не зависящему от специфики прикладных областей) характеру языка внутреннего представления, фрагментарные системы могут успешно использоваться в качестве отдельных функциональных блоков, встраиваемых (хотя бы на логическом уровне) в различные функционально полные ЕЯ-системы. Рассмотрим основные отличительные характеристики каждого класса ЕЯ-систем на примере существующих систем. Интеллектуальные вопрос-ответные системы При разработке интеллектуальных вопрос-ответных систем основное внимание уделяется языковому аспекту, т. е. максимальному приближению языка общения к литературному естественному языку. Наиболее значительной из отечественных систем данного класса является система ПОЭТ, созданная коллективом исследователей под руководством Э.В. Попова, во многом определившая применяемые в последующих системах методы анализа и генерации высказываний на русском языке.Система ПОЭТ воспринимает вопросительные предложения русского языка с практически несущественными ограничениями на допустимые синтаксические конструкции и пунктуацию. Типичными примерами запросов, допускаемых системой ПОЭТ, могут служить «Сколько каменного угля перевезено железнодорожным транспортом в 1978 году?» или «Каков удельный вес перевозок железнодорожным транспортом в общем объеме перевозок всеми видами транспорта в 1975 году?» Процесс понимания входных высказываний осуществляется в системе ПОЭТ по полной схеме: морфологический анализ, синтаксический анализ, семантический анализ и семантическая интерпретация (рис. 2). При этом последние три этапа выполняются в общем случае параллельно, за счет чего достигается коррекция неверных путей анализа, и в конечном счете сокращается время обработки запросов.Все знания о языке общения разделяются в системе ПОЭТ на лингвистические и проблемные. Первые хранятся в различных зонах словаря (морфологической и синтактико-семантической), а вторые - в семантической сети. При этом в системе различаются абстрактная (описывающая общие понятия и категории) и конкретная (описывающая конкретные сущности) семантические сети. Описания базовых событий представлены в словаре системы в виде моделей управления. Выделение участников событий и определение выполняемых ими ролей осуществляются на основе метода фильтров. При этом активно используется как грамматическая, так и синтактико-семантическая информация.На этапе семантического анализа синтаксическая структура входного высказывания, представленная в виде дерева зависимостей, преобразуется в семантический граф, состоящий из вершин-понятий, связанных друг с другом через вершины-события и характеристики. Каждая вершина семантического графа определяется каноническим представлением, а дуги имеют глубинный смысл. Вся числовая и параметрическая информация выносится из графа в дополнительные таблицы. Там же указываются и временные соотношения между событиями.На этапе интерпретации семантический граф запроса сопоставляется с семантической сетью. В результате происходит вычленение контекста, имеющего отношение к запросу, получение содержательной информации из конкретной сети, формирование обращений к базе данных за числовой информацией и получение способа обработки этой информации (суммирование, вычисление процента и т. п.). Семантический граф ответа вырабатывается на базе графа запроса путем внесения в него смысловой информации, полученной на этапе интерпретации.Система ПОЭТ является ЕЯ-системой с генерацией ответов на русском языке. Формирование ответов выполняется следующим образом. По семантическому графу ответа строится дерево зависимостей. Затем каждой вершине приписывается морфологическая информация и определяется порядок слов. На этом заканчивается синтаксический синтез. На этапе морфологического синтеза по таблицам окончаний и морфологической информации, приписанной вершинам дерева зависимостей, осуществляется окончательная генерация поверхностной структуры ответа. Генерация полного ответа, например, «В 1978 году железнодорожный транспорт перевез NNN млн. тонн каменного угля», позволяет пользователю убедиться в правильности понимания системой заданного вопроса.С помощью первых вопрос-ответных систем была показана принципиальная возможность получения ответов на ЕЯ-вопросы, относящиеся к ограниченным проблемным областям. Так, система ПОЭТ могла отвечать па вопросы о перевозках различных народнохозяйственных грузов. ДИСПУТ - об обслуживании контейнерных перевозок к морскому порту, LUNAR - о свойствах образцов лунных пород, LIFER - о дислокации и характеристиках судов военно-морских сил и т. п. Для большинства интеллектуальных вопрос-ответных систем была характерна жесткая структура диалога, при которой каждое высказывание пользователя воспринималось как очередной запрос (который, как правило, не мог быть связан с предыдущим). Система играла пассивную роль - она могла лишь отвечать на запросы и выдавать сообщения о неудачах, когда очередной запрос по каким-либо причинам не мог быть проанализирован или обработан. Обработка высказываний сводилась в большинстве случаев к вызову (в соответствии с типом запроса) одной из имеющихся в распоряжении системы специализированных программ и передаче ей в виде параметров условий поиска информации в БД имен сущностей, значения которых должны быть обработаны или выданы в качестве ответа, и т. п.Первые эксперименты с интеллектуальными вопрос-ответными системами показали, что, несмотря на возможность понимания запросов на ЕЯ, данные системы налагают достаточно жесткие (и в общем случае трудновыполнимые) ограничения на процесс общения. Эти ограничения стимулировали дальнейшие исследования, направленные, в первую очередь, на повышение гибкости процесса общения.
Рис. 2.3. Схема вопрос-ответной системы ПОЭТ Системы общения с базами данных В последнее время возрос интерес к ЕЯ-системам данного класса, что связано с усиливающейся тенденцией хранения информации в структурированных источниках данных. Концепция базы данных лежит в основе подавляющего большинства современных систем обработки данных. Для обеспечения взаимодействия с конечными пользователями системы управления базами данных (СУБД) предоставляют специальные формализованные языки. Однако, как правило, эти языки ориентированы на пользователей, обладающих специальными знаниями. В частности, они должны знать основные приемы программирования, синтаксис языка запросов, логическую структуру БД, термины, используемые в БД для обозначения сущностей предметной области, и т.п. ЕЯ-системы рассматриваемого класса предназначены для использования в качестве посредника (ЕЯ интерфейса) между неподготовленными конечными пользователями (т. е. специалистами в прикладных проблемных областях, не обладающими указанными выше знаниями) и БД. Другими словами, они должны позволять получать информацию, хранящуюся в БД, по запросам, сформулированным на ЕЯ. В системах общения с БД общение ведется в форме связного диалога, т.е. ответы на вопросы пользователя выдаются с учетом его предыдущих вопросов и/или предыдущих ответов системы. Инициатива в диалоге в основном принадлежит пользователю. Перехват инициативы допускается лишь для уточнения незнакомых системе слов и исправления орфографических ошибок. Язык общения является подмножеством естественного языка, семантически ограниченным предметной областью, отображаемой в БД. В высказываниях пользователя допускаются многие общепринятые синтаксические конструкции. Кроме того, допускаются определенные неправильности: орфографические ошибки, пропуск слов, ошибки в пунктуации, неправильное употребление строчных и прописных букв и ряд типичных диалоговых конструкций: эллипсис и анафорические ссылки. Ответы ЕЯ-системы строятся таким образом, чтобы обеспечить, насколько это возможно, «дружественность» общения. Диалоговые системы решения задач Основное отличие ЕЯ-систем данного класса от ЕЯ-систем общения с БД состоит в той роли, которую играет система в процессе решения задач пользователя. Системы общения с БД лишь облегчают получение из БД информации. Они, как правило, не имеют знаний о задаче, для решения которой пользователю нужна эта информация. При общении с диалоговыми системами решения задач пользователь и система меняются ролями. Цель системы состоит в получении решения задачи на основе использования как собственных знаний и механизмов вывода, так и данных, получаемых из ответов пользователя и из прикладных программ, которые могут вызываться диалоговой системой для непосредственного решения каких-то подзадач.В системах данного класса требуется выполнить или упорядочить для последующего выполнения (т. е. спланировать) действия, позволяющие получить решение некоторой типовой, стереотипной задачи. Каждый класс подобных стереотипных задач характеризуется тем, что входящие в него задачи имеют одинаковую и хорошо определенную структуру и отличаются друг от друга лишь значениями органического числа параметров. Поэтому для инициирования процесса решения задачи пользователю достаточно сообщить системе преследуемую им цель (т. е. идентифицировать тип задачи) и задать ограничения на значения каких-то параметров решаемой задачи. Если какие-то параметры пропущены или заданы (с точки зрения системы) неправильно, то система перехватывает инициативу, инициируя диалоги по уточнению параметров. В ходе этих диалогов пользователь также может перехватывать инициативу, задавая системе вопросы для того, чтобы использовать полученные сведения при формировании ответов на предыдущие вопросы системы.Предопределенность решаемой задачи и наличие детальных сведений о ее структуре приводят к тому, что основные функции ЕЯ-системы могут успешно выполняться в более сложной (чем в случае ЕЯ-систем общения с БД) постановке. Так, вместо жесткой структуры диалога в диалоговых системах решения задач может использоваться альтернативная или гибкая структура с произвольным перехватом инициативы. Понимание входных высказываний осуществляется с учетом текущего состояния диалога и имеющихся у системы целей. Благодаря этому упрощается понимание высказываний, содержащих неправильности, и в то же время повышается непроцедурность общения (так как система может рассматривать высказывания пользователя как определения условий текущих подзадач). Высказывания системы строятся в виде фраз естественного языка. Их генерация осуществляется, как правило, в соответствии с коммуникативными намерениями, которые определяются компонентом ведения диалога. В связи с этим содержание высказываний системы может в значительной степени варьироваться. Это могут быть результаты решения задач, вопросы, касающиеся каких-то параметров задач, объяснения действий системы и имеющихся у нее представлений о проблемной области и т. п.Основной областью практического использования диалоговых систем решения задач является обеспечение ЕЯ-доступа к различным прикладным системам, предназначенным для решения задач реальных объемов и сложности. При этом диалоговая система выступает в качестве интерфейса между прикладной системой и конечным пользователем, не знающим входного языка прикладной системы и имеющим лишь самое общее представление об алгоритме решения задачи. Большинство из существующих в настоящее время ЕЯ-систем данного типа предназначены для общения пользователя (клиента) с экспертными системами (ЭС) в процессе кооперативного решения задачи. Вместе с тем разрабатываются и ЕЯ-системы, не прибегающие в процессе решения задач к помощи пользователей (эти системы могут найти применение в простых проблемных областях).В настоящее время разработано достаточно много систем данного класса, но все они ориентированы на решение определенного круга вопросов в конкретной предметной области. Пример: система Snuka – обеспечивает общение на английском языке с экспериментальной ЭС Knobs, решающей задачи планирования военных операций (система позволяет вводить в ЭС компоненты плана, получать ответы на вопросы пользователя о предметной области, анализировать высказывания пользователя и, по желанию пользователя, автоматически генерировать полный план);система Xcalibur – обеспечивает общение на английском языке с экспериментальной ЭС Xsel, выполняет функции консультанта, помогающего пользователю выбрать нужные ему компоненты вычислительной техники и формирующего с помощью системы R1 заказ на конфигурацию технических средств;система Advisor выполняет функции консультанта, способного отвечать на вопросы студентов о различных дисциплинах и давать советы относительно возможности или необходимости изучения той или иной дисциплины и др. Существующие ЕЯ-системы данного класса пока не отвечают требованиям, диктуемым условиями промышленной эксплуатации (например, требование простоты настройки ЕЯ-системы на класс решаемых задач и на прикладную систему). В то же время следует обратить внимание на тенденцию применения в качестве подсистем ЕЯ-системы хорошо зарекомендовавших себя и допускающих настройку фрагментарных систем. Эта тенденция особенно заметна в ЕЯ-системах, решающих задачи с помощью собственных механизмов вывода. Системы обработки связных текстов Системы данного класса моделируют процесс понимания законченных описаний определенных фрагментов действительности (историй, рассказов, эпизодов и т. п.), выраженных в виде текста на естественном языке, т. е. последовательности связанных друг с другом предложений. Понимание текста трактуется как извлечение из него всей существенной с точки зрения системы информации и присоединение ее к собственной базе знаний. После этого система может отвечать на вопросы относительно фактов, событий, явлений и прочих сущностей, которые явно или косвенно описаны во введенных текстах. Очевидно, что в практическом плане модели и методы, развиваемые в системах обработки связных текстов, могут быть полезны при создании интеллектуальных систем автоматического индексирования и реферирования.Для примера рассмотрим системы Researcher и Tailor, которые образуют единый комплекс, позволяющий пользователю получать сведения из рефератов-патентов, описывающих сложные физические объекты. Система Researcher получает рефераты патентов, стрит на их основе базу знаний и делает обобщения их различных патентов, которые могут служить для изучения содержащихся в рефератах сведений, относящихся к различным объектам. Вопрос-ответные функции выполняет система Tailor. Каждый из классов ЕЯ-систем обладает специфическими особенностями, которые хорошо заметны при рассмотрении характера задач, решаемых основными функциональными компонентами этих систем (таблица 2.1).

Таблица 2.1. Сравнительная характеристика основных классов ЕЯ-систем

Классы ЕЯ-систем Компоненты ЕЯ-систем
Ведение диалога Понимание высказываний Генерация высказываний
Вопрос-ответные системы Жесткий диалог с инициативой у пользователя Отдельные правильные ЕЯ- предложения с лексическими, синтаксическими и семантическими ограничениями. Интерпретация осуществляется на ПО Прямые ответы в виде ЕЯ- предложений с лексическими, синтаксическими и семантическими ограничениями. Стандартные сообщения о неудачах
Системы общения с БД Жесткий или альтернативный диалог. Инициатива в основном принадлежит пользователю. Перехваты инициативы системой для предупреждения или устранения некоторых видов локальных неудач ЕЯ-предложения, которые могут содержать неправильности и ссылки на предложения из предыдущих запросов. Интерпретация на проблемную область или область языка общения Прямые ответы, получаемые с помощью средств генерации отчетов СУБД. Стандартные сообщения для предупреждения или устранения неудач. Перефразирование запросов на ЕЯ
Диалоговые системы решения задач Гибкий диалог. Инициатива в основном принадлежит системе. Разнообразные способы перехвата инициативы ЕЯ-предложения, которые могут содержать неправильности и ссылки на предыдущие высказывания. Интерпретация на проблемную область, область языка общения, область системы, область пользователя и область дискурса Прямые и косвенные ответы в виде ЕЯ-предложений, генерируемых с учетом целей и намерений участников общения
Системы обработки связных текстов Жесткий диалог с инициативой у пользователя Связный текст в виде последовательности ЕЯ- предложений, описывающих события, сложные объекты, явления и т.п. Связный текст в виде последовательности ЕЯ- предложений
Особым классом ЕЯ-систем, требующим наличия всех трех компонент, являются системы машинного перевода.

Лекция 3

В данной лекции будут рассмотрены функциональное назначение и лингвистическое обеспечение систем машинного перевода, а также принципы организации систем понимания речи.



Поделиться:


Последнее изменение этой страницы: 2017-02-07; просмотров: 251; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 52.14.14.164 (0.01 с.)