Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь КАТЕГОРИИ: АрхеологияБиология Генетика География Информатика История Логика Маркетинг Математика Менеджмент Механика Педагогика Религия Социология Технологии Физика Философия Финансы Химия Экология ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Представление морфологической информации в модуле лемматизации отдела рро ипии
Способ представления МИ в модуле лемматизации РРО представлен в таблице 6.3. Он позволяет экономить 2 байта на каждой записи, по сравнению с модулем LINGUIST. Это является существенной экономией дискового пространства, так как предполагаемое количество записей – 2 млн. Кроме того, определение значений отдельных категорий МИ в модуле лемматизации не уступает в простоте и скорости модулю LINGUIST. Для извлечения МИ, используются маски категорий МИ, приведенные в таблице 6.4. Определение значения одной из категорий, например рода, происходит путём применения операции побитового «и» значения МИ и маски категорий. Если словоформе категория не присуща, то результат операции побитового «и» её МИ и маски этой категории будет равен 0. Приведем примеры извлечения значений отдельных категорий морфологической информации. Пример 3. Определение значения категории «род» словоформы:
MI & rod_mask
Результат: _Masculine, _Feminine, _Neuter или 0. Пример 4. Определение падежа слова, с морфологической информацией MI:
MI & case_mask
Результат – 0, если слово не склоняется по падежам (глагол, наречие и т.д), или одно из численных значений категории «падеж», приведенных в таблице 6.3.
Зная МИ слов предложения, можно проводить его синтаксический анализ (СА).
Таблица 6.3. – Представление МИ в модуле лемматизации
Таблица 6.4. – Маски категорий МИ
Лекция 7
В данной лекции будут рассмотрены понятия синтаксиса, синтаксической единицы и синтаксической связи, описаны средства выражения синтаксических связей русского языка в словосочетаниях, а также даны типы связей между словами в словосочетаниях.
Синтаксис изучает правила связывания слов и форм слов, а также единства, в составе которых эти правила реализуются — синтаксические единицы. Минимальной составляющей синтаксических единиц является слово (лексема) и форма слова, т.е. высшие морфологические единицы. Более крупными синтаксическими единицами являются: словосочетание; простое предложение; сложное предложение. Задача синтаксического анализа (СА) состоит в том, чтобы, используя МИ о словоформах, полученную на этапе МА, и сведения из словаря, построить синтаксическую структуру входного предложения (осуществить разбор предложения). Синтаксическая структура отражает синтаксические связи, существующие между синтаксическими единицами.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Последнее изменение этой страницы: 2017-02-07; просмотров: 142; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.141.31.209 (0.006 с.) |