Диссертация А.Сокирко "Семантические словари в автоматической обработке текста (по материалам системы ДИАЛИНГ)".
Наши технологии базируются на многоуровневом представлении естестевенного языка, которое, в свою очередь, было заимствовано у системы ФРАП (Система французско-русского автоматического перевода была разработана коллективом лаборатории машинного перевода Всесоюзного центра переводов совместно с коллективом лаборатории машинного перевода МГПИИЯ им М. Тореза. 1976-1986 ГГ. Компоненты, составляющие языковую модель, - лингвистические процессоры, которые друг за другом обрабатывают входной текст. Вход одного процессора является выходом другого.
Выделяются следующие компоненты:. Графематический анализ. Выделение слов, цифровых комплексов, формул и т. (подробнее ). Морфологический анализ.
Диссертация А.Сокирко "Семантические словари в автоматической обработке текста (по материалам системы ДИАЛИНГ)".
Построение морфологической интерпретации слов входного текста. (подробнее ).
Генераторы текстов и "говорящие" программы; - системы обработки естественного языка; - коллекции ресурсов; - словари и тезаурусы. Автоматический анализ текстов практически всегда связан с работой Способы представления словарей для автоматической обработки текстов Например, для морфологического анализа словарь состоит из. Проект АОТ (сокр. автоматическая обработка текста) — общее для анализа текста, а также все необходимые для работы словари. Семантические словари в автоматической обработке текста :По материалам системы ДИАЛИНГ тема диссертации и автореферата по ВАК 05.13.17.
Синтаксический анализ. Построение дерева зависимостей всего предложения. (подробнее ). Семантический анализ.
Построение семантического графа текста. (подробнее ). Для каждого уровня разрабатывался свой язык представления. Язык представления, как полагается, состоит из констант и правила их комбинирования. На графематическом уровне константами были графематические дескрипторы (ЛЕ – лексема, ЦК – цифровой комплекс и т.
) На морфологическом уровне – граммемы (рд – родительный падеж, мн -множественное число). На синтаксическом – названия отношений и групп (ПОДЛ – отношение между подлежащим и сказуемым, ПГ - предложная группа). На семантическом – семантические категории и отношения. С каждого уровня представления можно сделать переход к такому же представлению на другом естественном языке (трансфер), что позволяет осуществлять перевод, даже если "глубокий" (семантический) анализатор не смог обработать текст. Основой для построения уровней служили результаты работы предыдущих этапов, но, что важно, последующие анализаторы также могли улучшить представление предыдущих. Например, для какого-то предложения синтаксический анализатор не смог построить полного дерева зависимостей, тогда, возможно, семантический анализатор сможет спроектировать им построенный семантический граф на синтаксис.
Таким образом, текст обрабатывается по следующей технологии:.