120 likes | 298 Views
Компьютерный анализ естественно - языкового текста. Кафедра информационных систем в искусстве и гуманитарных науках. Компьютерный анализ естественно - языкового текста СТРУКТУРА КУРСА. Введение в дисциплину Автоматический анализ текста на морфологическом уровне
E N D
Компьютерный анализ естественно-языкового текста Кафедра информационных систем в искусстве и гуманитарных науках
Компьютерный анализ естественно-языкового текстаСТРУКТУРА КУРСА • Введение в дисциплину • Автоматический анализ текста на морфологическом уровне • Автоматический анализ текста на синтаксическом уровне • Семантический компонент в системах автоматического анализа текста
Компьютерный анализ естественно-языкового текстаСТРУКТУРА КУРСА • Автоматический анализ текста на морфологическом уровне • Морфологическийуровень в ЛИТ • Основные понятия морфологии в компьютерной морфологии • Основные процедуры компьютерной морфологии • Компьютерная морфология русского языка • Технологии морфологического анализа • «Предсказание» (типизация) • Вопросы, смежные с синтаксисом
СВОДКА ОСНОВНЫХ ОПЕРАЦИЙНАД РЕГУЛЯРНЫМИ ВЫРАЖЕНИЯМИ • операции только над языками • операция над языками, превращающая их в отношения • операции над языками и отношениями • операция над отношениями (с оговоркой – над языками) • операции только над отношениями
ОПЕРАЦИИ ТОЛЬКО НАД ЯЗЫКАМИ • отрицание (~) • термовое отрицание (\)
ОПЕРАЦИЯ НАД ЯЗЫКАМИ, ПРЕВРАЩАЮЩАЯ ИХ В ОТНОШЕНИЯ • произведение (: или .x.)
ОПЕРАЦИИ НАД ЯЗЫКАМИ И ОТНОШЕНИЯМИ • конкатенация (запись через пробел или заключение в фигурные скобки без пробела) • итерация (* и +) • факультативность (заключение в круглые скобки) • объединение (|) • пересечение (&) • инверсия (англ. “reverse”; знак .r)
ОПЕРАЦИЯ НАД ОТНОШЕНИЯМИ • композиция (.o.) Композиция A.o.B двух отношений A, B включает такие и только такие пары цепочек k:m, для которых верно, что отношение A включает пару цепочек k:l и отношение B включает пару цепочек l:m Принципиально возможно применять композицию к двум языкам, но результат будет такой же, как и при пересечении языков.
ОПЕРАЦИЯ ТОЛЬКО НАД ОТНОШЕНИЯМИ • обращение (англ. “inverse”; знак .i)
ПРАВИЛА ПРИОРИТЕТНОСТИ ОПЕРАТОРОВ
ПРАКТИЧЕСКОЕ ЗАДАНИЕ • Записать на языке LEXC лексикон с данными для морфологического анализа и синтеза форм 15 русских существительных. Откомпилировать его с помощью xfst и продемонстрировать работоспособность • То же – для 15 английских существительных с теми же (условно) значениями • Записать на языке LEXC данные (лексикон) для межъязыковых преобразований лексических и грамматических значений из двух этих лексиконов • Откомпилировать три лексикона в нужном порядке и применить композицию так, чтобы можно было переводить эти существительные с одного языка на другой.