Меню
Главная
Авторизация/Регистрация
 
Главная arrow Литература arrow Исследование вклада синтаксических признаков в распознавание анафоричесних отношений

Теперь необходимо сделать из этих кластеров признаки для обучени...

Заключение

В настоящей работе была реализована система распознавания анафорических отношений на основе синтаксически разобранных текстов, которая включает в себя собственный алгоритм для извлечения именных групп. Сначала были реализованы базовые признаки для обучения и был обучен классификатор SVM. Далее с помощью трех экспериментов были введены также и синтаксические признаки в алгоритм классификации.

В работе были использованы следующие синтаксические признаки:

  • 1) расстояние от корня до местоимения (глубина местоимения);
  • 2) тип связи местоимения и слова, контролирующего данное слово;
  • 3) отношение глубины местоимения к глубине предложения;
  • 4) количество узлов с той же глубиной;
  • 5) количество запятых в предложении;
  • 6) расстояние от анафора до антецедента;
  • 7) разница уровней в дереве (уровень антецедента vs уровень местоимения);
  • 8) тип синтаксической связи антецедента со словом, его контролирующим;
  • 9) Есть ли в списке отношений "предик"?
  • 10) Есть ли в списке отношений "1-компл"?
  • 11) Есть ли в списке отношений второй кластер синтаксических отношений?
  • 12) Есть ли в списке отношений четвертый кластер синтаксических отношений?

Последние четыре признака проверяют наличие определенных типов отношений на расстоянии от узла с антецедентом и корнем дерева. Первая группа (1-5) - это признаки, относящееся только к анафору. Вторая группа (6-7) - это признаки, связывающие анафора и антецедент. Третья группа (8-12) - это признаки, относящиеся к антецеденту. Первые две группы улучшили алгоритм на 8 и 3 процента соответственно. Последняя группа показала незначительное улучшение результатов работы алгоритмов, потому как распределение типов синтаксических отношений вне анафорических связей совпадает с распределением внутри.

В целом, удалось увеличить показатели работы классификатора на 12 процентов, что говорит о том, что признаки, которые удалось извлечь с помощью синтаксического парсера, имеют значительное влияние на алгоритм работы системы по разрешению анафорических отношений.

 
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 
Предметы
Агропромышленность
Банковское дело
БЖД
Бухучет и аудит
География
Документоведение
Естествознание
Журналистика
Информатика
История
Культурология
Литература
Логика
Логистика
Маркетинг
Математика, химия, физика
Медицина
Менеджмент
Недвижимость
Педагогика
Политология
Право
Психология
Религиоведение
Социология
Статистика
Страховое дело
Техника
Товароведение
Туризм
Философия
Финансы
Экология
Экономика
Этика и эстетика
Прочее