Система разметки текста ObjectATE

Выполнено при поддержке гранта РГНФ 09-04-12144в


Современные научные описания грамматического строя языков составляются на основе лингвистически размеченных корпусов. Пользователями этих корпусов становятся не только лингвисты, но и представители других гуманитарных дисциплин. Со своими сложностями сталкиваются и создатели лингвистически размеченных корпусов древних письменных памятников: их лексика и грамматика не изучены в полном объеме, а сами тексты не свободны от разного рода ошибок и темных мест. Разметка таких текстов должна быть в первую очередь ручной.

Системы обработки текста ATE и ObjectATE (Object-oriented ancient text editor) разрабатываются в Отделе лингвистического источниковедения Институте русского языка им. В. В. Виноградова РАН. С их помощью ведется ручная и полуавтоматическая разметка морфологии и синтаксиса в древнерусских текстах – переводных памятниках и летописях. Система ObjectATE призвана быть максимально гибкой и многофункциональной, позволяющей создателю корпуса самостоятельно строить любые единицы лингвистического анализа по собственным (а не только по общепринятым) моделям. В основе системы лежит объектно-ориентированный подход к организации данных.

Подробнее...


Материалы

Описание работы с программой на примере демонстрационной базы появится на сайте позже.

Публикации и материалы конференций


Результаты работы:


Ссылки:



А. А. Пичхадзе, А. В. Сахарова, А. И. Зобнин.
Обратная связь: r u s y a z [ a t ] y a n d e x [ d o t ] r u .

15.12.2009.