Современные научные описания грамматического строя языков составляются на основе лингвистически размеченных корпусов. Пользователями этих корпусов становятся не только лингвисты, но и представители других гуманитарных дисциплин. Со своими сложностями сталкиваются и создатели лингвистически размеченных корпусов древних письменных памятников: их лексика и грамматика не изучены в полном объеме, а сами тексты не свободны от разного рода ошибок и темных мест. Разметка таких текстов должна быть в первую очередь ручной.
Системы обработки текста ATE и ObjectATE (Object-oriented ancient text editor) разрабатываются в Отделе лингвистического источниковедения Институте русского языка им. В. В. Виноградова РАН. С их помощью ведется ручная и полуавтоматическая разметка морфологии и синтаксиса в древнерусских текстах – переводных памятниках и летописях. Система ObjectATE призвана быть максимально гибкой и многофункциональной, позволяющей создателю корпуса самостоятельно строить любые единицы лингвистического анализа по собственным (а не только по общепринятым) моделям. В основе системы лежит объектно-ориентированный подход к организации данных.