Форум "Оценка методов автоматического анализа текста:
морфологические парсеры русского языка"

 Приглашение к участию 
 Новости 
 О проекте 
 Манифест 
 Общие принципы 
 Заявка на участие 
 Участники 
 Дорожки 
 Экспертиза 
 Материалы Форума 
  Тестовые коллекции 
  Таблицы оценок 
 Сроки проведения 
 Публикации 
 FAQ 
 Форум и рассылка 
 
 Диалог 2010 

Дорожка "ДИЗАМБИГУАЦИЯ: ЛЕММА"

Категория: дизамбигуация.

Задача

Правильно определить лемму (исходную форму) словоформы. Система должна предлагать единственно правильный/наиболее вероятный вариант из всех возможных. Если в разборе представлено несколько вариантов лемматизации, оценивается первая по счету лемма.
Общая процедура проведения дорожки стандартна.

Коллекция

В качестве исходного набора данных используется Основная коллекция.

Формулировка задания для участвующей системы

Система-участник получает исходные данные. Ответом системы является файл(ы) в согласованном формате. Леммы записываются в теге "lemma". Если система предлагает несколько вариантов лемматизации, каждый вариант записывается в отдельном теге.

Методология оценки

Общая методология оценки стандартна. Оценивается правильность единственного/наиболее вероятного варианта из всех возможных. Если в разборе представлено несколько вариантов лемматизации, оценивается первая по счету лемма.

Форматы данных