как преобразовать данные в CoNLL09?
У меня есть данные по биологии, но в этом примере они знают только предикат.
например:
<example src="PERMUTATE" no="3">
<text>Both RAP1 and 2 are important vaccine candidates because it has been shown that Alanine can block the action of a postulated repressor (Schofield et al., 1986; Harnyuttanakorn et al., 1992; Howard et al., 1998a).</text>
<arg n="0">Alanine</arg>
<arg n="1">the action of a postulated repressor</arg>
</example>
с
<roles>
<role n="0" descr="causer agent
" />
<role n="1" descr="theme (process or entity being stopped)
" />
</roles>
насколько я знаю, CoNll09 играет большую роль в наборе обучающих данных. Онлайн-модель семантической ролевой маркировки в Интернете поддерживает только формат CoNll и... которые содержат больше информации в обучении предложений. как я могу преобразовать свои данные в него?
большое спасибо.