как преобразовать данные в CoNLL09?

У меня есть данные по биологии, но в этом примере они знают только предикат.

например:

      <example src="PERMUTATE" no="3">
                    <text>Both RAP1 and 2 are important vaccine candidates because it has been shown that Alanine can block the action of a postulated repressor (Schofield et al., 1986; Harnyuttanakorn et al., 1992; Howard et al., 1998a).</text>
                    <arg n="0">Alanine</arg>
                    <arg n="1">the action of a postulated repressor</arg>
</example>

с

                      <roles>
                    <role n="0" descr="causer agent&#x0A;" />
                    <role n="1" descr="theme (process or entity being stopped)&#x0A;" />
                </roles>

насколько я знаю, CoNll09 играет большую роль в наборе обучающих данных. Онлайн-модель семантической ролевой маркировки в Интернете поддерживает только формат CoNll и... которые содержат больше информации в обучении предложений. как я могу преобразовать свои данные в него?

большое спасибо.

0 ответов

Другие вопросы по тегам