CRFSuite - Как использовать предоставленную функцию создания сценариев?
Я попытался использовать следующую команду для генерации формата данных CRFSuite, используя 'ner.py. скрипт найден в папке примеров исходного кода. Но он продолжает жаловаться на количество полей. Когда он не жалуется, он просто завершает работу и выводит пустой файл, в котором ничего нет.
$ cat _train.txt | ./ner.py > nerout.txt
Traceback (most recent call last):
File "./ner.py", line 270, in <module>
crfutils.main(feature_extractor, fields=fields, sep=separator)
File "D:\temp\crfs\example\crfutils.py", line 159, in main
for X in readiter(fi, F, options.separator):
File "D:\temp\crfs\example\crfutils.py", line 64, in readiter
'Too few fields (%d) for %r\n%s' % (len(fields), names, line))
ValueError: Too few fields (1) for ['y', 'prfx', 'ent']
COMMENT 0 O
Я не уверен, что понимаю, как это использовать.
Мои тренировочные данные выглядят так
wrote 0 O
John 0 B-PERS
for 1 O
me 0 O
И я попытался изменить начало скрипта ner.py следующим образом (все осталось так, как было предоставлено) - изменил количество полей и изменил разделитель пробелов на символ табуляции.
# Separator of field values.
separator = ' '
# Field names of the input data.
fields = 'y prfx ent'