Получение оценок METEOR для японского текста

Я хочу создать партитуру METEOR для нескольких японских струнных. Я импортировал nltk, wordnet а также omw но результаты не убеждают меня, что он работает правильно.

      from nltk.corpus import wordnet
from nltk.translate.meteor_score import single_meteor_score

nltk.download('wordnet')
nltk.download('omw')

reference = "チップは含まれていません。"
hypothesis = "チップは含まれていません。"

print(single_meteor_score(reference, hypothesis))

Это выводит 0.5 но, конечно, это должно быть намного ближе к 1.0 учитывая справку и гипотезу идентичны?

Нужно ли мне каким-то образом указывать, какой язык wordnet я хочу использовать при вызове single_meteor_score() Например:

single_meteor_score(reference, hypothesis, wordnet=wordnetJapanese.

1 ответ

В ожидании проверки квалифицированным лингвистом я, кажется, нашел решение. Я нашел токенизатор с открытым исходным кодом для японского языка. Я предварительно обработал все мои ссылки и строки гипотез, чтобы вставить пробелы между японскими токенами, а затем запустил nltk.single_meteor_score() над файлами.

Другие вопросы по тегам