Получение оценок METEOR для японского текста
Я хочу создать партитуру METEOR для нескольких японских струнных. Я импортировал
nltk
,
wordnet
а также
omw
но результаты не убеждают меня, что он работает правильно.
from nltk.corpus import wordnet
from nltk.translate.meteor_score import single_meteor_score
nltk.download('wordnet')
nltk.download('omw')
reference = "チップは含まれていません。"
hypothesis = "チップは含まれていません。"
print(single_meteor_score(reference, hypothesis))
Это выводит
0.5
но, конечно, это должно быть намного ближе к
1.0
учитывая справку и гипотезу идентичны?
Нужно ли мне каким-то образом указывать, какой язык wordnet я хочу использовать при вызове
single_meteor_score()
Например:
single_meteor_score(reference, hypothesis, wordnet=wordnetJapanese
.
1 ответ
В ожидании проверки квалифицированным лингвистом я, кажется, нашел решение. Я нашел токенизатор с открытым исходным кодом для японского языка. Я предварительно обработал все мои ссылки и строки гипотез, чтобы вставить пробелы между японскими токенами, а затем запустил
nltk.single_meteor_score()
над файлами.