Ошибка при загрузке предварительно обученной французской модели FastText с помощью gensim

Я пытаюсь использовать французскую предварительно обученную бинарную модель FastText (загружается с официальной страницы FastText на github). мне нужно .bin модель, а не .vec векторы слов, чтобы приблизить слова с ошибками и из словарного запаса.

Однако, когда я пытаюсь загрузить указанную модель, используя:

from gensim.models import FastText
model = FastText.load_fasttext_format('french_bin_model_path')

Я получаю следующую ошибку:

NotImplementedError: Supervised fastText models are not supported

Что удивительно, так это то, что он прекрасно работает, когда я пытаюсь загрузить английскую бинарную модель.

Я использую Python 3.6 и Gensim 3.5.0.

Любая идея, почему она не работает с французскими векторами, приветствуется!

2 ответа

Я столкнулся с той же проблемой и в итоге использовал оболочку Facebook для Python для FastText вместо реализации gensim.

import fastText 
model = fastText.load(path_to_french_bin)

Тогда вы можете получить векторы слов для словарных слов, например:

oov_vector = model.get_word_vector(oov_word)

Что касается того, почему Генсим load_fasttext_format работает на английскую модель, а не на французскую, я не знаю!

Я никогда не использовал FastText, но проблема может заключаться в кодировке вашего файла. Попробуйте изменить его на Utf-8, если вы используете macOS, или на Latin-1, если вы используете Windows.

Другие вопросы по тегам