Добавление элемента в Marisa Trie
В задаче обнаружения орфографических ошибок я использую структуры данных marisa_tries для своего лексикона с Python 3.5.
Короткий вопрос
Как добавить элемент в marisa_trie
?
контекст
Идея такова: если в моем лексиконе есть слово, то оно правильное. Теперь, если это не в моем лексиконе, это, вероятно, неправильно. Но я вычислил частоты слов в общем документе, и если частота слов достаточно высока, я хочу сохранить это слово, учитывая, что оно достаточно часто, поэтому, вероятно, правильно. В таком случае, как добавить это новое слово в мой marisa_trie.Trie
словарный запас? (без необходимости каждый раз строить новое дерево)?
Спасибо:)
1 ответ
marisa_trie.Trie
реализует неизменный три, поэтому ответ на ваш вопрос: это невозможно.
Вы можете попробовать подобный пакет Python под названием datrie
который поддерживает модификации и относительно быстрые запросы (на странице PyPI перечислены некоторые тесты по сравнению со встроенными dict
).