Эффективное хранение Trie для веб-приложения
У меня есть трио Aho Corasick, через которое я анализирую текст. Теперь этот три существует как часть моего приложения фляги. Он развернут на Heroku, и в настоящее время я наивно храню маринованные формы автомата, открываю их при необходимости и использую. Что может быть лучше для эффективного хранения автомата Aho Corasick для такого веб-приложения?
1 ответ
Решение
Доступ к дереву на диске не совсем тривиален, поэтому загрузка его в память - это хороший подход.
Попробуйте библиотеку pyahocorasick FWIW. http://pyahocorasick.readthedocs.io/ твой друг. Он хорошо работает с автоматом и использует компактную схему памяти, чтобы ограничить использование памяти