SpamAssassin: Сайт Байеса не работает?
Давным-давно я реализовал байесовскую фильтрацию по всему сайту в соответствии с http://wiki.apache.org/spamassassin/SiteWideBayesSetup.
Я не думаю, что это когда-либо работало, и я определенно считаю, что мои оценки спама всегда отрицательны, с BAYES_00
предполагая, что Байес вообще не использовался.
Вот что у меня в моем local.cf
файл:
bayes_path /etc/mail/spamassassin/bayes/bayes
bayes_file_mode 0777
Когда я бегу sa-learn
Вместо этого я обнаружил, что токены хранятся в отдельных домашних каталогах.
Какой правильный способ заставить это работать?
Дополнительный вопрос: если я смогу заставить это работать, могу ли я объединить различные bayes_tok
и другие файлы?
1 ответ
Если вы получаете BAYES_00
результаты, то Байес действительно работает, поскольку он классифицировал электронную почту как ветчину. Нейтральный результат будет BAYES_50
, Вам просто нужно правильно обучить байесовскую базу данных.
Если sa-learn
создает / обновляет байес-файлы в вашем домашнем каталоге, а затем либо не читает желаемое local.cf
файл или bayes_path
переопределяется пользовательским файлом конфигурации (например, /root/.spamassassin/user_config
).
Вы можете попробовать один из следующих:
- бежать
sa-learn
под той же учетной записью, что и spamassassin указать явный путь к sa-learn, т.е.
sa-learn --dbpath /etc/mail/spamassassin/bayes/bayes
использовать
-D
возможность увидеть, что на самом деле происходит, т.е. какие файлы конфигурации читаются и т. д.
Если / когда вы работаете, вы не можете объединить различные файлы базы данных. Есть как минимум bayes_toks
и bayes_seen
файл, потому что один содержит извлеченные токены, а другой имеет адреса электронной почты Message-Id:s и связанный статус обучения (спам / ветчина). Тогда может быть дополнительный bayes_journal
если вы используете отложенную синхронизацию.
Более подробная информация доступна на странице руководства для sa-learn:
https://spamassassin.apache.org/full/3.4.x/doc/sa-learn.html