SpamAssassin: Сайт Байеса не работает?

Давным-давно я реализовал байесовскую фильтрацию по всему сайту в соответствии с http://wiki.apache.org/spamassassin/SiteWideBayesSetup.

Я не думаю, что это когда-либо работало, и я определенно считаю, что мои оценки спама всегда отрицательны, с BAYES_00 предполагая, что Байес вообще не использовался.

Вот что у меня в моем local.cf файл:

bayes_path /etc/mail/spamassassin/bayes/bayes
bayes_file_mode 0777

Когда я бегу sa-learn Вместо этого я обнаружил, что токены хранятся в отдельных домашних каталогах.

Какой правильный способ заставить это работать?

Дополнительный вопрос: если я смогу заставить это работать, могу ли я объединить различные bayes_tok и другие файлы?

1 ответ

Если вы получаете BAYES_00 результаты, то Байес действительно работает, поскольку он классифицировал электронную почту как ветчину. Нейтральный результат будет BAYES_50, Вам просто нужно правильно обучить байесовскую базу данных.

Если sa-learn создает / обновляет байес-файлы в вашем домашнем каталоге, а затем либо не читает желаемое local.cf файл или bayes_path переопределяется пользовательским файлом конфигурации (например, /root/.spamassassin/user_config).

Вы можете попробовать один из следующих:

  • бежать sa-learn под той же учетной записью, что и spamassassin
  • указать явный путь к sa-learn, т.е.

    sa-learn --dbpath /etc/mail/spamassassin/bayes/bayes
    
  • использовать -D возможность увидеть, что на самом деле происходит, т.е. какие файлы конфигурации читаются и т. д.

Если / когда вы работаете, вы не можете объединить различные файлы базы данных. Есть как минимум bayes_toks и bayes_seen файл, потому что один содержит извлеченные токены, а другой имеет адреса электронной почты Message-Id:s и связанный статус обучения (спам / ветчина). Тогда может быть дополнительный bayes_journal если вы используете отложенную синхронизацию.

Более подробная информация доступна на странице руководства для sa-learn:
https://spamassassin.apache.org/full/3.4.x/doc/sa-learn.html

Другие вопросы по тегам