Управление HTML с использованием mod_proxy с Apache, например, для удаления рекламы

Пока это просто техническая задача, но в основном я хотел бы сделать следующее:

Создайте обратный (шлюз) прокси на веб-основе, используяmod_proxyа такжеmod_proxy_htmlэто не только переписывает HTML-URL для соответствия имени хоста прокси, но также переписывает или манипулирует HTML-кодом, который передается через прокси.

Эта манипуляция с прокси-сервером шлюза "человек посередине" позволит делать все, например:

  • убрать рекламу
  • переводить текст с одного языка на другой
  • в противном случае взломать или "улучшить" оригинальный сайт

Конечно, он также может быть использован для многих плохих вещей, но это выходит за рамки этого вопроса.

я знаю это mod_proxy_html анализирует исходный HTML-код, чтобы переписать все URL-адреса, но позволяет ли это мне написать собственный код, который будет оценивать и обрабатывать анализируемый HTML-код? Или есть другие модули для этого?

Или есть ли обратные прокси, которые могут это сделать? Я готов адаптироваться к любому языку, который подходит для этой цели.

1 ответ

Используя mod_rewrite или же mod_proxy_html Вы могли бы сделать это.

Эти модули позволяют вам, как вы, наверное, уже знаете, переписать / украсить URL. Вместо того, чтобы изменять содержимое веб-страницы, которая не является ролью Apache, вы можете изменить их структуру так, чтобы ссылка на полученной веб-странице выглядела так:

10.10.1.1/my_secret_injector/alter?url=<the_real_url>

Вместо просто <the_real_url>,

Затем реализуйте свой алгоритм удаления рекламы или любого другого языка на выбранном вами языке на указанном веб-сервере (10.10.1.1).

Другие вопросы по тегам