Управление HTML с использованием mod_proxy с Apache, например, для удаления рекламы
Пока это просто техническая задача, но в основном я хотел бы сделать следующее:
Создайте обратный (шлюз) прокси на веб-основе, используяmod_proxy
а такжеmod_proxy_html
это не только переписывает HTML-URL для соответствия имени хоста прокси, но также переписывает или манипулирует HTML-кодом, который передается через прокси.
Эта манипуляция с прокси-сервером шлюза "человек посередине" позволит делать все, например:
- убрать рекламу
- переводить текст с одного языка на другой
- в противном случае взломать или "улучшить" оригинальный сайт
Конечно, он также может быть использован для многих плохих вещей, но это выходит за рамки этого вопроса.
я знаю это mod_proxy_html
анализирует исходный HTML-код, чтобы переписать все URL-адреса, но позволяет ли это мне написать собственный код, который будет оценивать и обрабатывать анализируемый HTML-код? Или есть другие модули для этого?
Или есть ли обратные прокси, которые могут это сделать? Я готов адаптироваться к любому языку, который подходит для этой цели.
1 ответ
Используя mod_rewrite
или же mod_proxy_html
Вы могли бы сделать это.
Эти модули позволяют вам, как вы, наверное, уже знаете, переписать / украсить URL. Вместо того, чтобы изменять содержимое веб-страницы, которая не является ролью Apache, вы можете изменить их структуру так, чтобы ссылка на полученной веб-странице выглядела так:
10.10.1.1/my_secret_injector/alter?url=<the_real_url>
Вместо просто <the_real_url>
,
Затем реализуйте свой алгоритм удаления рекламы или любого другого языка на выбранном вами языке на указанном веб-сервере (10.10.1.1).