"Пользователи", отправляющие запросы GET на веб-сайт, когда ожидается POST

Я продолжаю видеть странное поведение в наших журналах, где URL-адреса, которые обычно должны быть доступны только через запрос POST, вызываются через GET. URL-адреса включают в себя те, которые когда-либо создавались только с помощью javascript, поэтому вы не ожидаете, что обычный паук встретит их. Если я ищу в наших журналах IP-адрес, с которого поступают эти запросы, создается впечатление, что этот пользователь только когда-либо отправлял нам GET-запросы.

Это не похоже на типичное поведение бота - запросы распределяются, а не рассылают на наш сервер кучу запросов в короткие сроки. Все пользовательские агенты - это обычные браузеры. Однако - и это немного спекулятивно - на самом деле это не похоже на то, что человек просматривает сайт, поскольку они, кажется, прыгают повсюду, а не переходят по одной ссылке на другую.

Кто-нибудь еще видит такое поведение на своем сайте? Любые предложения, что вызывает это?

3 ответа

Решение

Это может быть кто-то, кто ловит подвиги на вашем сайте. Они будут анализировать ваши формы, а затем создавать свои собственные URL-адреса в поисках слабых сторон или нестандартных способов использования сервиса. Если обычно это один и тот же IP-адрес, то вы, вероятно, можете предположить, что это так.

Одним из примеров может быть то, что вы являетесь поставщиком потокового мультимедиа, а кто-то пытается собрать воедино исходные URL-адреса для скрипта загрузки видео. Часто это просто спамеры, желающие передать через ваши контактные формы.

Не берите слишком много от IP-адресов и пользовательских агентов. Первый может быть прокси (через сети, такие как Tor), а последний может быть изменен по желанию. То, что IP-адреса и пользовательские агенты меняются, не означает, что это не тот же пользователь, который генерирует запросы.

Я часто перебираю сайты для информации, и когда мне действительно лень, я отправлю все как GET Вместо того, чтобы использовать POST... много раз, CGI, которые требуют POST примет GET, Я настроил свой сценарий, чтобы использовать случайный USER-AGENT из списка: сафари на ipad, firefox на XP или Internet Explorer на Vista.

Кто знает, может быть, я зачищаю ваш сайт и получаю очки за ответ;-).

Просто дикая догадка

  • Существует нечто, называемое "веб-акселератор", плагин для браузера, который предварительно выбирает ссылки, поэтому, когда вы решили щелкнуть по нему, он уже был кэширован. Это не должно кэшировать вещи, которые выглядят как запросы, но, возможно, некоторые обнаружат, что ваши URL подходят для предварительной выборки. Поскольку он запускается в браузере, он по крайней мере будет видеть все URL-адреса, добавленные в документ javascript (посредством доступа document.write или DOM).

  • "Веб-ускоритель" также может быть реализован как часть веб-прокси. Это кажется менее вероятным, потому что это должно было бы интерпретировать javascript, но если URL-адреса появляются в javascript полностью, это может быть просто поиск любого текста, который выглядит как URL-адрес и может найти их.

Это объясняет, почему запросы распределяются (такая вещь будет запускать пару запросов каждый раз, когда реальный пользователь посещает сайт), почему строки агента пользователя соответствуют реальному браузеру (если это плагин браузера, он использует свою строку агента пользователя) и почему они перепрыгивают повсюду (они одновременно пытаются предварительно выбрать несколько ссылок и, вероятно, эвристический выбор, какие из них должны быть, не работает с вашим сайтом).

Другие вопросы по тегам