Как отключить мгновенный поиск Google в запросе http url?
Некоторые из моих программ отправляют прямые запросы в Google, а затем анализируют результаты HTML - например, http://www.google.com/search?q=foobar&hl=en&num=20.
К сожалению, похоже, что с недавних пор при отправке таких запросов в Google параметр num игнорируется из-за мгновенного поиска. Независимо от того, что только 10 результатов показаны на странице. Если вы отключите мгновенный поиск, то он снова работает. Проблема в том, что настройки хранятся в файле cookie или в чем-то другом, и это очень непрактично, если это вообще возможно, предварительно устанавливать со стороны программы.
Есть ли способ добавить дополнительный параметр в запрос, чтобы обойти мгновенный поиск и снова получить "num"? Я уверен, что я не только один анализ результатов HTML Google...
4 ответа
Просто добавьте "& as_qdr = all"
http://www.google.com/search?q=foobar&hl=en&num=2&start=0&as_qdr=all
Одним из обходных путей является использование параметра "start", который все еще работает и отправляет несколько запросов, но он не очень чистый.
http://www.google.com/search?q=foobar&hl=en&num=20&start=0
http://www.google.com/search?q=foobar&hl=en&num=20&start=10
...
Дальнейшие исследования показывают, что эта "ошибка", по-видимому, возникает только для веб-браузеров, а не при использовании клиентов HTTP, которые не предоставляют агента пользователя.
Так что все еще хорошо в конце концов!
&complete=0
тоже будет работать.
Например: http://www.google.com/search?q=foobar&hl=en&num=20&complete=0
Ссылка на эту ссылку на веб-приложение.