Выбор имени формы с помощью Mechanize

Я пытаюсь выбрать параметр в форме выпадающего меню на веб-странице с помощью Mechanize.

пока у меня есть следующее:

import mechanize as mc

br = mc.Browser()
br.open(url='http://www.marseille-port.fr/fr/Page/Escale_consultation/13286')

который отлично работает Но затем я пытаюсь найти имена всех форм на странице, используя:

for form in br.forms():
    print "Form name:", form.name
    print form

но все, что я вернусь, это то, что похоже на кучу болтовни.

Как выбрать опцию "ЖИДКОСТИ ВРАКСА" из выпадающего меню под названием "Тип судна"? Можно ли в любом случае использовать метод br.forms() для лучшего эффекта?

заранее спасибо

Редактировать:

Возвращенный гоблдигук выглядит следующим образом:

Form name: RBS_FORM
<RBS_FORM POST http://www.marseille-port.fr/fr/Page/Escale_consultation/13286 application/x-www-form-urlencoded
  <HiddenControl(radscriptmanager_TSM=) (readonly)>
  <HiddenControl(__VIEWSTATE=) (readonly)>
  <HiddenControl(__EVENTVALIDATION=/wEWBQLTiIP0DALgyIDjDAKe1c2JCgK4oYOhDQL7yb/5BffLeOZ+lEq70djr/KIO9pPd70KCFfpxP7RAtn3CKcyZ) (readonly)>
  <HiddenControl(OBJ_60000105_0_radmenu_ClientState=) (readonly)>
  <HiddenControl(OBJ_90000125_0_radmenu_ClientState=) (readonly)>
  <HiddenControl(OBJ_60000110_0_radsitemap_ClientState=) (readonly)>
  <HiddenControl(OBJ_60000151_0=) (readonly)>
  <HiddenControl(OBJ_60000151_0_SCROLLTOP=0) (readonly)>
  <TextControl(OBJ_60000119_0=)>
  <SubmitControl(OBJ_60000120_0=Rechercher) (readonly)>
  <HiddenControl(PAGECONTROLE=635110847692788750,0) (readonly)>
  <HiddenControl(EventObject=) (readonly)>
  <HiddenControl(EventMethode=) (readonly)>
  <HiddenControl(EventArgs=) (readonly)>> 

1 ответ

Решение

Ваша проблема здесь в том, что при выполнении страницы выполняется исполняемый javascript (обратите внимание на сообщение "Merci de bien vouloir Patient le temps de lélémentment of l'application."), Когда механизация не совсем справляется с этим. JavaScript создает фрейм. Форма, которую вы хотите, есть, и ее имя - "EscaleForm" - но механизация не может прочитать ее, потому что она не находится в ответе, который она получает от своего запроса.

Вы можете проверить это самостоятельно. Делать

# -*- coding: utf-8 -*-

import mechanize as mc
from BeautifulSoup import BeautifulSoup as bs

br = mc.Browser()
br.open(url='http://www.marseille-port.fr/fr/Page/Escale_consultation/13286')
html = r.read()
test = open('test.html', 'wb')
print >> test, "%s" % (bs(html).prettify())  
test.close()

и посмотрите на источник test.html, Вы не увидите элементы управления, которые вы ищете. Это то, что механизатор "видит". Затем откройте страницу в вашем веб-браузере, подождите несколько секунд и посмотрите на ее источник. Ищите форму с именем "EscaleForm". Там вы найдете нужные элементы управления.

Я не думаю, что есть способ сканировать этот сайт с помощью механизации. Вы можете вместо этого взглянуть на Selenium.

Другие вопросы по тегам