Как понять webdriver и get() в Selenium?
Как напечатать все html/css теги веб-страницы с помощью Selenium:
from selenium import webdriver
browser = webdriver.Firefox()
browser.get('http://seleniumhq.org/')
Когда я делаю:
print(browser),
это печатает это:
"<selenium.webdriver.firefox.webdriver.WebDriver (session="ce01359c-03e4-499d-a3fb-230bda9ac24c")>"
Это объект или переменная или список / набор / кортеж /dict или что это? Может кто-нибудь объяснить это, пожалуйста?
3 ответа
В результате вы получаете объект. В начале вашего кода вы решили вызвать этот объект обозревателя (или присвоить его переменной). Когда вы затем запустите функцию browser.get(), она не изменит содержимое браузера переменных и, следовательно, результат не будет иметь никакого отношения к веб-странице, на которой вы находитесь.
Вы должны взглянуть на документацию, особенно на эту страницу, так как она дает хорошее представление. Если вы поработаете с этим объяснением, вы должны получить хорошее (базовое) понимание того, как работает API. Дополнительные главы могут заполнить пробелы, касающиеся специфики размещения элементов на странице.
С другой стороны, если все, что вы делаете - это очищение HTML, могу предложить вам взглянуть на Beautiful Soup.
Вы видели это правильно. Согласно документации New Session, команда New Session создает новый сеанс WebDriver с узлом конечной точки.
HTTP Method URI Template
POST /session
Согласно шагам удаленного конца, весь процесс полностью зависит от реализации, но обычно sessionId
, а также URL
а также URL prefix
из вышестоящего удаленного конца необходимо отслеживать. Дополнительно,
Идентификатор сеанса является результатом генерации UUID.
Сеанс будет новым сеансом с идентификатором сеанса с идентификатором сеанса.
Следовательно, браузер, который является объектом class selenium.webdriver.firefox.webdriver.WebDriver()
печатает следующее:
"<selenium.webdriver.firefox.webdriver.WebDriver (session="ce01359c-03e4-499d-a3fb-230bda9ac24c")>"
Вы можете найти интересное обсуждение в значениях, возвращаемых веб-драйверами