Ошибка при попытке получить текст div
Я пытаюсь получить HTML / текст внутри div
, Див имеет class
математики
Это код, который я использовал:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import time
from bs4 import BeautifulSoup as soup
from bs4 import SoupStrainer
import urllib.request
from selenium.webdriver.common.action_chains import ActionChains
import getpass
ui = input('What is your IXL username?\n\n')
pi = getpass.getpass('\nWhat is your IXL password?\n\n')
driver = 'C:\\Users\\agzsc\\Desktop\\MicrosoftWebDriver.exe'
driver = webdriver.Edge(driver)
driver.get('https://www.ixl.com')
username = driver.find_element_by_id('qlusername')
password = driver.find_element_by_id('qlpassword')
submit = driver.find_element_by_id('qlsubmit')
username.send_keys(ui)
password.send_keys(pi)
ActionChains(driver).move_to_element(submit).click().perform()
for x in range(1):
time.sleep(1)
driver.execute_script('''window.open("https://www.ixl.com/math/grade-3/multiply-by-11","_blank");''')
driver.switch_to_window(driver.window_handles[1+x])
math = soup.find_all('div', attrs={"class":"math"})
print(math)
Как видите, я использую селеновый веб-драйвер для Microsoft Edge. Я также пытаюсь разобрать страницу с bs4
и только получить div
с class
математика Тем не менее, я продолжаю получать эту ошибку:
Traceback (most recent call last):
File "C:\Users\agzsc\Downloads\powerixl.py", line 41, in <module>
math = soup.find_all('div', attrs={"class":"math"})
File "C:\Users\agzsc\AppData\Local\Programs\Python\Python36-32\lib\site-packages\bs4\element.py", line 1310, in find_all
generator = self.descendants
AttributeError: 'str' object has no attribute 'descendants'
Если кто-то может помочь, я буду очень любезен. Спасибо!
1 ответ
Решение
Вы можете заменить
soup.find_all('div', attrs={"class":"math"})
с
driver.find_element_by_css_selector('div.math').get_attribute('innerHTML')
если ты хочешь innerHTML
цели div
, или же
driver.find_element_by_css_selector('div.math').text
если вы хотите просто текстовое содержимое div