Как очистить результат автоматического предложения Yahoo Search Selen Python?
Я пытаюсь использовать Селен Python для автоматического поиска на Yahoo финансов. Когда я набираю несколько слов, предложение будет появляться как то же самое в предложении Google.
Я нашел элемент списка с xpath должен быть предложения, сделанные Yahoo:
//*[@id="search-assist-input"]/div[2]/ul
Кажется, содержание предложения скрыто в этом списке, но оно невидимо, я имею в виду, когда я нажимаю, чтобы развернуть его, оно просто исчезает. Я не знаю, есть ли в Firefox или Chrome какие-то "всегда разворачивающиеся узлы", но эти элементы кажутся очень труднодоступными. Я попытался получить все дочерние элементы под этот элемент, он показывает, что элемент не может быть найден:
from chrome_driver.chrome import Chrome
driver = Chrome().get_driver()
driver.get('https://finance.yahoo.com/')
driver.find_elements_by_xpath("//div[@id='search-assist-input']/div/input")[0].send_keys('goog')
x = driver.find_elements_by_xpath("//div[@data-reactid='56']/ul[@data-reactid='57']/*")
Как я могу получить эти автоматические предложения из окна поиска?
3 ответа
Извлечь автоматические предложения относительно текста поиска, например, GOOG в поле поиска https://finance.yahoo.com/
вам нужно вызвать WebDriverWait, чтобы автоматически отображались предложения, и вы можете использовать следующее решение:
Блок кода:
from selenium import webdriver from selenium.webdriver.chrome.options import Options from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.common.by import By from selenium.webdriver.support import expected_conditions as EC options = Options() options.add_argument("start-maximized") options.add_argument("disable-infobars") options.add_argument("--disable-extensions") driver = webdriver.Chrome(chrome_options=options, executable_path=r'C:\WebDrivers\ChromeDriver\chromedriver_win32\chromedriver.exe') driver.get('https://finance.yahoo.com/') WebDriverWait(driver, 20).until(EC.element_to_be_clickable((By.XPATH, "//input[@name='p']"))).send_keys("goog") yahoo_fin_auto_suggestions = WebDriverWait(driver, 20).until(EC.visibility_of_all_elements_located((By.XPATH, "//input[@name='p']//following::div[1]/ul//li"))) for item in yahoo_fin_auto_suggestions : print(item.text)
Консольный вывод:
GOOG Alphabet Inc.Equity - NASDAQ GOOGL Alphabet Inc.Equity - NASDAQ GOOGL-USD.SW AlphabetEquity - Swiss GOOGL180518C01080000 GOOGL May 2018 call 1080.000Option - OPR GOOG.MX Alphabet Inc.Equity - Mexico GOOG180525C01075000 GOOG May 2018 call 1075.000Option - OPR GOOG180518C00720000 GOOG May 2018 call 720.000Option - OPR GOOGL180518C01120000 GOOGL May 2018 call 1120.000Option - OPR GOOGL.MX Alphabet Inc.Equity - Mexico GOOGL190621C01500000 GOOGL Jun 2019 call 1500.000Option - OPR
Поскольку исходный код веб-сайта https://finance.yahoo.com/ мог быть изменен, я скорректировал ответ @DebanjanB в трех пунктах:
- Нажмите, чтобы принять файлы cookie / отправить согласие
- Xpath для поля поиска (по крайней мере, для Германии / ЕС)
- Xpath для списка предложений
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
options = Options()
options.add_argument("start-maximized")
options.add_argument("disable-infobars")
options.add_argument("--disable-extensions")
#options.add_argument('headless') #optional for headless driver
driver = webdriver.Chrome(chrome_options=options, executable_path=r'C:\Program Files (x86)\Google\Chrome\Chromedriver\chromedriver.exe')
driver.get('https://finance.yahoo.com/')
driver.find_element_by_xpath("//button[@type='submit' and @value='agree']").click() #for cookie consent
WebDriverWait(driver, 5).until(EC.element_to_be_clickable((By.XPATH, "//input[@name='yfin-usr-qry']"))).send_keys("goog")
yahoo_fin_auto_suggestions = WebDriverWait(driver, 20).until(EC.visibility_of_all_elements_located((By.XPATH, '(//div[@class="_0ea0377c _4343c2a0 _50f34a35"])')))
for item in yahoo_fin_auto_suggestions:
print(item.text)
Ниже вы найдете исправленную версию в соответствии с последними изменениями в Yahoo Finance.
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
options = Options()
options.add_argument("start-maximized")
options.add_argument("disable-infobars")
options.add_argument("--disable-extensions")
options.page_load_strategy = 'eager'
options.add_argument('--ignore-certificate-errors')
options.add_argument('--ignore-ssl-errors')
options.add_argument('log-level=3')
latest_news = ['Go to Latest News']
chrome_path = "C:\Python\SYS\chromedriver.exe"
driver = webdriver.Chrome(chrome_options=options, executable_path=chrome_path)
driver.get('https://finance.yahoo.com/')
WebDriverWait(driver, 5).until(EC.element_to_be_clickable((By.XPATH, "//input[@name='yfin-usr-qry']"))).send_keys("goog")
WebDriverWait(driver, 20).until(EC.text_to_be_present_in_element((By.XPATH,'//*[@id="header-search-form"]/div[2]/div[1]/div/div[1]/h3'),'Symbols'))
yahoo_fin_auto_suggestions = driver.find_elements(By.CLASS_NAME,'modules_list__1zFHY')[0].text.split('\n')
if yahoo_fin_auto_suggestions == latest_news:
yahoo_fin_auto_suggestions = driver.find_elements(By.CLASS_NAME,'modules_list__1zFHY')[1].text.split('\n')
print(yahoo_fin_auto_suggestions)
driver.quit()