BeautifulSoup Проверка неработающих ссылок / веб-сканер

Я пытаюсь создать средство проверки неработающих ссылок на основе этого практического руководства: https://dev.to/arvindmehairjan/build-a-web-crawler-to-check-for-broken-links-with-python-beautifulsoup-39 мг

Однако у меня возникли проблемы со строкой кода, поскольку при запуске программы я получаю следующее сообщение об ошибке: File "/Users/Documents/brokenlinkchecker.py", строка 26 print(f"Url: {link.get('href')} "+ f"| Код состояния: {response_code}") SyntaxError: недопустимый синтаксис

Я застрял в том, что могло вызвать эту синтаксическую ошибку. Кто-нибудь может посоветовать, что я могу сделать, чтобы эта программа заработала?

Большое спасибо!

Вот код:

      # Import libraries
from bs4 import BeautifulSoup, SoupStrainer
import requests

# Prompt user to enter the URL
url = input("Enter your url: ")

# Make a request to get the URL
page = requests.get(url)

# Get the response code of given URL
response_code = str(page.status_code)

# Display the text of the URL in str
data = page.text

# Use BeautifulSoup to use the built-in methods
soup = BeautifulSoup(data)

# Iterate over all links on the given URL with the response code next to it
for link in soup.find_all('a'):
    print(f"Url: {link.get('href')} " + f"| Status Code: {response_code}")

1 ответ

Вы должны передать дополнительный аргумент features="lxml" или же features="html.parser" в конструктор BeautifulSoup.

      soup = BeautifulSoup(data,features="html.parser")
Другие вопросы по тегам