Парсинг веб-изображений

Question

Парсинг веб-изображений

Я пытаюсь удалить все фотографии в URL-адресе ниже, но этот код не дает никаких результатов. Почему?

      import requests
from bs4 import BeautifulSoup
import os

url = 'https://www.airbnb.co.uk/s/Ljubljana--Slovenia/homes?tab_id=home_tab&refinement_paths%5B%5D=%2Fhomes&query=Ljubljana%2C%20Slovenia&place_id=ChIJ0YaYlvUxZUcRIOw_ghz4AAQ&checkin=2020-11-01&checkout=2020-11-08&source=structured_search_input_header&search_type=autocomplete_click'
 r = requests.get(url)

soup = BeautifulSoup(r.text, 'html.parser')
images = soup.find_all('img')

print(images)
for image in images:
 name = image['alt']
 link = image['src']
 print(name, link)

0

web-scraping screen-scraping scrapinghub web-scraping-language console-scraping

Источник

user17733290 26 дек '21 в 01:50

1 ответ

Другие вопросы по тегам web-scraping screen-scraping scrapinghub web-scraping-language console-scraping

user7198542 25 янв '23 в 13:46 2023-01-25 13:46 · Answer 1 · 2023-01-25 13:46

      from bs4 import BeautifulSoup
import requests
# Replace this with the website's URL
URL = "put your URL here"
getURL = requests.get(URL, headers={"User-Agent": "Mozilla/5.0"})
print(getURL.status_code)

soup = BeautifulSoup(getURL.text, 'html.parser')

images = soup.find_all('img')
resolvedURLs = []

for image in images:
    src = image.get('src')
    resolvedURLs.append(requests.compat.urljoin(URL, src))

for image in resolvedURLs:
    webs = requests.get(image)
    open('images/' + image.split('/')[-1], 'wb').write(webs.content)