Новичок, значение Ошибка при извлечении изображений с веб-сайта с помощью веб-сканирования
Я пытаюсь запустить этот код, но он дает ошибку значения.
ValueError: неизвестный тип URL: '/images/christmas-getaway-2017.jpg'
Пожалуйста, пройдите этот код:
import requests
import urllib.request
from bs4 import BeautifulSoup
from html.parser import HTMLParser
url = 'https://yts.movie/search/all/all/all/latest/'
response = requests.get(url)
response
soup = BeautifulSoup(response.text, 'html.parser')
print(soup.prettify())
frame = soup.findAll('div',{'class':'browse-movie-wrap col-xs-10 col-sm-5'})
for frame in frame:
figure = frame.find('figure')
photo_url = figure.img['src']
print(photo_url)
name = photo_url.split('/')
name = name[-1]
urllib.request.urlretrieve(photo_url, name)
1 ответ
Этот URL-адрес фотографии является относительным URL-адресом:
src="/images/christmas-getaway-2017.jpg"
Это не полный URL-адрес без http/https, поэтому почему это ошибка значения,
https://yts.movie/images/christmas-getaway-2017.jpg
Базовый URL-адрес: https://yts.movie/images/
Это правильный URL-адрес для изображения, поэтому сначала определите свой базовый URL-адрес, а затем извлеките имя изображения, как вы извлекаете. и объединить с базовым URL