Новичок, значение Ошибка при извлечении изображений с веб-сайта с помощью веб-сканирования

Question

Новичок, значение Ошибка при извлечении изображений с веб-сайта с помощью веб-сканирования

Я пытаюсь запустить этот код, но он дает ошибку значения.

ValueError: неизвестный тип URL: '/images/christmas-getaway-2017.jpg'

Пожалуйста, пройдите этот код:

    import requests
    import urllib.request
    from bs4 import BeautifulSoup
    from html.parser import HTMLParser
    url = 'https://yts.movie/search/all/all/all/latest/'
    response = requests.get(url)
    response
    soup = BeautifulSoup(response.text, 'html.parser')
    print(soup.prettify())
    frame = soup.findAll('div',{'class':'browse-movie-wrap col-xs-10 col-sm-5'})
    for frame in frame:
        figure = frame.find('figure')
        photo_url = figure.img['src']
        print(photo_url)
        name = photo_url.split('/')
        name = name[-1]
        urllib.request.urlretrieve(photo_url, name)

0

python image web-scraping-language

Источник

user14156353 24 авг '20 в 12:43

1 ответ

Другие вопросы по тегам python image web-scraping-language

user9573338 24 авг '20 в 12:53 2020-08-24 12:53 · Answer 1 · 2020-08-24 12:53

Этот URL-адрес фотографии является относительным URL-адресом:

src="/images/christmas-getaway-2017.jpg"

Это не полный URL-адрес без http/https, поэтому почему это ошибка значения,

https://yts.movie/images/christmas-getaway-2017.jpg

Базовый URL-адрес: https://yts.movie/images/
Это правильный URL-адрес для изображения, поэтому сначала определите свой базовый URL-адрес, а затем извлеките имя изображения, как вы извлекаете. и объединить с базовым URL