Очистить текст в <h4>, используя Requests-HTML (Requests-HTML, Python)
Я пытаюсь извлечь тип сокета процессора, как вы можете видеть на следующем рисунке. Я определил, что тип сокета находится под <h4>
Заголовок сокета, как показано на следующем рисунке.
До сих пор я был в состоянии очистить .spec.block
и найти все <h4>'s
вложенный внутрь Однако я не могу получить текст под каждым заголовком
Вот мой код
from requests_html import HTMLSession
session = HTMLSession()
r = session.get('https://au.pcpartpicker.com/product/' + jLF48d)
about = r.html.find('.specs.block')[0]
about = about.find('h4')
print(about.text)
Это печатает
[ <Element 'h4' >, <Element 'h4' >, <Element 'h4' >, <Element 'h4' >,
<Element 'h4' >, <Element 'h4' >, <Element 'h4' >, <Element 'h4' >,
<Element 'h4' >, <Element 'h4' >, <Element 'h4' >]
Однако, когда я изменяю оператор печати на:
print(about.text)
Я получаю следующую ошибку:
AttributeError: у объекта 'list' нет атрибута 'text'
Обновить:
print(about[0].text)
Этот код печатает:
Производитель AMD, который является первым заголовком и текстом, однако мне нужно 4-й
Любая идея, какой код я могу использовать для достижения желаемого результата?
Если вам нужна дополнительная информация, пожалуйста, дайте мне знать.
1 ответ
Замена: печать (около [0].текст)
С
print(about[3].text)
Как видно из кода в моем вопросе выше, проблема решилась для меня!