Очистить текст в <h4>, используя Requests-HTML (Requests-HTML, Python)

Question

Очистить текст в <h4>, используя Requests-HTML (Requests-HTML, Python)

Я пытаюсь извлечь тип сокета процессора, как вы можете видеть на следующем рисунке. Я определил, что тип сокета находится под <h4> Заголовок сокета, как показано на следующем рисунке.

До сих пор я был в состоянии очистить .spec.block и найти все <h4>'s вложенный внутрь Однако я не могу получить текст под каждым заголовком

Вот мой код

from requests_html import HTMLSession
session = HTMLSession()

r = session.get('https://au.pcpartpicker.com/product/' + jLF48d)
about = r.html.find('.specs.block')[0]
about = about.find('h4')

print(about.text)

Это печатает

 [ <Element 'h4' >, <Element 'h4' >, <Element 'h4' >, <Element 'h4' >,
 <Element 'h4' >, <Element 'h4' >, <Element 'h4' >, <Element 'h4' >,
 <Element 'h4' >, <Element 'h4' >, <Element 'h4' >]

Однако, когда я изменяю оператор печати на:

print(about.text)

Я получаю следующую ошибку:

AttributeError: у объекта 'list' нет атрибута 'text'

Обновить:

print(about[0].text)

Этот код печатает:

Производитель AMD, который является первым заголовком и текстом, однако мне нужно 4-й

Любая идея, какой код я могу использовать для достижения желаемого результата?

Если вам нужна дополнительная информация, пожалуйста, дайте мне знать.

0

python html python-3.x python-requests-html

Источник

user9389353 21 дек '18 в 07:51

1 ответ

Решение

Другие вопросы по тегам python html python-3.x python-requests-html

user9389353 21 дек '18 в 08:00 2018-12-21 08:00 · Accepted Answer · 2018-12-21 08:00

Замена: печать (около [0].текст)

С

print(about[3].text)

Как видно из кода в моем вопросе выше, проблема решилась для меня!

1

Источник

user9389353 21 дек '18 в 08:00