Использование относительного xpath для очистки пользовательского атрибута div
У меня есть несколько сотен URL-адресов, где я пытаюсь почистить путь изображения для изображения на странице. Каждая страница имеет одинаковый формат, но класс div уникален для каждой страницы.
Я хочу использовать импорт XML в листах Google, чтобы очистить только содержимое элемента data-path.
Я пытался и не смог использовать xpath для извлечения URL-адресов.
<div class="uniqueid active" data-path="/~/media/Images/image.jpg" data-alt="Anything"></div>
Например //div[@class='*']/@data-path"
Пример сайта: https://www.cannondale.com/en/Australia/Bike/ProductDetail?Id=77d3b8fe-41f7-42b6-bf69-b5cf0ae55548&parentid=undefined
1 ответ
Если у класса div есть образец "uniqueid active"
, затем вы можете попробовать следующий XPath:
//div[contains(@class, "active")]/@data-path
В противном случае, если класс div может быть чем-либо, используйте этот запрос:
//div[@class]/@data-path
ОБНОВИТЬ:
Я пытался получить значения data-path
атрибуты с IMPORTXML, но не удалось. Пытался сделать это с помощью Python (requests
а также lxml
) и это работает. Так что, вероятно, проблема в Google Sheets - некоторые ограничения или ошибки, idk.