Использование относительного xpath для очистки пользовательского атрибута div

У меня есть несколько сотен URL-адресов, где я пытаюсь почистить путь изображения для изображения на странице. Каждая страница имеет одинаковый формат, но класс div уникален для каждой страницы.

Я хочу использовать импорт XML в листах Google, чтобы очистить только содержимое элемента data-path.

Я пытался и не смог использовать xpath для извлечения URL-адресов.

<div class="uniqueid active" data-path="/~/media/Images/image.jpg" data-alt="Anything"></div>

Например //div[@class='*']/@data-path"

Пример сайта: https://www.cannondale.com/en/Australia/Bike/ProductDetail?Id=77d3b8fe-41f7-42b6-bf69-b5cf0ae55548&parentid=undefined

1 ответ

Решение

Если у класса div есть образец "uniqueid active", затем вы можете попробовать следующий XPath:

//div[contains(@class, "active")]/@data-path

В противном случае, если класс div может быть чем-либо, используйте этот запрос:

//div[@class]/@data-path

ОБНОВИТЬ:

Я пытался получить значения data-path атрибуты с IMPORTXML, но не удалось. Пытался сделать это с помощью Python (requests а также lxml) и это работает. Так что, вероятно, проблема в Google Sheets - некоторые ограничения или ошибки, idk.

Другие вопросы по тегам