Как сделать скриншот длинной статьи с помощью Splash?

Мне нужно как-то очистить и сохранить красиво отформатированные длинные статьи.

Пример: http://floodlist.com/africa/malawi-floods-northern-region-january-2018

Просто вырезать все элементы HTML снаружи article.post работа хороша, но не достаточна - она ​​нарушает форматирование, значки, и я не знаю, как это сделать с помощью Scrapy (если вы знаете - пожалуйста, дайте мне знать, возможно, это было бы лучшим решением, чем снимать скриншот).

Итак, у меня есть небольшая настройка Аквариума, так почему бы не попробовать сделать снимок экрана со всей страницей (статья слишком длинная, чтобы уместиться на обычном экране, прокрутка не требуется)? Или, если это возможно - увеличить / уменьшить, чтобы сохранить только article.post элемент.

Обновить

Просто прочитайте о splash:set_viewport_size а также splash:set_viewport_full Lua функции для Splash. Последнее довольно неплохо, но немного накладно - мне не нужны такие вещи, как навигационные панели, реклама и все остальное, не связанное с реальным содержанием статьи. Насколько я понимаю, splash:set_viewport_size Функцию func нельзя использовать для нацеливания определенного HTML-элемента на страницу, потому что это похоже на изменение окна вашего браузера. Так что, может быть, мне нужно вырезать изображение, которое я получаю splash:png() вызов.

0 ответов

Другие вопросы по тегам