Загрузка PDF-файлов из ISSUU
Я пытаюсь скачать публикацию из ISSUU, непосредственно в формате PDF.
Например, возьмем этот URL:
https://issuu.com/vaistinecamelia/docs/camelia_2018_spalis_elvariantas_kre
Любые идеи, как я мог получить к нему доступ?
Есть сторонние сервисы, которые делают это, вот так: http://issuu.pdf-downloader.com/, поэтому я предполагаю, что это должно быть как-то возможно
Однако я хочу сделать это напрямую. Есть идеи?
2 ответа
Поэтому я не нашел способа напрямую скачать PDF, но есть способ обойти это.
В общем, каждая публикация имеет метатег twiter:
<meta name="twitter:image" content="https://image.isu.pub/180721061958-e8f19464b7540f48371102c2b71136b4/jpg/page_1.jpg">
Таким образом, вы можете получить доступ к каждой странице, просматривая URL-адреса, пока не получите действительное изображение, изменив конец (page_1.jpg, page_2.jpg и т. Д.).
Если у вас есть все изображения, их легко конвертировать в PDF, если это то, что вам нужно.
Перепробовали и просмотрели все загрузчики GitHub Issuu и пришли к выводу. Загрузка этой страницы JPG возможна только. Загрузка страницы SWF прекращается (отключается) Issuu, так как Flash умер. Загрузка страницы PDF тоже не работает. Единственная возможность загрузить полный PDF-файл, если кто-то взломает генерацию ключей доступа (AWSAccessKeyId, Expires, Signature) Issuu - Подписание запросов Stack Overflow - некоторые разговоры о ключах доступа
http://s3.amazonaws.com/document.issuu.com/{documentId}/original.file?AWSAccessKeyId=x&Expires=x&Signature=x
Любое предложение приветствуется, как загрузить более высокое качество, чем JPG.