Загрузка всех файлов PDF с веб-сайта

Question

Загрузка всех файлов PDF с веб-сайта

Мне нужно сделать приложение для Windows на C#, которое загружает все PDF-файлы с веб-сайта. У меня есть ссылка на сайт, но проблема, с которой я сталкиваюсь, заключается в том, что PDF-файлы не находятся в определенной папке на сайте, а разбросаны по всему.

Мне нужна помощь в поиске всех этих ссылок, чтобы я мог скачать их или любые другие советы, которые могут помочь мне с моей проблемой.

Спасибо всем помочь в продвинутом.

3

c# pdf

Источник

user1274943 16 мар '12 в 21:10

2 ответа

Другие вопросы по тегам c# pdf

user649632 16 мар '12 в 21:19 2012-03-16 21:19 · Answer 1 · 2012-03-16 21:19

Пролистать все страницы
Найти все URL "*.pdf"
Восстановите их и просто загрузите:)

Пожалуйста, уточните, пытаетесь ли вы получить все PDF-файлы со страницы html или со всего домена?

1

Источник

user649632 16 мар '12 в 21:19

user2775004 23 авг '18 в 06:18 2018-08-23 06:18 · Answer 2 · 2018-08-23 06:18

То, что вы пытаетесь сделать, известно как веб-очистка, есть несколько библиотек, которые могут упростить вашу задачу, одна из них - IronWebScraper, но платная.

Здесь доступен обширный список пакетов NuGet, которые можно использовать для поиска в Интернете.

0

Источник

user2775004 23 авг '18 в 06:18