Описание тега wget
GNU Wget (или просто Wget, ранее Geturl) - это программа, которая извлекает контент с веб-серверов и является частью проекта GNU. Его название происходит от всемирной паутины и имеет коннотативное значение для его основной функции. Он поддерживает загрузку через протоколы HTTP, HTTPS и FTP, наиболее популярные протоколы на основе TCP/IP, используемые для просмотра веб-страниц.
WGet поддерживает загрузку как отдельных страниц, так и целых сайтов (рекурсивный поиск), также уважает robots.txt
. Он также может повторить попытку, если сервер не отвечает.
Некоторые из функций включают: GNU wget имеет множество функций для извлечения больших файлов или зеркалирования всей сети или FTP, в том числе:
Можно возобновить прерванные загрузки, используя REST и RANGE
- Файлы сообщений на основе NLS для разных языков
- При необходимости преобразует абсолютные ссылки в загруженных документах в относительные, чтобы загруженные документы могли ссылаться друг на друга локально.
- Работает в большинстве UNIX-подобных операционных систем, а также в Microsoft Windows.
- Поддерживает HTTP-прокси
- Поддерживает куки HTTP
- Поддерживает постоянные HTTP-соединения
- Автоматическая / фоновая работа
- Использует временные метки локальных файлов, чтобы определить, нужно ли повторно загружать документы при зеркалировании.
- GNU Wget распространяется под Стандартной общественной лицензией GNU.
Примеры
Основное использование:
$ wget https://upload.wikimedia.org/wikipedia/commons/3/35/Tux.svg
Загрузите изображение в фоновом режиме, сохраните его в logfile.txt и попробуйте загрузить до 45 раз.
$ wget -t 45 -o logfile.txt https://upload.wikimedia.org/wikipedia/commons/3/35/Tux.svg &
Ссылка