Как вывести список подкаталогов из URL в общей папке HTTP?
Я хотел бы знать, есть ли простое имя для списка всех файлов / каталогов из общего файлового ресурса HTTP - по умолчанию сервер HTTP отображает их, но мне интересно, есть ли простой способ получить список файлов без анализа вручную возвращенная веб-страница.
Любое решение, которое будет использовать curl
, wget
или же python
должно быть просто отлично.
2 ответа
wget предназначен только для загрузки файлов, а не списка каталогов.
Если это все, что у вас есть, хотя...
wget -r http://SOME.SITE/PATH 2>&1 | grep 'Saving to:' | sed "s/Saving to: \`\([^?']*\).*'/\1/" | uniq -u
rm -rf SOME.SITE
(Только чтобы потом не судиться со мной, это загрузка всех файлов с сайта, а затем удаление их, когда это будет сделано)
Изменить: Извините, я устал. Если вам нужны только каталоги верхнего уровня, вы можете сделать что-то вроде этого:
wget -rq http://SOME.SITE/PATH
ls -1p SOME.SITE | grep '/$'
rm -rf SOME.SITE
Это делает то же, что и выше, но только перечисляет непосредственные подкаталоги URL.