Конвертировать веб-архив в HTML
Мне удалось собрать поведение сложного веб-сайта в веб-архив. После этого я хотел бы превратить этот веб-архив в HTML-набор вложенных каталогов. Тем не менее, когда я сделал это как с Waf, так и с коммерческим программным обеспечением, купленным в магазине Apple, я получил только вложенный каталог с html-страницей внизу, без изображений, css и рабочих ссылок. Если вы заинтересованы, веб-архив находится по адресу:
http://www.miafoto.it/it/GiroMilano.webarchive
в то время как слабый продукт извлечения находится на:
http://www.miafoto.it/it/Giromilano/Pagine/default.aspx
и пустые каталоги выше. В дополнение к другому внешнему виду, веб-архив отображает то же поведение, что и официальный веб-сайт - когда выбран список значений, а затем нажата кнопка - в то время как извлеченная версия создает страницу без содержимого, загружая себя, а не официальную страницу. Как вы можете видеть, веб-архив занимает более 1 МБ, а извлечение - чуть более 1 КБ.
Что с ним не так и как я могу вести такой явно тривиальный бизнес с полезными результатами?
Спасибо,
4 ответа
textutil -convert html example.webarchive
- Будьте осторожны - HTML с файлами создается в той же папке, что и веб-архив!
- Кроме того, мне пришлось открыть.html в текстовом редакторе и заменить ссылки "file: ///image.tiff" (заменить "file: ///" на ""), чтобы они указывали на относительный путь.
- Кроме того, не все браузеры отображают изображения.tiff.
Кто знал, что у нас есть вики Stack Overflow?
Я обнаружил, что это приложение WebArchiveExtractor.app работает на моем Mac (ОС Mojave) –https://robrohan.github.io/WebArchiveExtractor/
Я справился с проблемой, найдя все параметры, представленные на странице, и отправив их в свой сценарий, игнорируя веб-архив.
Для sHTML-страниц на Mac я использую хром. Загрузите и установите его и сохраните свою страницу в формате HTML. Safari сохранит веб-страницы в формате webarchiveformat, и мне очень сложно с этим справиться.