Конвертировать веб-архив в HTML

Мне удалось собрать поведение сложного веб-сайта в веб-архив. После этого я хотел бы превратить этот веб-архив в HTML-набор вложенных каталогов. Тем не менее, когда я сделал это как с Waf, так и с коммерческим программным обеспечением, купленным в магазине Apple, я получил только вложенный каталог с html-страницей внизу, без изображений, css и рабочих ссылок. Если вы заинтересованы, веб-архив находится по адресу:

http://www.miafoto.it/it/GiroMilano.webarchive

в то время как слабый продукт извлечения находится на:

http://www.miafoto.it/it/Giromilano/Pagine/default.aspx

и пустые каталоги выше. В дополнение к другому внешнему виду, веб-архив отображает то же поведение, что и официальный веб-сайт - когда выбран список значений, а затем нажата кнопка - в то время как извлеченная версия создает страницу без содержимого, загружая себя, а не официальную страницу. Как вы можете видеть, веб-архив занимает более 1 МБ, а извлечение - чуть более 1 КБ.

Что с ним не так и как я могу вести такой явно тривиальный бизнес с полезными результатами?

Спасибо,

4 ответа

textutil -convert html example.webarchive
  • Будьте осторожны - HTML с файлами создается в той же папке, что и веб-архив!
  • Кроме того, мне пришлось открыть.html в текстовом редакторе и заменить ссылки "file: ///image.tiff" (заменить "file: ///" на ""), чтобы они указывали на относительный путь.
  • Кроме того, не все браузеры отображают изображения.tiff.

Кто знал, что у нас есть вики Stack Overflow?

Я обнаружил, что это приложение WebArchiveExtractor.app работает на моем Mac (ОС Mojave) –https://robrohan.github.io/WebArchiveExtractor/

Я справился с проблемой, найдя все параметры, представленные на странице, и отправив их в свой сценарий, игнорируя веб-архив.

Для sHTML-страниц на Mac я использую хром. Загрузите и установите его и сохраните свою страницу в формате HTML. Safari сохранит веб-страницы в формате webarchiveformat, и мне очень сложно с этим справиться.

Другие вопросы по тегам