Конвертировать HTML в XHTML, используя TagSoup в Bash

У меня сложилось впечатление, что вы можете конвертировать HTML в XHTML с помощью TagSoup. У меня есть файл tagoup jar, сохраненный как tagsoup.jar я использовал следующую команду wget -O usa_stock.html "http://markets.usatoday.com/custom/usatoday-com/new/html-mktscreener.asp#" | java -jar tagsoup.jar usa_stock.html Когда я использую эту команду, она генерирует файлы html и xhtml, но когда я открываю xhtml в firefox, он пуст. Я подозреваю, что когда я конвейер, он просто не знает, какой файл я пытался преобразовать.

Может ли кто-нибудь помочь мне с этим?

Благодарю.

1 ответ

Решение

Трубопровод (|) используемый в вашем коде неверен, замените его && может решить вашу проблему.

  1. Как wget не вывести страницу извлечения в stdoutТаким образом, вы ничего не передали в tagoup.
  2. Хотя вы также указали входной файл и выходной файл для jsoup, вы использовали конвейер. так в то время java-jar начинает выполнять, wget все еще работает. Входной файл, который вы указали для tagoup, еще не готов.

Так вам нужно wget выйти с 0 прежде чем запускать jsoup, выйдите из статуса, && здесь послужит этой цели.

Другие вопросы по тегам