Конвертировать HTML в XHTML, используя TagSoup в Bash
У меня сложилось впечатление, что вы можете конвертировать HTML в XHTML с помощью TagSoup. У меня есть файл tagoup jar, сохраненный как tagsoup.jar я использовал следующую команду wget -O usa_stock.html "http://markets.usatoday.com/custom/usatoday-com/new/html-mktscreener.asp#" | java -jar tagsoup.jar usa_stock.html
Когда я использую эту команду, она генерирует файлы html и xhtml, но когда я открываю xhtml в firefox, он пуст. Я подозреваю, что когда я конвейер, он просто не знает, какой файл я пытался преобразовать.
Может ли кто-нибудь помочь мне с этим?
Благодарю.
1 ответ
Трубопровод (|
) используемый в вашем коде неверен, замените его &&
может решить вашу проблему.
- Как
wget
не вывести страницу извлечения вstdout
Таким образом, вы ничего не передали в tagoup. - Хотя вы также указали входной файл и выходной файл для jsoup, вы использовали конвейер. так в то время
java-jar
начинает выполнять,wget
все еще работает. Входной файл, который вы указали для tagoup, еще не готов.
Так вам нужно wget
выйти с 0
прежде чем запускать jsoup, выйдите из статуса, &&
здесь послужит этой цели.