Wget без HTML-тегов

Question

Wget без HTML-тегов

Есть ли способ получить тело HTML-страницы, без HTML-тегов?

curl и wget возвращают ответ, но содержат HTML-теги. Мы можем удалить теги с помощью sed и awk, но я ищу существующий инструмент, который мог бы сделать это без sed и awk.

Lynx является опцией, но она не поставляется предварительно установленной.

Спасибо!!

0

http curl wget lynx

Источник

user2758394 27 сен '13 в 16:33

2 ответа

Решение

Преобразование HTML в обычный текст в PHP для электронной почты перечисляет несколько инструментов, а также Как я могу конвертировать HTML в текст в C#?, Однако если lynx -dump делает то, что вы хотите, что может быть лучшим инструментом для установки.

0

Источник

user733345 28 сен '13 в 09:59

Другие вопросы по тегам http curl wget lynx

user6521 27 сен '13 в 16:37 2013-09-27 16:37 · Accepted Answer · 2013-09-27 16:37

Почему отвращение к установке соответствующего инструмента?

В качестве альтернативы рыси, попробуйте w3m, например

w3m -dump http://google.com

1

Источник

user6521 27 сен '13 в 16:37