Получить объединенный текст всех элементов
Фрагмент моей попытки (с использованием HXT и BeautifulSoup):
#!/usr/bin/env runhaskell
import Text.HandsomeSoup
import Text.XML.HXT.Core
main = do
let html = "<html><body><a href='a'>b</a><a href='x'>y<p>z</p></a></body></html>"
let doc = parseHtml html
val <- runX $ doc >>> css "a" >>> deepest getText
print val
Выход:
["b","y","z"]
Желаемый результат:
["b","yz"]
По сути, я ищу подобную функцию, как text()
из jQuery.
Edit2: в jQuery это буквально одна строка:
const texts = $('a').map((id, e) => $(e).text()).get();