Разбор HTML до Text.Blaze.Html
Я пытаюсь проанализировать HTML-файл для типа Text.Blaze.Html с помощью Text.Pandoc. HTML, который я попытаюсь разобрать:
<head>
<style type="text/css">table.sourceCode {
margin: 0; padding: 0; vertical-align: baseline; border: none; }
table.sourceCode { width: 100%; line-height: 100%; background-color: #f8f8f8; }
</style>
<title>Using Yesod</title>
</head>
<body>
<h1>Intial Commit</h1>
<br>
</body>
Код, который я использую:
writeHtml def {writerHtml5 = True } . readHtml def $ inp
Это удаляет теги заголовка и дает только тело, дающее:
Main > renderHtml $ writeHtml def > {writerHtml5 = True } . readHtml def $ inp
"<h1>Intial Commit</h1>\n<p><br /></p>"
Я понимаю, что содержимое заголовка хранится в виде метаданных, но я хочу знать, куда направляется остальная часть содержимого заголовка (в данном случае информация о стиле).
Main > readHtml def ht
Pandoc (Meta {unMeta = fromList [("title",MetaInlines [Str "Using",Space,Str "Yesod"])]}) > [Header 1 ("",[],[]) [Str "Intial",Space,Str "Commit"],Para [LineBreak]]