Jsoup: неразрывное пространство удалено, все еще отображается пустое пространство
Неразрывный пробел удален, все еще отображается пустое пространство. Ниже приведено содержимое html и тип пантомимы multipart/alternate.
<body dir="ltr">
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
<p style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif;margin-bottom:12.0pt"> Hi,</p>
<p style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif;margin-left:.5in"> <br> This is test email.</p>
<p style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif">
<o:p>
</o:p></p>
<p style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif">
<o:p>
</o:p></p>
<p style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif"> Thanks</p>
<p style="margin: 0in 0in 0.0001pt; font-size: 11pt; font-family: Calibri, sans-serif"> Deepak Verma</p>
<br>
</div>
</body>
Я использую код, указанный в этой ссылке https://javaee.github.io/javamail/FAQ, чтобы получить содержимое тела.
После выполнения prettyPrint все пространство было удалено, кроме неразрывного. Ниже код и результат.
strMessageBody = objMessageBody.toString();
document = Jsoup.parse(strMessageBody);
String str1 = Jsoup.clean(document.html(), "", Whitelist.none().addTags("p"), new Document.OutputSettings().prettyPrint(true));
String str2 = Jsoup.clean(str1, "", Whitelist.none(), new Document.OutputSettings().prettyPrint(false));
System.out.println(str2);
This is test email.
Thanks
Deepak Verma
Чтобы удалить это неразрывное пространство, я использовал Parser.unescapeEntities(); но все же пробел присутствует Parser.unescapeEntities(str2,true);
This is test email.
Thanks
Deepak Verma
Я также пробовал Parser.unescapeEntities(str2.replace("\u00A0",""),true); Но безуспешно.
Пожалуйста, помогите мне в том, что я здесь говорю.