Python: конвертировать цитаты в контент HTML, а не теги HTML
У меня есть кусок HTML, как это:
<pre class="script">template("main/GlobalShared");</pre>
<pre class="script">
var link = '/Draft/Tracker_1.1';
if (wiki.pageexists(link)) {
<div class="version"> web.link(wiki.uri(link), 'Version 1.1') </div>
}
</pre>
Мне нужно преобразовать это так:
<pre class="script">template("main/GlobalShared");</pre>
<pre class="script">
var link = '/Draft/Tracker_1.1';
if (wiki.pageexists(link)) {
<div class="version"> web.link(wiki.uri(link), 'Version 1.1') </div>
}
</pre>
Я возился с регулярными выражениями, но, похоже, даже близко не подхожу. Я думаю, что мой выбор совершенно неверен.
Кто-нибудь может указать мне правильное направление, если это вообще возможно?
1 ответ
Решение
Вместо этого используйте HTML-анализатор, а затем просто замените кавычки на .replace('"', '"')
,
BeautifulSoup облегчает эту задачу:
from bs4 import BeautifulSoup
soup = BeautifulSoup(htmlsource)
for string in soup.strings:
string.replace_with(string.replace('"', '"'))
htmlsource = str(soup)