Добавить цитаты в атрибуты HTML
Мне дали HTML-документ, который изначально был создан с использованием Word. Созданный HTML-код может потребовать некоторой очистки, и он довольно длинный, поэтому делать его вручную будет утомительно. Мне также нужно будет сделать это с другими документами HTML из этого же источника в будущем, поэтому простое решение будет полезно за пределами этого единственного экземпляра.
Одна из проблем - это атрибуты HTML без кавычек. Я хотел бы избежать добавления всех цитат вручную и ищу простой способ сделать это.
Вот снимок экрана, показывающий фрагмент файла:
Снимок экрана взят из Visual Studio 2010. Visual Studio распознает, что произошла ошибка проверки, и рекомендует добавить цитаты, но я не могу найти инструмент для автоматического добавления цитат. Есть ли в Visual Studio опция, которая позаботится о добавлении кавычек?
Первоначально я пришел, чтобы задать вопрос конкретно об этом в Visual Studio, но на самом деле я просто ищу хорошее решение. Я не застрял в Visual Studio, поэтому, если есть какие-либо другие рекомендации, они будут оценены.
2 ответа
Взгляните на этот tidyfornet, который является.Net-оболочкой HTML Tidy, пакета Java, который генерирует действительный HTML/XHTML из супа тега.
Я сделал это с помощью программного обеспечения HTMLTrim. Единственное, что я должен был исправить, это удалить <o:p></o:p>
теги из всего документа с помощью текстового редактора, так как на них жаловались. Он не заменяет одинарные кавычки на двойные, но я сделал это с помощью того же текстового редактора. Если вам нужно открыть этот документ в слове после - вам нужно будет удалить <?xml ...?>
заголовок.