Добавить цитаты в атрибуты HTML

Мне дали HTML-документ, который изначально был создан с использованием Word. Созданный HTML-код может потребовать некоторой очистки, и он довольно длинный, поэтому делать его вручную будет утомительно. Мне также нужно будет сделать это с другими документами HTML из этого же источника в будущем, поэтому простое решение будет полезно за пределами этого единственного экземпляра.

Одна из проблем - это атрибуты HTML без кавычек. Я хотел бы избежать добавления всех цитат вручную и ищу простой способ сделать это.

Вот снимок экрана, показывающий фрагмент файла:

Снимок экрана взят из Visual Studio 2010. Visual Studio распознает, что произошла ошибка проверки, и рекомендует добавить цитаты, но я не могу найти инструмент для автоматического добавления цитат. Есть ли в Visual Studio опция, которая позаботится о добавлении кавычек?

Первоначально я пришел, чтобы задать вопрос конкретно об этом в Visual Studio, но на самом деле я просто ищу хорошее решение. Я не застрял в Visual Studio, поэтому, если есть какие-либо другие рекомендации, они будут оценены.

2 ответа

Взгляните на этот tidyfornet, который является.Net-оболочкой HTML Tidy, пакета Java, который генерирует действительный HTML/XHTML из супа тега.

Я сделал это с помощью программного обеспечения HTMLTrim. Единственное, что я должен был исправить, это удалить <o:p></o:p> теги из всего документа с помощью текстового редактора, так как на них жаловались. Он не заменяет одинарные кавычки на двойные, но я сделал это с помощью того же текстового редактора. Если вам нужно открыть этот документ в слове после - вам нужно будет удалить <?xml ...?> заголовок.

Другие вопросы по тегам