Tidy - это библиотека C для очистки "плохого" HTML. Не используйте этот тег для вопросов о чистоте кода.

Tidy - это библиотека, написанная на C для преобразования синтаксически неверного HTML в исправленный HTML или в XHTML. Особенно полезно при парсинге веб-страниц с помощью функций синтаксического анализа curl и XML, поскольку функции синтаксического анализа XML не принимают плохой HTML. Расширения для Tidy доступны на PHP и Perl. Расширение Tidy в PHP поддерживает функции для скрытия плохого HTML в XHTML с различными параметрами, такими как удаление устаревших тегов, таких как тег шрифта, и скрытие комментариев, и удаление проприетарных тегов, и удаление пустых абзацев, и многое другое.