Элементы HTML-очистителя с определенным атрибутом
Есть ли в любом случае сделать очиститель HTML элементов полосы с определенным атрибутом.
Я использую HTML Purifier, чтобы очистить полную веб-страницу только до ее основного содержимого, чтобы я мог проиндексировать ее и выполнить поиск.
Я хочу иметь возможность добавить атрибут, как data-no-index
какой-то обертке, чтобы их игнорировали.
Это моя настройка HTML-очистителя:
$config = HTMLPurifier_Config::createDefault();
$config->set('HTML.Allowed', 'h1,h2,h3,h4,h5,h6,p,a[href],ul,ol,li,img[src]');
$purifier = new HTMLPurifier($config);