Регулярное выражение для добавления атрибута в любые теги XML

У меня есть правильно сформированные документы XML в строковые переменные. Я хочу использовать preg_replace, чтобы добавить определенный атрибут для каждого тега XML.

Например заменить:

<tag1>
<tag2> some text </tag2>
</tag1>

от:

<tag1 attr="myAttr">
<tag2 attr="myAttr"> some text </tag2>
</tag1>

Поэтому мне в основном нужно выражение регулярного выражения, чтобы найти любые начальные теги и добавить свой атрибут, но я полный нуб регулярного выражения.

3 ответа

Решение

Не используйте регулярные выражения для работы с XML. XML не является обычным языком. Вместо этого используйте xml-расширения php:

$xml = new SimpleXml(file_get_contents($xmlFile));
function process_recursive($xmlNode) {
    $xmlNode->addAttribute('attr', 'myAttr');
    foreach ($xmlNode->children() as $childNode) {
        process_recursive($childNode);
    }
}
process_recursive($xml);
echo $xml->asXML();

Все ответы, содержащие регулярные выражения, будут нарушать этот действительный xml, например:

<?xml version="1.0" encoding='UTF-8'?>
<html>
    <head>
        <!-- <meta> ... </meta> -->
        <script>//<![CDATA[
            function load() {document.write('<tt>Test</tt>');}
        //]]></script>
        <title><![CDATA[Fancy <<SiteName>> [with Breadcrumbs] > in > title]]></title>
    </head>
    <body onload="load()">
        <input
            type="submit"
            value="multiline
                   button
                   text"
        />
    </body>
</html>

Хорошо, для тех, кто читает эти строки и по каким-то причинам все еще интересуется использованием метода регулярных выражений, вот как это сделать:

$xml_data= preg_replace('/(<[A-Za-z0-9\-\_]+[^>]*)>/u','\1 attr="myAttr">',$xmlData);

Но, как обсуждалось ранее, используйте это с осторожностью! Используйте его только в XML-источнике, который, как вы знаете, не будет сломан (см. Сообщение об этом)

$xml_data = preg_replace("/<([^\/]+\w+)/", "<\\1 attr=\"myAttr\">", $xml_data);
Другие вопросы по тегам