Есть ли способ удалить пространства имен из тегов XML с помощью C++/Boost или с помощью другой библиотеки
Есть ли способ в C++, используя Tinyxml, TinyXpath, такой, что строка, содержащая:
<ns:abcd>
<ns:defg>
<ns:hijk>
</ns:hijk>
</ns:defg>
</ns:abcd>
превращается в
<abcd>
<defg>
<hijk>
</hijk>
</defg>
</abcd>
РЕДАКТИРОВАТЬ:
Я использовал Tinyxml и Tinyxpath.
Мой рабочий процесс был:
а) Создайте доменное дерево, используя TinyXML
б) Передача Dom-дерева Tinyxpath для оценки xpath
Чтобы добавить удаление пространства имен, я использовал следующую функцию:
void RemoveAllNamespaces(TiXmlNode* node)
{
TiXmlElement* element = node->ToElement();
if(!element){
return;
}
std::string elementName = element->Value();
std::string::size_type idx = elementName.rfind(':');
if(idx != std::string::npos)
{
element->SetValue(elementName.substr( idx + 1).c_str());
}
TiXmlNode* child = element->IterateChildren(NULL);
while(child)
{
RemoveAllNamespaces(child);
child = element->IterateChildren(child);
}
}
Поэтому рабочий процесс изменился на:
а) Создайте доменное дерево, используя TinyXML
б) Удалить пространство имен из domtree, используя RemoveAllNamespaces(domtree.Root() )
c) Передать дерево измененных доменных имен в Tinyxpath для оценки xpath
2 ответа
Хорошо, в ответ на отредактированный вопрос, несколько примечаний:
это на самом деле не обрабатывает пространства имен (рассмотрим
xmlns="http://blabla.com/uri"
стиль по умолчанию для пространств имен), но на самом деле это ограничение TinyXml (eek):Кроме того, TinyXML не имеет средств для обработки пространств имен XML. Квалифицированные имена элементов или атрибутов сохраняют свои префиксы, поскольку TinyXML не предпринимает никаких усилий, чтобы сопоставить префиксы с пространствами имен.
это не относится к атрибутам (которые также могут быть уточнены)
Вот что я бы сделал быстро и грязно (предполагается, что TIXML_USE_STL, как вы, возможно, уже использовали):
static inline std::string RemoveNs(std::string const& xmlName)
{
return xmlName.substr(xmlName.find_last_of(":") + 1);
}
void RemoveAllNamespaces(TiXmlNode* node)
{
assert(node);
if (auto element = node->ToElement()) {
element->SetValue(RemoveNs(element->Value()));
for (auto attr = element->FirstAttribute(); attr; attr = attr->Next())
attr->SetName(RemoveNs(attr->Name()));
for (auto child = node->IterateChildren(nullptr); child; child = element->IterateChildren(child))
RemoveAllNamespaces(child);
}
}
На моем тесте MSVC это печатает
<?xml version="1.0" standalone="no"?>
<!-- Our: to do list data -->
<ToDo a="http://example.org/uri1">
<!-- Do I need: a secure PDA? -->
<Item priority="1" distance="close">Go to the<bold>Toy store!</bold></Item>
<Item priority="2" distance="none">Do bills</Item>
<Item priority="2" distance="far & back">Look for Evil Dinosaurs!</Item>
</ToDo>
Я бы использовал XSLT-преобразование здесь:
<?xml version="1.0"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
<xsl:output omit-xml-declaration="yes" indent="yes" />
<xsl:template match="*">
<xsl:element name="{name()}" namespace=""><xsl:apply-templates select="node()|@*"/></xsl:element>
</xsl:template>
<xsl:template match="@*">
<xsl:attribute name="{name()}" namespace=""><xsl:value-of select="."/></xsl:attribute>
</xsl:template>
</xsl:stylesheet>
Обратите внимание, что на элементы / атрибут, namespace=""
очищает пространство имен Вы также можете указать другое пространство имен.
С input.xml
лайк
<?xml version="1.0"?>
<ns:abcd xmlns:ns="http://bla/bla">
<ns:defg attr="value">
<ns:hijk>
</ns:hijk>
</ns:defg>
</ns:abcd>
xsltproc xform.xsl input.xml
печатает:
<abcd>
<defg attr="value">
<hijk>
</hijk>
</defg>
</abcd>