Как игнорировать пространства имен с XPath
Моя цель - извлечь определенные узлы из нескольких файлов XML с несколькими пространствами имен, используя XPath. Все работает нормально, пока я знаю URI пространства имен. Само имя пространства имен остается постоянным, но схемы (XSD) иногда генерируются клиентом, т.е. мне неизвестны. Тогда у меня остается в основном три варианта:
используйте только одну схему для пространства имен, надеясь, что ничего не пойдет не так (могу ли я быть уверен?)
получите дочерние узлы документа и найдите первый узел с URI пространства имен, надеясь, что он там, и просто используйте URI, надеясь, что он правильный. может пойти не так по нескольким причинам
как-то сказать xpath: "послушай, мне нет дела до пространств имен, просто найди ВСЕ узлы с этим именем, я даже могу сказать тебе имя пространства имен, но не URI". И это вопрос здесь...
Это не повторение многочисленных "моих выражений xpath не работает, потому что я не знаю об осведомленности пространства имен", как здесь или здесь. Я знаю, как использовать осведомленность пространства имен. Просто не как от этого избавиться.
3 ответа
Вы можете использовать local-name()
Функция XPath. Вместо того, чтобы выбрать узел, как
Вы можете выбрать все узлы и отфильтровать один с правильным локальным именем:
/path/to/*[local-name() = 'somenode']
В XPath2.0 вы можете сделать то же самое в менее подробном синтаксисе:
Или вы можете использовать name():
/path/to/*[name() = 'somenode']
Или только поисковые атрибуты:
//*[@attribute="this one"]
Если вы открываете xml как объект powershell, он игнорирует пространства имен:
[xml]$xml = get-content file.xml
Вы можете использовать Namespace = false в XmlTextReader
public void MyTestMethod()
string _withXmlns = @"<?xml version=""1.0"" encoding=""utf-8""?>
<ParentTag xmlns=""http://anyNamespace.com"">
<Identification value=""ID123456"" />
var xmlReader = new XmlTextReader(new MemoryStream(Encoding.Default.GetBytes(_withXmlns)));
xmlReader.Namespaces = false;
var content = XElement.Load(xmlReader);
XElement elem = content.XPathSelectElement("/Identification");
using System;
using System.IO;
using System.Linq;
using System.Text;
using System.Xml;
using System.Xml.Linq;
using System.Xml.XPath;
using FluentAssertions;
using Microsoft.VisualStudio.TestTools.UnitTesting;
Это мой пример в Qt C++. Qt поддерживает XPath 2.0:
QString planePath = ":/Models/Plane.dae";
QFile f(planePath);
if (!f.open(QIODevice::ReadOnly))
std::cerr << "Failed to load the file: " <<
planePath.toStdString() << std::endl;
QXmlQuery query;
query.bindVariable("myFile", &f);
// query.setQuery("doc($myFile)//*[local-name() = 'p']/text()"); // it works too but it is XPath 1.0
QString result;
qDebug() << result;
Вывод программы: "1 0 0 2 0 1 0 0 2 1 0 3 3 0 4 2 0 5\n"
<?xml version="1.0" encoding="utf-8"?>
<COLLADA xmlns="http://www.collada.org/2005/11/COLLADASchema" version="1.4.1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<author>Blender User</author>
<authoring_tool>Blender 2.83.3 commit date:2020-07-22, commit time:06:01, hash:353e5bd7493e</authoring_tool>
<unit name="meter" meter="1"/>
<effect id="PlaneMaterial-effect">
<technique sid="common">
<color sid="emission">0 0 0 1</color>
<color sid="diffuse">0.01664001 0.8000001 0.01191879 1</color>
<float sid="specular">0.5</float>
<material id="PlaneMaterial-material" name="PlaneMaterial">
<instance_effect url="#PlaneMaterial-effect"/>
<geometry id="Plane-mesh" name="Plane">
<source id="Plane-mesh-positions">
<float_array id="Plane-mesh-positions-array" count="12">-1 -1 0 1 -1 0 -1 1 0 1 1 0</float_array>
<accessor source="#Plane-mesh-positions-array" count="4" stride="3">
<param name="X" type="float"/>
<param name="Y" type="float"/>
<param name="Z" type="float"/>
<source id="Plane-mesh-normals">
<float_array id="Plane-mesh-normals-array" count="3">0 0 1</float_array>
<accessor source="#Plane-mesh-normals-array" count="1" stride="3">
<param name="X" type="float"/>
<param name="Y" type="float"/>
<param name="Z" type="float"/>
<source id="Plane-mesh-map-0">
<float_array id="Plane-mesh-map-0-array" count="12">1 0 0 1 0 0 1 0 1 1 0 1</float_array>
<accessor source="#Plane-mesh-map-0-array" count="6" stride="2">
<param name="S" type="float"/>
<param name="T" type="float"/>
<vertices id="Plane-mesh-vertices">
<input semantic="POSITION" source="#Plane-mesh-positions"/>
<triangles material="PlaneMaterial-material" count="2">
<input semantic="VERTEX" source="#Plane-mesh-vertices" offset="0"/>
<input semantic="NORMAL" source="#Plane-mesh-normals" offset="1"/>
<input semantic="TEXCOORD" source="#Plane-mesh-map-0" offset="2" set="0"/>
<p>1 0 0 2 0 1 0 0 2 1 0 3 3 0 4 2 0 5</p>
<visual_scene id="Scene" name="Scene">
<node id="Plane" name="Plane" type="NODE">
<matrix sid="transform">1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1</matrix>
<instance_geometry url="#Plane-mesh" name="Plane">
<instance_material symbol="PlaneMaterial-material" target="#PlaneMaterial-material">
<bind_vertex_input semantic="UVMap" input_semantic="TEXCOORD" input_set="0"/>
<instance_visual_scene url="#Scene"/>