Преобразовать фрагмент XML строки в узел документа в Java
В Java, как вы можете преобразовать строку, представляющую фрагмент XML для вставки в документ XML?
например
String newNode = "<node>value</node>"; // Convert this to XML
Затем вставьте этот узел в org.w3c.dom.Document как дочерний узел данного узла?
8 ответов
Element node = DocumentBuilderFactory
.newInstance()
.newDocumentBuilder()
.parse(new ByteArrayInputStream("<node>value</node>".getBytes()))
.getDocumentElement();
Вы можете использовать метод импорта (или принятия) документа для добавления фрагментов XML:
/**
* @param docBuilder
* the parser
* @param parent
* node to add fragment to
* @param fragment
* a well formed XML fragment
*/
public static void appendXmlFragment(
DocumentBuilder docBuilder, Node parent,
String fragment) throws IOException, SAXException {
Document doc = parent.getOwnerDocument();
Node fragmentNode = docBuilder.parse(
new InputSource(new StringReader(fragment)))
.getDocumentElement();
fragmentNode = doc.importNode(fragmentNode, true);
parent.appendChild(fragmentNode);
}
Для чего это стоит, вот решение, которое я придумал, используя библиотеку dom4j. (Я проверил, что это работает.)
Прочитайте фрагмент XML в org.dom4j.Document
(примечание: все используемые ниже классы XML взяты из org.dom4j; см. Приложение):
String newNode = "<node>value</node>"; // Convert this to XML
SAXReader reader = new SAXReader();
Document newNodeDocument = reader.read(new StringReader(newNode));
Затем получите документ, в который вставлен новый узел, и родительский элемент (который будет) из него. (Ваш org.w3c.dom.Document необходимо преобразовать в org.dom4j.Document здесь.) Для целей тестирования я создал такой, как этот:
Document originalDoc =
new SAXReader().read(new StringReader("<root><given></given></root>"));
Element givenNode = originalDoc.getRootElement().element("given");
Добавить новый дочерний элемент очень просто:
givenNode.add(newNodeDocument.getRootElement());
Готово. Выведение originalDoc
теперь дает:
<?xml version="1.0" encoding="utf-8"?>
<root>
<given>
<node>value</node>
</given>
</root>
Приложение: потому что ваш вопрос говорит о org.w3c.dom.Document
вот как конвертировать между этим и org.dom4j.Document
,
// dom4j -> w3c
DOMWriter writer = new DOMWriter();
org.w3c.dom.Document w3cDoc = writer.write(dom4jDoc);
// w3c -> dom4j
DOMReader reader = new DOMReader();
Document dom4jDoc = reader.read(w3cDoc);
(Если вам нужны оба вида Document
регулярно, возможно, имеет смысл поместить их в аккуратные служебные методы, возможно, в класс XMLUtils
или что-то типа того.)
Возможно, есть лучшие способы сделать это, даже без сторонних библиотек. Но из представленных решений, на мой взгляд, это самый простой способ, даже если вам нужно выполнить преобразования dom4j <-> w3c.
Обновление (2011): перед добавлением зависимости dom4j в ваш код, обратите внимание, что это не активно поддерживаемый проект, а также есть некоторые другие проблемы. Усовершенствованная версия 2.0 работала целую вечность, но доступна только альфа-версия. Вы можете рассмотреть альтернативу, например, XOM; Читайте больше в вопросе, связанном выше.
/**
*
* Convert a string to a Document Object
*
* @param xml The xml to convert
* @return A document Object
* @throws IOException
* @throws SAXException
* @throws ParserConfigurationException
*/
public static Document string2Document(String xml) throws IOException, SAXException, ParserConfigurationException {
if (xml == null)
return null;
return inputStream2Document(new ByteArrayInputStream(xml.getBytes()));
}
/**
* Convert an inputStream to a Document Object
* @param inputStream The inputstream to convert
* @return a Document Object
* @throws IOException
* @throws SAXException
* @throws ParserConfigurationException
*/
public static Document inputStream2Document(InputStream inputStream) throws IOException, SAXException, ParserConfigurationException {
DocumentBuilderFactory newInstance = DocumentBuilderFactory.newInstance();
newInstance.setNamespaceAware(true);
Document parse = newInstance.newDocumentBuilder().parse(inputStream);
return parse;
}
Вот еще одно решение, использующее библиотеку XOM, которое конкурирует с моим ответом dom4j. (Это часть моего стремления найти хорошую замену dom4j, где XOM был предложен в качестве одного из вариантов.)
Сначала прочитайте фрагмент XML в nu.xom.Document
:
String newNode = "<node>value</node>"; // Convert this to XML
Document newNodeDocument = new Builder().build(newNode, "");
Затем получите документ и узел, под которым добавлен фрагмент. Опять же, для целей тестирования я создам Документ из строки:
Document originalDoc = new Builder().build("<root><given></given></root>", "");
Element givenNode = originalDoc.getRootElement().getFirstChildElement("given");
Теперь добавить дочерний узел просто и похоже на dom4j (за исключением того, что XOM не позволяет вам добавить оригинальный корневой элемент, который уже принадлежит newNodeDocument
):
givenNode.appendChild(newNodeDocument.getRootElement().copy());
Вывод документа дает правильный результат XML (и это очень просто с XOM: просто выведите строку, возвращаемую originalDoc.toXML()
):
<?xml version="1.0"?>
<root><given><node>value</node></given></root>
(Если вы хотите правильно отформатировать XML (с отступами и переводами строки), используйте Serializer
; спасибо Петру Штибрану за то, что указал на это.)
Итак, по общему признанию это не очень отличается от решения dom4j.:) Тем не менее, с XOM может быть немного приятнее работать, потому что API лучше документирован, и из-за его философии дизайна, что есть один канонический способ сделать каждую вещь.
Приложение: Опять же, вот как конвертировать между org.w3c.dom.Document
а также nu.xom.Document
, Используйте вспомогательные методы в XOM DOMConverter
учебный класс:
// w3c -> xom
Document xomDoc = DOMConverter.convert(w3cDoc);
// xom -> w3c
org.w3c.dom.Document w3cDoc = DOMConverter.convert(xomDoc, domImplementation);
// You can get a DOMImplementation instance e.g. from DOMImplementationRegistry
Если вы используете dom4j, вы можете просто:
Document document = DocumentHelper.parseText (текст);
(dom4j теперь можно найти здесь: https://github.com/dom4j/dom4j)
Попробуйте jcabi-xml, с одним вкладышем:
Node node = new XMLDocument("<node>value</node>").node();
... и если вы используете чисто XOM, что-то вроде этого:
String xml = "<fakeRoot>" + xml + "</fakeRoot>";
Document doc = new Builder( false ).build( xml, null );
Nodes children = doc.getRootElement().removeChildren();
for( int ix = 0; ix < children.size(); ix++ ) {
otherDocumentElement.appendChild( children.get( ix ) );
}
XOM использует fakeRoot для того, чтобы сделать то же самое, поэтому он должен быть безопасным, если не совсем элегантным.