Скрипт для переформатирования XML-файла

Я пытаюсь изменить XML-файл из одного формата в другой, и понятия не имею, как написать сценарий для него. Может кто-нибудь помочь, пожалуйста?
Исходный файл выглядит так:

<Record>
     <FieldValue fieldName="rapportage_nihil" fieldValue="false" fieldValueIsNull="false" fieldValueNatural="false"/>
     <FieldValue fieldName="periode" fieldValue="2009-23-31" fieldValueIsNull="false" fieldValueNatural="2009-10-31 00:23:23"/>
     <FieldValue fieldName="formulierid" fieldValue="9001HK1V10" fieldValueIsNull="false" fieldValueNatural="9001HK1V10"/>
     <FieldValue fieldName="versie" fieldValue="1" fieldValueIsNull="false" fieldValueNatural="1"/>
     <FieldValue fieldName="frequentie" fieldValue="M" fieldValueIsNull="false" fieldValueNatural="M"/>
     <FieldValue fieldName="variant_type" fieldValue="Landen" fieldValueIsNull="false" fieldValueNatural="Landen"/>
     <FieldValue fieldName="value" fieldValue="5F" fieldValueIsNull="false" fieldValueNatural="5F"/>
     <FieldValue fieldName="post_value" fieldValue="0.00" fieldValueIsNull="false" fieldValueNatural="1.037E-4"/>
     <FieldValue fieldName="cube" fieldValue="c01" fieldValueIsNull="false" fieldValueNatural="c01"/>
     <FieldValue fieldName="rij" fieldValue="r_24_100_1_000_0" fieldValueIsNull="false" fieldValueNatural="r_24_100_1_000_0"/>
     <FieldValue fieldName="kolom" fieldValue="c_2250_SPU" fieldValueIsNull="false" fieldValueNatural="c_2250_SPU"/>
</Record>
<Record>
     <FieldValue fieldName="rapportage_nihil" fieldValue="false" fieldValueIsNull="false" fieldValueNatural="false"/>
     <FieldValue fieldName="periode" fieldValue="2009-23-31" fieldValueIsNull="false" fieldValueNatural="2009-10-31 00:23:23"/>
     <FieldValue fieldName="formulierid" fieldValue="9001HK1V10" fieldValueIsNull="false" fieldValueNatural="9001HK1V10"/>
     <FieldValue fieldName="versie" fieldValue="1" fieldValueIsNull="false" fieldValueNatural="1"/>
     <FieldValue fieldName="frequentie" fieldValue="M" fieldValueIsNull="false" fieldValueNatural="M"/>
     <FieldValue fieldName="variant_type" fieldValue="Landen" fieldValueIsNull="false" fieldValueNatural="Landen"/>
     <FieldValue fieldName="value" fieldValue="5F" fieldValueIsNull="false" fieldValueNatural="5F"/>
     <FieldValue fieldName="post_value" fieldValue="0.00" fieldValueIsNull="false" fieldValueNatural="1.037E-4"/>
     <FieldValue fieldName="cube" fieldValue="c01" fieldValueIsNull="false" fieldValueNatural="c01"/>
     <FieldValue fieldName="rij" fieldValue="r_24_108_0_000_0" fieldValueIsNull="false" fieldValueNatural="r_24_108_0_000_0"/>
     <FieldValue fieldName="kolom" fieldValue="c_2250_SPU" fieldValueIsNull="false" fieldValueNatural="c_2250_SPU"/>
</Record>
<Record>
    <FieldValue fieldName="rapportage_nihil" fieldValue="false" fieldValueIsNull="false" fieldValueNatural="false"/>
    <FieldValue fieldName="periode" fieldValue="2009-23-31" fieldValueIsNull="false" fieldValueNatural="2009-10-31 00:23:23"/>
    <FieldValue fieldName="formulierid" fieldValue="9001HK1V10" fieldValueIsNull="false" fieldValueNatural="9001HK1V10"/>
    <FieldValue fieldName="versie" fieldValue="1" fieldValueIsNull="false" fieldValueNatural="1"/>
    <FieldValue fieldName="frequentie" fieldValue="M" fieldValueIsNull="false" fieldValueNatural="M"/>
    <FieldValue fieldName="variant_type" fieldValue="Landen" fieldValueIsNull="false" fieldValueNatural="Landen"/>
    <FieldValue fieldName="value" fieldValue="5F" fieldValueIsNull="false" fieldValueNatural="5F"/>
    <FieldValue fieldName="post_value" fieldValue="0.00" fieldValueIsNull="false" fieldValueNatural="1.6049E-4"/>
    <FieldValue fieldName="cube" fieldValue="c01" fieldValueIsNull="false" fieldValueNatural="c01"/>
    <FieldValue fieldName="rij" fieldValue="r_06_000_1_010_0" fieldValueIsNull="false" fieldValueNatural="r_06_000_1_010_0"/>
    <FieldValue fieldName="kolom" fieldValue="c_2250_SPU" fieldValueIsNull="false" fieldValueNatural="c_2250_SPU"/>
</Record>

Это формат, который мне нужен в результате:

<bestand registratienummer="123">
<rapportage nihil="false" periode="2009-23-31" formulierid="9001HK1V10" versie="1" frequentie="M">
        <variant type="Landen" value="5F" />
        <post value="0.00" cube="c01" rij="r_24_100_1_000_0" kolom="c_2250_SPU" />
</rapportage>
<rapportage nihil="false" periode="2009-23-31" formulierid="9001HK1V10" versie="1" frequentie="M">
        <variant type="Landen" value="5F" />
        <post value="0.00" cube="c01" rij="r_24_108_0_000_0" kolom="c_2250_SPU" />
</rapportage>
<rapportage nihil="false" periode="2009-23-31" formulierid="9001HK1V10" versie="1" frequentie="M">
        <variant type="Landen" value="5F" />
        <post value="0.00" cube="c01" rij="r_06_000_1_010_0" kolom="c_2250_SPU" />
</rapportage>
</bestand>  

Спасибо большое!

1 ответ

Решение

XSLT сделан именно для этой цели. Вы можете преобразовать любой четко определенный XML-файл в любой другой текстовый формат, включая другую структуру XML. Получите, например, xsltproc, напишите скрипт и все готово.

Если вам нужно сначала изучить XSLT, вот хорошая отправная точка: http://www.w3schools.com/xsl/ (в этом руководстве приведены примеры преобразования в XHTML, но вам просто нужно использовать целевые теги XML вместо XHTML теги...).

Это может быть хороший сценарий для начала (извините, но у меня нет времени дать вам полноценный сценарий здесь):

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet
    xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
    version="1.0">
    <xsl:output method="xml" encoding="utf-8" />
    <xsl:template match="/">
        <bestand registratienummer="123">
            <apply-templates select="//Record"/>
        </bestand>
    </xsl:template>
    <xsl:template match="Record">
        <xsl:variable name="nihil" select="FieldValue[@fieldName='rapportage_nihil']/@fieldValue"/>
        <!-- add more variable lookups here. you need XPath for that. -->
        <rapportage nihil="{$nihil}" periode="{$periode}">
            <!-- add more output here -->
        </rapportage>
    </xsl:template>
</xsl:stylesheet>

Вы можете дать xsltproc эту таблицу стилей и ваш исходный XML-документ, он даст вам ваш новый XML-файл. Возможно, вам нужно убедиться, что ваш исходный XML-файл четко определен, то есть содержит один корневой элемент. Ваш пример не выглядит так, как будто он есть, вам может потребоваться окружить его произвольным элементом.

Чтобы немного рассказать о XSLT и сценарии: представьте, что у вас есть два указателя. Один в сценарии XSLT, другой в вашем исходном XML-файле. XSLT - все о "применении шаблонов", и он всегда будет использовать шаблон, который является наиболее близким (думайте о шаблонах как о некоторой функции).

Сначала наиболее близким совпадением будет корневой элемент, поэтому указатель XSLT начинается в шаблоне с match="/", Указатель XML находится в корневом элементе (псевдоним "тег") исходного документа XML. Любой элемент, который не начинается с xsl: будет рассматриваться как выходной элемент. Итак, во-первых, xsltproc выведет <bestand> элемент.

Затем указатель XSLT идет дальше и находит <apply-templates> выбрав все элементы, соответствующие //Record (двойная косая черта обозначает "на любую глубину"). Для каждого <Record> элемент, он будет "вызывать" соответствующий шаблон. Здесь ближайший матч будет <xsl:template match="Record">,

Таким образом, указатель XSLT будет переходить к шаблону, а указатель XML - к первому <Record>, Тогда переменная (nihil), содержащий некоторую информацию из записи, которая выбирается из указателя XML и далее вглубь структуры XML исходного документа с использованием выражения XPath. Выражение XPath говорит: "Выберите из элемента FieldValue который имеет атрибут fieldName со значением 'rapportage_nihil' значение атрибута fieldValue" (Думайте об этом как о предложении SQL WHERE для данных XML; здесь атрибуты начинаются с префикса @).

Вам нужно скопировать, вставить и изменить эту строку для каждой информации, которая вам нужна в выходном документе. Тогда выходной элемент <rapportage> оценивается, подставляя каждую переменную (например, {$nihil}) с их соответствующими значениями, установленными выше с <xsl:variable>, Вам нужно добавить элементы внутри <rapportage> элемент таким же образом, как <rapportage> элемент. Затем шаблон в конце и следующий <Record> будет введен через шаблон.

Другие вопросы по тегам