Как рекурсивно читать данные из атрибутов xml и сохранять их в CSV на Java

У меня есть данные XML, как показано ниже,

 <?xml version="1.0" encoding="ISO-8859-1"?>
<FIXML xsi:schemaLocation="http://www.fixprotocol.org/FIXML-5-0-SP2 fixml-main-5-0-SP2_.xsd" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" s="2012-04-23" v="FIX.5.0SP2">
    <Batch ID="RPTTA111PUBLI20170509">
        <MktDef MktID="XEUR" MktSegID="14" EfctvBizDt="2017-05-11" NxtEfctvBizDt="2017-05-15" MktSeg="CONF" MarketSegmentDesc="FUT 8-13 Y. SWISS GOV.BONDS 6%" Sym="CH0002741988" ParentMktSegmID="FBND" Ccy="CHF" MktSegStat="1" USFirmFlag="Y" PartID="2">
            <MtchRules MtchRuleProdCmplx="5" MtchAlgo="PT" />
            <MtchRules MtchRuleProdCmplx="1" MtchAlgo="PT" />
            <FlexProdEligs FlexProdEligCmplx="5" FlexProdElig="Y" />
            <BaseTrdgRules QtSideInd="1" FastMktPctg="0">
                <TickRules TickRuleProdCmplx="1" StartTickPxRng="0" EndTickPxRng="99999.9999" TickIncr="0.01" />
                <TickRules TickRuleProdCmplx="5" StartTickPxRng="0" EndTickPxRng="99999.9999" TickIncr="0.01" />
                <QuotSizeRules MinBidSz="1" MinOfrSz="1" FastMktInd="0" />
                <QuotSizeRules MinBidSz="1" MinOfrSz="1" FastMktInd="1" />
                <PxRngRules PxRngRuleID="75" PxRngProdCmplx="1" StartPxRng="0" EndPxRng="99999.9999" PxRngValu="0.15" />
                <PxRngRules PxRngRuleID="347" PxRngProdCmplx="5" StartPxRng="0" EndPxRng="99999.9999" PxRngValu="0.12" />
            </BaseTrdgRules>
            <MDFeedTyps MDFeedTyp="HS" MDBkTyp="2" MktDepth="10" MDRcvryTmIntvl="120000" SvcLctnID1="224.0.50.102" SvcLctnSubID1="59500" SvcLctnID2="224.0.50.230" SvcLctnSubID2="59500" />
            <MDFeedTyps MDFeedTyp="HI" MDBkTyp="2" MktDepth="10" MktDepthTmIntvl="0" SvcLctnID1="224.0.50.103" SvcLctnSubID1="59501" SvcLctnID2="224.0.50.231" SvcLctnSubID2="59501" />
            <MDFeedTyps MDFeedTyp="HI" MDBkTyp="3" MktDepthTmIntvl="0" SvcLctnID1="224.0.114.97" SvcLctnSubID1="59501" SvcLctnID2="224.0.114.113" SvcLctnSubID2="59501" />
            <MDFeedTyps MDFeedTyp="HS" MDBkTyp="3" SvcLctnID1="224.0.114.96" SvcLctnSubID1="59500" SvcLctnID2="224.0.114.112" SvcLctnSubID2="59500" />
            <MDFeedTyps MDFeedTyp="L" MDBkTyp="2" MktDepth="5" MktDepthTmIntvl="3500" MDRcvryTmIntvl="30000" SvcLctnID1="224.0.50.89" SvcLctnSubID1="59500" SvcLctnID2="224.0.50.217" SvcLctnSubID2="59500" />
        </MktDef>
        <SecDef PriSetPx="158.39">
            <Instrmt ID="408805" Src="M" SecTyp="FUT" Status="1" ProdCmplx="1" CFI="FFMPSX" MatDt="2017-06-08" MMY="201706" Mult="1" ValMeth="FUT" SettlMeth="P" SettlSubMeth="4" PxPrcsn="2" MinPxIncr="0.01" MinPxIncrAmt="10">
                <AID AltID="1048612" AltIDSrc="M" />
                <AID AltID="XF000001RQD8" AltIDSrc="4" />
                <Evnt EventTyp="7" Dt="2017-06-08" />
            </Instrmt>
            <MktSegGrp MktSegID="14">
                <SecTrdgRules>
                    <BaseTrdgRules>
                        <PxRngRules PxRngRuleID="75" />
                    </BaseTrdgRules>
                </SecTrdgRules>
            </MktSegGrp>
        </SecDef>
    </Batch>
</FIXML>

Я хочу прочитать данные из этого XML и сохранить их в файле CSV, как показано ниже.

Имена столбцов должны быть RootElementName_ChildElementName (если есть) _AttributeName. Этот формат я должен следовать,

Предположим, что RootElement имеет значение FIXML, и у нас есть атрибуты "s" и "v", поэтому имя столбца должно быть следующим: FIXML_s, FIXML_v.

И дочерние элементы Batch и MktDef имена столбцов должны быть FIXML_Batch_ID и FIXML_Batch_MktDef_MktID, как это следует.

1) FIXML_s       FIXML_v     FIXML_Batch_ID        FIXML_Batch_MktDef_MktID  . . . . .
  "2012-04-23"  "FIX.5.0SP2" RPTTA111PUBLI20170509  XEUR ....
.
.
.

У нас есть такие данные для тысяч строк и когда они доходят до "</SecDef>" данные должны печататься во 2-й строке и 3-й строке так, как это продолжается.

Может ли кто-нибудь наставить меня на это. Я очень новичок в работе с данными XML.

1 ответ

Вы можете взять это в качестве образца, где

Вы должны создать свой собственный style.xsl

слышать мое

<?xml version="1.0"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:fo="http://www.w3.org/1999/XSL/Format">
    <xsl:output method="text" omit-xml-declaration="yes" indent="no" />
    <xsl:template match="/">
topic,title,url
<xsl:for-each select="//topic"><xsl:value-of select="@id" /><xsl:value-of select="concat(',' , title, ',' , url,' ')" /></xsl:for-each></xsl:template>
</xsl:stylesheet>

это конвертер

import org.w3c.dom.Document;
import java.io.File;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Result;
import javax.xml.transform.Source;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import javax.xml.transform.stream.StreamSource;

public class XMLToCSV {
    public static void main(String args[]) throws Exception {
        File stylesheet = new File("/home/1/style.xsl");
        File xmlSource = new File("/home/1/xml.xml");

        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
        DocumentBuilder builder = factory.newDocumentBuilder();
        Document document = builder.parse(xmlSource);

        StreamSource stylesource = new StreamSource(stylesheet);
        Transformer transformer = TransformerFactory.newInstance().newTransformer(stylesource);
        Source source = new DOMSource(document);
        Result outputTarget = new StreamResult(new File("/home/1/howto.csv"));
        transformer.transform(source, outputTarget);
        System.out.println("Done.");
    }
}

Вы можете отформатировать вывод, как вы хотите, используя это

Вот так выглядит мой xml

<?xml version="1.0"?>
<howto>
    <topic id="1">
        <title>Java</title>
        <url>http://www.google.com</url>
    </topic>
    <topic id="2">
        <title>XML</title>
        <url>http://www.ab</url>
    </topic>
    <topic id="3">
        <title>Javascript</title>
        <url>http://www.tt</url>
    </topic>
    <topic id="4">
        <title>VBScript</title>
        <url>http://www.wewe</url>
    </topic>
</howto>

Надеюсь, это помогло...

Другие вопросы по тегам