C#/.NET - быстрый способ разбора XML / XML -> Json
Я новичок в XML, так как теперь я работал только с Json:(У меня есть XML-файл, который выглядит так:
<AdapterCards>
<cards type="MCS">
<card>
<id>id1</id>
<description>desc1</description>
<mccode>code1</mccode>
</card>
<card>
<id>id2</id>
<description>desc2</description>
<mccode>code2</mccode>
</card>
</cards>
<cards type="MCM">
<card>
<id>id3</id>
<description>desc3</description>
<mccode>code3</mccode>
</card>
<card>
<id>id4</id>
<description>desc4</description>
<mccode>code4</mccode>
</card>
</cards>
<cards type="F"/>
<cards type="B"/>
</AdapterCards>
Я хочу разобрать его в строку json, которая должна выглядеть следующим образом:
{[{'type': 'mcs', 'id': 'id1', 'description': 'desc1', 'mccode': 'code1'},
{'type': 'mcs', 'id': 'id2', 'description': 'desc2', 'mccode': 'code2'},
{'type': 'mcm', 'id': 'id3', 'description': 'desc3', 'mccode': 'code3'},
{'type': 'mcm', 'id': 'id4', 'description': 'desc4', 'mccode': 'code4'}
]}
Моя проблема в том, что я вообще не работал с XML (да, позор мне). Не могли бы вы дать мне несколько советов о том, как быстро проанализировать XML (у меня есть в потоке, я загрузил его на сервер). Я искал некоторые конвертеры XML в Json, но невозможно точно подобрать их, так как мне нужен "специальный" формат.
Спасибо за ответы:)! Я использую C#.
4 ответа
Мне недавно пришлось написать индивидуальное решение для такого же типа вещей. Я сделал это с XSLT, используя XslCompiledTransform
класс для запуска ввода XML и вывода JSON.
Это требует некоторой работы, но должно помочь вам с основами (оно скопировано из работы, которую я сделал, изменено почти в соответствии с вашими потребностями):
AdapterCards.XML
<AdapterCards>
<cards type="MCS">
<card>
<id>id1</id>
<description>desc1</description>
<mccode>code1</mccode>
</card>
<card>
<id>id2</id>
<description>desc2</description>
<mccode>code2</mccode>
</card>
</cards>
<cards type="MCM">
<card>
<id>id3</id>
<description>desc3</description>
<mccode>code3</mccode>
</card>
<card>
<id>id4</id>
<description>desc4</description>
<mccode>code4</mccode>
</card>
</cards>
<cards type="F"/>
<cards type="B"/>
</AdapterCards>
AdapterCards.XSL
<?xml version="1.0" encoding="utf-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output indent="no" omit-xml-declaration="yes" method="text" encoding="UTF-8" media-type="text/x-json" />
<xsl:variable name="smallcase" select="'abcdefghijklmnopqrstuvwxyz'" />
<xsl:variable name="uppercase" select="'ABCDEFGHIJKLMNOPQRSTUVWXYZ'" />
<!-- Main template for escaping strings; used by above template and for object-properties
Responsibilities: placed quotes around string, and chain up to next filter, escape-bs-string -->
<xsl:template name="escape-string">
<xsl:param name="s"/>
<xsl:text>"</xsl:text>
<xsl:call-template name="escape-bs-string">
<xsl:with-param name="s" select="$s"/>
</xsl:call-template>
<xsl:text>"</xsl:text>
</xsl:template>
<!-- Escape the backslash (\) before everything else. -->
<xsl:template name="escape-bs-string">
<xsl:param name="s"/>
<xsl:choose>
<xsl:when test="contains($s,'\')">
<xsl:call-template name="escape-quot-string">
<xsl:with-param name="s" select="concat(substring-before($s,'\'),'\\')"/>
</xsl:call-template>
<xsl:call-template name="escape-bs-string">
<xsl:with-param name="s" select="substring-after($s,'\')"/>
</xsl:call-template>
</xsl:when>
<xsl:otherwise>
<xsl:call-template name="escape-quot-string">
<xsl:with-param name="s" select="$s"/>
</xsl:call-template>
</xsl:otherwise>
</xsl:choose>
</xsl:template>
<!-- Escape the double quote ("). -->
<xsl:template name="escape-quot-string">
<xsl:param name="s"/>
<xsl:choose>
<xsl:when test="contains($s,'"')">
<xsl:call-template name="encode-string">
<xsl:with-param name="s" select="concat(substring-before($s,'"'),'\"')"/>
</xsl:call-template>
<xsl:call-template name="escape-quot-string">
<xsl:with-param name="s" select="substring-after($s,'"')"/>
</xsl:call-template>
</xsl:when>
<xsl:otherwise>
<xsl:call-template name="encode-string">
<xsl:with-param name="s" select="$s"/>
</xsl:call-template>
</xsl:otherwise>
</xsl:choose>
</xsl:template>
<!-- Replace tab, line feed and/or carriage return by its matching escape code. Can't escape backslash
or double quote here, because they don't replace characters (� becomes \t), but they prefix
characters (\ becomes \\). Besides, backslash should be seperate anyway, because it should be
processed first. This function can't do that. -->
<xsl:template name="encode-string">
<xsl:param name="s"/>
<xsl:choose>
<!-- tab -->
<xsl:when test="contains($s,'	')">
<xsl:call-template name="encode-string">
<xsl:with-param name="s" select="concat(substring-before($s,'	'),'\t',substring-after($s,'	'))"/>
</xsl:call-template>
</xsl:when>
<!-- line feed -->
<xsl:when test="contains($s,'
')">
<xsl:call-template name="encode-string">
<xsl:with-param name="s" select="concat(substring-before($s,'
'),'\n',substring-after($s,'
'))"/>
</xsl:call-template>
</xsl:when>
<!-- carriage return -->
<xsl:when test="contains($s,'
')">
<xsl:call-template name="encode-string">
<xsl:with-param name="s" select="concat(substring-before($s,'
'),'\r',substring-after($s,'
'))"/>
</xsl:call-template>
</xsl:when>
<xsl:otherwise>
<xsl:value-of select="$s"/>
</xsl:otherwise>
</xsl:choose>
</xsl:template>
<xsl:template match="card">
<xsl:text>{</xsl:text>
<xsl:text>"type":</xsl:text>
<xsl:call-template name="escape-string">
<xsl:with-param name="s" select="translate(../@type, $uppercase, $smallcase)"/>
</xsl:call-template>
<xsl:text>,"id":</xsl:text>
<xsl:call-template name="escape-string">
<xsl:with-param name="s" select="id"/>
</xsl:call-template>
<xsl:text>,"description":</xsl:text>
<xsl:call-template name="escape-string">
<xsl:with-param name="s" select="description"/>
</xsl:call-template>
<xsl:text>,"mccode":</xsl:text>
<xsl:call-template name="escape-string">
<xsl:with-param name="s" select="mccode"/>
</xsl:call-template>
<xsl:if test="following::card">},</xsl:if>
<xsl:if test="not(following::card)">}</xsl:if>
</xsl:template>
<xsl:template match="/AdapterCards">
<xsl:text>{[</xsl:text>
<xsl:apply-templates select="cards/card" />
<xsl:text>]}</xsl:text>
</xsl:template>
</xsl:stylesheet>
C#
// Load XML document
XmlDocument xmlDoc = new XmlDocument();
xmlDoc.Load("AdapterCards.XML");
// Transform the XML into JSON
XslCompiledTransform transformer = new XslCompiledTransform();
using (var xslStylesheetFile = File.Open("AdapterCards.XSL", FileMode.Open))
{
using (var xmlReader = new XmlTextReader(xslStylesheetFile))
{
transformer.Load(xmlReader);
}
}
var sourceNavigator = xmlDoc.CreateNavigator();
using (MemoryStream ms = new MemoryStream())
{
transformer.Transform(sourceNavigator, null, ms);
ms.Position = 0;
using (var sr = new StreamReader(ms))
{
return sr.ReadToEnd(); // <-- this is your JSON
}
}
Я выполнил вышеупомянутый XSL в Notepad++ и получил следующее:
{[{"type":"mcs","id":"id1","description":"desc1","mccode":"code1"},
{"type":"mcs","id":"id2","description":"desc2","mccode":"code2"},
{"type":"mcm","id":"id3","description":"desc3","mccode":"code3"},
{"type":"mcm","id":"id4","description":"desc4","mccode":"code4"}]}
Как видите, запятые отсутствуют там, где они должны быть. Но это почти там!
Обновлен XSL и вывод, который теперь работает с запятыми в нужном месте. Следующее, что нужно исправить - это случай типа. Я думаю, что вам может понадобиться использовать XSL 2.0, чтобы получить доступ к функции xpath fn:lower-case()
,
РЕДАКТИРОВАТЬ3: Готово - с помощью этого ответа теперь переводится нижний регистр.
Рекомендации:
Используя класс JsonConvert, который содержит вспомогательные методы для этой конкретной цели:
// To convert an XML node contained in string xml into a JSON string
XmlDocument doc = new XmlDocument();
doc.LoadXml(xml);
string jsonText = JsonConvert.SerializeXmlNode(doc);
// To convert JSON text contained in string json into an XML node
XmlDocument doc = (XmlDocument)JsonConvert.DeserializeXmlNode(json);
Документация здесь: Преобразование между JSON и XML с помощью Json.NET
Вот еще один простой способ конвертировать xml в файл json с помощью Cinchoo ETL, библиотеки с открытым исходным кодом.
using (var r = new ChoXmlReader("*** Xml file path ***")
.WithXPath("//cards")
)
{
using (var w = new ChoJSONWriter("*** Json file path ***")
)
w.Write(r.SelectMany(r1 => ((dynamic[])r1.cards??new dynamic[]{}).Select(c => new { r1.type, c.id, c.description, c.mccode })));
}
Пример скрипки: https://dotnetfiddle.net/Yzcaiw
XDocument xDoc = XDocument.Load(queryURL);
var x1 = from el in xDoc.Root.Descendants("results").Descendants("div").Descendants("div").Descendants("span").Attributes("class")
where el.Value == "pr"
select el.Parent.Value;
stockFeed.Price = Decimal.Parse(x1.First().ToString());
LINQ - лучший способ извлечь данные.