Невозможно правильно проанализировать XML для JSON
Я пытаюсь разобрать xml в json, и я использую xml2js в nodejs. Ниже мой код
var chai = require('chai');
var chaiHttp = require('chai-http');
var request = chai.request;
var should = chai.should();
var expect = chai.expect;
var assert = chai.assert;
var supertest = require('supertest');
var fs = require('fs');
var xmlLocation = "./configdata/xmlDoc.xml";
var xml2js = require('xml2js');
var parser = new xml2js.Parser();
//Plugin for HTTP, etc.
chai.use(chaiHttp);
process.env['NODE_TLS_REJECT_UNAUTHORIZED'] = '0';
//xmlFile = JSON.parse(fs.readFileSync(xmlData, 'utf8'));
describe("Test : ", function () {
it("convert xml to json", function (done) {
r = fs.readFileSync(xmlLocation, 'UTF-8');
parser.parseString(r, function (err, parsedData) {
if (err) throw err;
else {
fs.writeFile("jsonData.json", JSON.stringify(parsedData), function (err, response) {
});
}
});
done();
});
})
Мой пример XML-файла:
<?xml version="1.0" encoding="UTF-8" ?>
<ALEXA>
<SD TITLE="A" FLAGS="" HOST="davidwalsh.name">
<TITLE TEXT="David Walsh Blog :: PHP, MySQL, CSS, Javascript, MooTools, and Everything Else"/>
<LINKSIN NUM="1102"/>
<SPEED TEXT="1421" PCT="51"/>
</SD>
<SD>
<POPULARITY URL="davidwalsh.name/" TEXT="7131"/>
<REACH RANK="5952"/>
<RANK DELTA="-1648"/>
</SD>
</ALEXA>
Я получаю следующий вывод:
{
"ALEXA": {
"SD": [
{
"$": {
"TITLE": "A",
"FLAGS": "",
"HOST": "davidwalsh.name"
},
"TITLE": [
{
"$": {
"TEXT": "David Walsh Blog :: PHP, MySQL, CSS, Javascript, MooTools, and Everything Else"
}
}
],
"LINKSIN": [
{
"$": {
"NUM": "1102"
}
}
],
"SPEED": [
{
"$": {
"TEXT": "1421",
"PCT": "51"
}
}
]
},
{
"POPULARITY": [
{
"$": {
"URL": "davidwalsh.name/",
"TEXT": "7131"
}
}
],
"REACH": [
{
"$": {
"RANK": "5952"
}
}
],
"RANK": [
{
"$": {
"DELTA": "-1648"
}
}
]
}
]
}
}
'$' добавляется к проанализированному json. Как этого избежать..??
Ищем решение. Заранее спасибо.
3 ответа
Вместо xml2js используйте xml2json, который преобразует точно из xml в json с определенными ключами.
$ - это место для ваших атрибутов с конфигурацией по умолчанию.
Поскольку xml2js явно анализирует ваши XML-теги (например, SD) как массивы (с licitArray=true - у вас в любом случае их несколько, и вы можете назначить только один подобный ключ для объекта в JSON), вам нужно место для хранения атрибутов, это то, что для $. Вы можете принудительно создавать массивы с помощью (по умолчанию) или отключить это. Используя mergeAttrs, вы можете получить желаемый результат.
Вы можете изменить attrkey, если это будет одним из решений. То же самое касается Чарки и так далее. Вы можете найти все параметры конфигурации в README на GitHub по адресу https://github.com/Leonidas-from-XIV/node-xml2js - в конечном итоге вариант преобразования в дочерние элементы может оказаться для вас подходящим.
Если вам вообще не нужны атрибуты, вы можете установить ignoreAttrs = true. Кстати; Параметры парсера переходят как объект в конструктор парсера, в вашем случае: new xml2js.Parser({...options});
Подобные библиотеки обычно разбирают все и иногда приводят к тому, что у вас много свойств, которые вам не нужны.
Я создал Камаро для этой цели.
недостатком этого является то, что вы должны написать свой собственный файл шаблона для структуры, в которую вы хотите преобразовать xml.
const transform = require('camaro')
const fs = require('fs')
const xml = fs.readFileSync('ean.xml', 'utf-8')
const template = {
cache_key: "/HotelListResponse/cacheKey",
hotels: ["//HotelSummary", {
hotel_id: "hotelId",
name: "name",
rooms: ["RoomRateDetailsList/RoomRateDetails", {
rates: ["RateInfos/RateInfo", {
currency: "ChargeableRateInfo/@currencyCode",
non_refundable: "nonRefundable",
price: "ChargeableRateInfo/@total"
}],
room_name: "roomDescription",
room_type_id: "roomTypeCode"
}]
}],
session_id: "/HotelListResponse/customerSessionId"
}
const result = transform(xml, template)