Невозможно правильно проанализировать XML для JSON

Я пытаюсь разобрать xml в json, и я использую xml2js в nodejs. Ниже мой код

var chai = require('chai');
var chaiHttp = require('chai-http');
var request = chai.request;
var should = chai.should();
var expect = chai.expect;
var assert = chai.assert;
var supertest = require('supertest');
var fs = require('fs');
var xmlLocation = "./configdata/xmlDoc.xml";

var xml2js = require('xml2js');
var parser = new xml2js.Parser();

//Plugin for HTTP, etc.
chai.use(chaiHttp);
process.env['NODE_TLS_REJECT_UNAUTHORIZED'] = '0';

//xmlFile = JSON.parse(fs.readFileSync(xmlData, 'utf8'));


describe("Test : ", function () {

    it("convert xml to json", function (done) {

        r = fs.readFileSync(xmlLocation, 'UTF-8');
        parser.parseString(r, function (err, parsedData) {
            if (err) throw err;
            else {
                fs.writeFile("jsonData.json", JSON.stringify(parsedData), function (err, response) {
                });
            }
        });

        done();
    });

})

Мой пример XML-файла:

<?xml version="1.0" encoding="UTF-8" ?>
<ALEXA>
    <SD TITLE="A" FLAGS="" HOST="davidwalsh.name">
        <TITLE TEXT="David Walsh Blog :: PHP, MySQL, CSS, Javascript, MooTools, and Everything Else"/>
        <LINKSIN NUM="1102"/>
        <SPEED TEXT="1421" PCT="51"/>
    </SD>
    <SD>
        <POPULARITY URL="davidwalsh.name/" TEXT="7131"/>
        <REACH RANK="5952"/>
        <RANK DELTA="-1648"/>
    </SD>
</ALEXA>

Я получаю следующий вывод:

{
  "ALEXA": {
    "SD": [
      {
        "$": {
          "TITLE": "A",
          "FLAGS": "",
          "HOST": "davidwalsh.name"
        },
        "TITLE": [
          {
            "$": {
              "TEXT": "David Walsh Blog :: PHP, MySQL, CSS, Javascript, MooTools, and Everything Else"
            }
          }
        ],
        "LINKSIN": [
          {
            "$": {
              "NUM": "1102"
            }
          }
        ],
        "SPEED": [
          {
            "$": {
              "TEXT": "1421",
              "PCT": "51"
            }
          }
        ]
      },
      {
        "POPULARITY": [
          {
            "$": {
              "URL": "davidwalsh.name/",
              "TEXT": "7131"
            }
          }
        ],
        "REACH": [
          {
            "$": {
              "RANK": "5952"
            }
          }
        ],
        "RANK": [
          {
            "$": {
              "DELTA": "-1648"
            }
          }
        ]
      }
    ]
  }
}

'$' добавляется к проанализированному json. Как этого избежать..??

Ищем решение. Заранее спасибо.

3 ответа

Вместо xml2js используйте xml2json, который преобразует точно из xml в json с определенными ключами.

$ - это место для ваших атрибутов с конфигурацией по умолчанию.

Поскольку xml2js явно анализирует ваши XML-теги (например, SD) как массивы (с licitArray=true - у вас в любом случае их несколько, и вы можете назначить только один подобный ключ для объекта в JSON), вам нужно место для хранения атрибутов, это то, что для $. Вы можете принудительно создавать массивы с помощью (по умолчанию) или отключить это. Используя mergeAttrs, вы можете получить желаемый результат.

Вы можете изменить attrkey, если это будет одним из решений. То же самое касается Чарки и так далее. Вы можете найти все параметры конфигурации в README на GitHub по адресу https://github.com/Leonidas-from-XIV/node-xml2js - в конечном итоге вариант преобразования в дочерние элементы может оказаться для вас подходящим.

Если вам вообще не нужны атрибуты, вы можете установить ignoreAttrs = true. Кстати; Параметры парсера переходят как объект в конструктор парсера, в вашем случае: new xml2js.Parser({...options});

Подобные библиотеки обычно разбирают все и иногда приводят к тому, что у вас много свойств, которые вам не нужны.

Я создал Камаро для этой цели.

недостатком этого является то, что вы должны написать свой собственный файл шаблона для структуры, в которую вы хотите преобразовать xml.

const transform = require('camaro')
const fs = require('fs')

const xml = fs.readFileSync('ean.xml', 'utf-8')
const template = {
    cache_key: "/HotelListResponse/cacheKey",
    hotels: ["//HotelSummary", {
        hotel_id: "hotelId",
        name: "name",
        rooms: ["RoomRateDetailsList/RoomRateDetails", {
            rates: ["RateInfos/RateInfo", {
                currency: "ChargeableRateInfo/@currencyCode",
                non_refundable: "nonRefundable",
                price: "ChargeableRateInfo/@total"
            }],
            room_name: "roomDescription",
            room_type_id: "roomTypeCode"
        }]
    }],
    session_id: "/HotelListResponse/customerSessionId"
}

const result = transform(xml, template)
Другие вопросы по тегам