JSON.Net - Еще один поиск данных из полиморфной строки JSON
Вот как выглядит моя строка JSON:
{
"?xml" : {
"@version" : "1.0",
"@encoding" : "UTF-8"
},
"DataFeed" : {
"@FeedName" : "content",
"now" : "2016-10-17T14:11:38.00",
"Content" : [{
"ContentData" : {
"@statusType" : "Published",
"@isReleased" : "Yes",
"@docId" : "21756",
"ProductStatus" : {
"@productCategory" : "Issuer",
"@focus" : "Issuer",
"Symbol" : {
"@PrimarySymbol" : "GOOGL",
"@SecondarySymbol" : "Google",
"@BmId" : "1790"
}
},
"ContentVersion" : {
"@versionId" : "1",
"@lastVersion" : "true",
"@lastPublished" : "true",
"Url" : [{
"@type" : "XML",
"@size" : "146410",
"#cdata-section" : "https://aaa.yyy.com/docs/xml/708893eb-1fd9-4278-8b0e-e7e0738d8105.xml"
}, {
"@type" : "HTML",
"@size" : "46105",
"#cdata-section" : "https://aaa.yyy.com/docs/html/708893eb-1fd9-4278-8b0e-e7e0738d8105.html"
}, {
"@type" : "PDF",
"@size" : "1274885",
"#cdata-section" : "https://aaa.yyy.com/docs/pdf/708893eb-1fd9-4278-8b0e-e7e0738d8105.pdf"
}, {
"@type" : "ALTERNATE PDF",
"@size" : "60960",
"#cdata-section" : "https://aaa.yyy.com/docs/shortPdf/708893eb-1fd9-4278-8b0e-e7e0738d8105.pdf"
}
]
}
}
}, {
"ContentData" : {
"@statusType" : "Published",
"@isReleased" : "Yes",
"@docId" : "22457",
"ProductStatus" : {
"@productCategory" : "Issuer",
"@focus" : "Issuer",
"Symbol" : {
"@PrimarySymbol" : "AAPL",
"@SecondarySymbol" : "Apple",
"@BmId" : "1121"
}
},
"ContentVersion" : [{
"@versionId" : "1",
"@lastVersion" : "false",
"@lastPublished" : "false",
"Url" : [{
"@type" : "XML",
"#cdata-section" : "https://aaa.yyy.com/docs/version/708893eb-1fd9-4278-8b0e-e7e0738d8105.1476742297.xml"
}, {
"@type" : "HTML",
"#cdata-section" : "https://aaa.yyy.com/docs/version/708893eb-1fd9-4278-8b0e-e7e0738d8105.1476742297.html"
}, {
"@type" : "PDF",
"#cdata-section" : "https://aaa.yyy.com/docs/version/708893eb-1fd9-4278-8b0e-e7e0738d8105.1476742297.pdf"
}, {
"@type" : "ALTERNATE PDF",
"#cdata-section" : "https://aaa.yyy.com/docs/version/708893eb-1fd9-4278-8b0e-e7e0738d8105.1476742297_short.pdf"
}
]
}, {
"@versionId" : "2",
"@lastVersion" : "true",
"@lastPublished" : "true",
"Url" : [{
"@type" : "XML",
"@size" : "174520",
"#cdata-section" : "https://aaa.yyy.com/docs/xml/708893eb-1fd9-4278-8b0e-e7e0738d8105.xml"
}, {
"@type" : "HTML",
"@size" : "46105",
"#cdata-section" : "https://aaa.yyy.com/docs/html/708893eb-1fd9-4278-8b0e-e7e0738d8105.html"
}, {
"@type" : "PDF",
"@size" : "1270150",
"#cdata-section" : "https://aaa.yyy.com/docs/pdf/708893eb-1fd9-4278-8b0e-e7e0738d8105.pdf"
}, {
"@type" : "ALTERNATE PDF",
"@size" : "60960",
"#cdata-section" : "https://aaa.yyy.com/docs/version/708893eb-1fd9-4278-8b0e-e7e0738d8105.1577742297_short.pdf"
}
]
}
]
}
}, {
"ContentData" : {
"@statusType" : "Published",
"@isReleased" : "Yes",
"@docId" : "22501",
"ProductStatus" : {
"@productCategory" : "Issuer",
"@focus" : "Issuer",
"Symbol" : [{
"@PrimarySymbol" : "AAA",
"@SecondarySymbol" : "Some name 1",
"@BmId" : "561"
}, {
"@PrimarySymbol" : "ABC",
"@SecondarySymbol" : "Some Name 2",
"@BmId" : "29"
}, {
"@PrimarySymbol" : "BBB",
"@SecondarySymbol" : "Some Name 3",
"@BmId" : "36"
}, {
"@PrimarySymbol" : "CCC",
"@SecondarySymbol" : "Some Name 4",
"@BmId" : "624"
}
]
},
"ContentVersion" : {
"@versionId" : "1",
"@lastVersion" : "true",
"@lastPublished" : "true",
"Url" : [{
"@type" : "XML",
"@size" : "2706269",
"#cdata-section" : "https://aaa.yyy.com/docs/xml/1c420081-0ce5-4959-91d3-848bbbccd3e3.xml"
}, {
"@type" : "HTML",
"@size" : "32445",
"#cdata-section" : "https://aaa.yyy.com/docs/html/1c420081-0ce5-4959-91d3-848bbbccd3e3.html"
}, {
"@type" : "PDF",
"@size" : "887608",
"#cdata-section" : "https://aaa.yyy.com/docs/pdf/1c420081-0ce5-4959-91d3-848bbbccd3e3.pdf"
}, {
"@type" : "ALTERNATE PDF",
"@size" : "34366",
"#cdata-section" : "https://aaa.yyy.com/docs/shortPdf/1c420081-0ce5-4959-91d3-848bbbccd3e3.pdf"
}
]
}
}
}
]
}
}
Я следую примеру кода из LINQ to Json для извлечения данных из полиморфного json. Я хочу выбрать следующее, но только если есть один эмитент в Symbol
раздел и URL-адрес PDF для последней версии:
@docId
@PrimarySymbol
@BmId
#cdata-section
(но только для PDF для последней версии)
Вот как выглядит мой запрос:
from content in jsonFeed.SelectTokens("DataFeed.Content").SelectMany(i => i.ObjectsOrSelf())
let issuer = content
.SelectToken("ContentData.ProductStatus.@productCategory")
.SingleOrMultiple()
.Select(t => (string)t)
.ToArray()
where issuer.FirstOrDefault().Equals("Issuer")
select new
{
DocID = (string)content.SelectToken("ContentData.@docId"),
Symbol = (string)content.SelectToken("ContentData.ProductStatus.Symbol.@PrimarySymbol"),
BMId = (int)content.SelectToken("ContentData.ProductStatus.Symbol.@BmId"),
PDFUrl = (string)content.SelectToken("ContentData.ContentVersion.Url[3].#cdata-section")
}).ToList();
Сейчас я могу успешно получить все поля для Google, но я не могу получить PDFUrl для Apple (потому что я не знаю, как добраться до последней версии). Кроме того, как я могу завершить свое предложение "Где", чтобы оно выбирало только документы с 1 символом? Итак, в конце моего списка будет изображение ниже:
1 ответ
Вы можете объединить let
а также where
рассчитывать и фильтровать промежуточные результаты.
Следующий запрос использует эту технику, а также запрашивает URL с @type
равно "PDF"
вместо того, чтобы жестко кодировать его в индексе 3 (кстати, в индексе 2):
string pdfUrlType = "PDF";
var query =
(from content in jsonFeed.SelectTokens("DataFeed.Content").SelectMany(i => i.ObjectsOrSelf())
let issuer = content
.SelectToken("ContentData.ProductStatus.@productCategory")
.SingleOrMultiple()
.Select(t => (string)t)
.ToArray()
where issuer.FirstOrDefault().Equals("Issuer")
// Get the @PrimarySymbol where there is exactly one, or null otherwise.
let symbol = (string)content.SelectToken("ContentData.ProductStatus.Symbol.@PrimarySymbol")
// Skip content without a single primary symbol
where symbol != null
// Get the last ContentVersion record in the JSON document.
let lastContentVersion = content
.SelectToken("ContentData.ContentVersion")
.SingleOrMultiple()
.Where(v => (bool?)v.SelectToken("@lastVersion") == true)
.LastOrDefault()
// Skip content with no ContentVersion
where lastContentVersion != null
// Get the PDF Url record
let pdfUrl = lastContentVersion.SelectToken("Url")
.SingleOrMultiple()
.Where(u => (string)u.SelectToken("@type") == pdfUrlType)
.FirstOrDefault()
// Skip content with no PDF Url record
where pdfUrl != null
select new
{
DocID = (string)content.SelectToken("ContentData.@docId"),
Symbol = symbol,
BMId = (int?)content.SelectToken("ContentData.ProductStatus.Symbol.@BmId"),
PDFUrl = (string)pdfUrl.SelectToken("#cdata-section")
}).ToList();
Если вы на самом деле хотите использовать альтернативный URL-адрес PDF, установите
string pdfUrlType = "ALTERNATE PDF";
Образец скрипки.
Если вы уверены, что последняя версия ContentVersion
в каждом "Content"
запись (та, для которой "@lastVersion"
равняется "true"
) гарантированно будет последним по порядку документов, вы можете упростить запрос следующим образом:
let lastContentVersion = content
.SelectToken("ContentData.ContentVersion")
.SingleOrMultiple()
.LastOrDefault()