Как прочитать элемент "dc:creator" из RSS-канала, используя System.ServiceModel.Syndication
сценарий
Я использую RSS-канал, который выглядит частично так:
<item>
<title>Blog Title Here</title>
<link>http://blogurl.com/2010/03/23/title/</link>
<comments>http://blogurl.com/2010/03/23/title/#comments</comments>
<pubDate>Tue, 23 Mar 2010 10:44:54 +0000</pubDate>
<dc:creator>AuthorName</dc:creator>
<category><![CDATA[CategoryName]]></category>
<guid isPermaLink="false">http://blogurl.com/?p=102</guid>
<description><![CDATA[Description of post content]]></description>
<content:encoded><![CDATA[Full blog post here]]></content:encoded>
</item>
Я использую Rss20FeedFormatter, чтобы получить список SyndicationItems, например:
List<SyndicationItem> items;
using (var reader = XmlReader.Create("http://blogurl.com/feed/"))
{
var formatter = new Rss20FeedFormatter();
formatter.ReadFrom(reader);
items = formatter.Feed.Items.ToList();
}
проблема
Я понятия не имею, как получить доступ к значению элемента dc:creator. Я считаю, что мне нужно каким-то образом использовать ElementExtensions, но я не уверен в синтаксисе и не могу найти примеры нигде.
1 ответ
Решение
Вот небольшой пример F#, который, как мы надеемся, покажет вам несколько полезных API:
let xml = @"
<rss version=""2.0"">
<channel xmlns:dc=""http://whatever.it.is/"" xmlns:content=""http://that.too/"">
<title>testing</title>
<item>
<title>Blog Title Here</title>
<link>http://blogurl.com/2010/03/23/title/</link>
<comments>http://blogurl.com/2010/03/23/title/#comments</comments>
<pubDate>Tue, 23 Mar 2010 10:44:54 +0000</pubDate>
<dc:creator>AuthorName</dc:creator>
<category><![CDATA[CategoryName]]></category>
<guid isPermaLink=""false"">http://blogurl.com/?p=102</guid>
<description><![CDATA[Description of post content]]></description>
<content:encoded><![CDATA[Full blog post here]]></content:encoded>
</item>
</channel>
</rss>
"
open System.Xml
open System.IO
open System.ServiceModel.Syndication
let ReadIt() =
use reader = XmlReader.Create(new StringReader(xml))
let formatter = new Rss20FeedFormatter()
formatter.ReadFrom(reader)
let items = formatter.Feed.Items
for item in items do
// if I know there are dc:creator elements (that can deserialize with DataContract of type 'string')
let dcCreators = item.ElementExtensions.ReadElementExtensions<string>("creator","http://whatever.it.is/")
for dcc in dcCreators do
printfn "dcc : %s" dcc
// if just probing around
for ee in item.ElementExtensions do
printfn "extension `%s:%s'" ee.OuterNamespace ee.OuterName
use eer = ee.GetReader()
let inner = eer.ReadInnerXml()
printfn " %s" inner
ReadIt()