Чтение нестандартных элементов в SyndicationItem с помощью SyndicationFeed
В.net 3.5 существует SyndicationFeed, который загружается в RSS-канал и позволяет запускать на нем LINQ.
Вот пример RSS, который я загружаю:
<rss version="2.0" xmlns:media="http://search.yahoo.com/mrss/">
<channel>
<title>Title of RSS feed</title>
<link>http://www.google.com</link>
<description>Details about the feed</description>
<pubDate>Mon, 24 Nov 08 21:44:21 -0500</pubDate>
<language>en</language>
<item>
<title>Article 1</title>
<description><![CDATA[How to use Stackru.com]]></description>
<link>http://youtube.com/?v=y6_-cLWwEU0</link>
<media:player url="http://youtube.com/?v=y6_-cLWwEU0" />
<media:thumbnail url="http://img.youtube.com/vi/y6_-cLWwEU0/default.jpg" width="120" height="90" />
<media:title>Jared on Stackru</media:title>
<media:category label="Tags">tag1, tag2</media:category>
<media:credit>Jared</media:credit>
<enclosure url="http://youtube.com/v/y6_-cLWwEU0.swf" length="233" type="application/x-shockwave-flash"/>
</item>
</channel>
Когда я перебираю элементы, я могу получить заголовок и ссылку через открытые свойства SyndicationItem.
Я не могу понять, как получить атрибуты тега enclosure или значения тегов media. Я пытался с помощью
SyndicationItem.ElementExtensions.ReadElementExtensions<string>("player", "http://search.yahoo.com/mrss/")
Любая помощь с любым из них?
6 ответов
Вы пропустили пространство имен. Используя LINQPad и ваш пример канала:
string xml = @"
<rss version='2.0' xmlns:media='http://search.yahoo.com/mrss/'>
<channel>
<title>Title of RSS feed</title>
<link>http://www.google.com</link>
<description>Details about the feed</description>
<pubDate>Mon, 24 Nov 08 21:44:21 -0500</pubDate>
<language>en</language>
<item>
<title>Article 1</title>
<description><![CDATA[How to use Stackru.com]]></description>
<link>http://youtube.com/?v=y6_-cLWwEU0</link>
<media:player url='http://youtube.com/?v=y6_-cLWwEU0' />
<media:thumbnail url='http://img.youtube.com/vi/y6_-cLWwEU0/default.jpg' width='120' height='90' />
<media:title>Jared on Stackru</media:title>
<media:category label='Tags'>tag1, tag2</media:category>
<media:credit>Jared</media:credit>
<enclosure url='http://youtube.com/v/y6_-cLWwEU0.swf' length='233' type='application/x-shockwave-flash'/>
</item>
</channel>
</rss>
";
XElement rss = XElement.Parse( xml );
XNamespace media = "http://search.yahoo.com/mrss/";
var player = rss.Element( "channel" ).Element( "item" ).Element(media + "player").Attribute( "url" );
player.Dump();
результат: url="http://youtube.com/?v=y6_-cLWwEU0"
Конструкция, на которую следует обратить внимание: Element(media + "player"), который указывает Linq использовать пространство имен, представленное "media", а также имя элемента "player".
С моей стороны должно быть повреждение мозга, я думал, что вы используете Linq. В любом случае, вам нужно принять во внимание пространство имен.
Это должно дать вам представление о том, как это сделать:
using System.Linq;
using System.ServiceModel.Syndication;
using System.Xml;
using System.Xml.Linq;
SyndicationFeed feed = reader.Read();
foreach (var item in feed.Items)
{
foreach (SyndicationElementExtension extension in item.ElementExtensions)
{
XElement ele = extension.GetObject<XElement>();
Console.WriteLine(ele.Value);
}
}
Независимо от того, извлекаете ли вы не-XML содержимое элементов расширения или элементов XElement, вы можете рассмотреть возможность использования универсальной вспомогательной функции, такой как:
private static T GetExtensionElementValue<T>(SyndicationItem item, string extensionElementName)
{
return item.ElementExtensions.First(ee => ee.OuterName == extensionElementName).GetObject<T>();
}
В зависимости от того, гарантированно ли присутствуют элементы или вы помещаете их в библиотеку многократного использования, вам может потребоваться добавить дополнительное защитное программирование.
Вот как мне удалось получить ссылку на вложение из ленты с помощью SyndicationFeed.
static void Main(string[] args)
{
var feedUrl = "http://blog.stackru.com/index.php?feed=podcast";
using (var feedReader = XmlReader.Create(feedUrl))
{
var feedContent = SyndicationFeed.Load(feedReader);
if (null == feedContent) return;
foreach (var item in feedContent.Items)
{
Debug.WriteLine("Item Title: " + item.Title.Text);
Debug.WriteLine("Item Links");
foreach (var link in item.Links)
{
Debug.WriteLine("Link Title: " + link.Title);
Debug.WriteLine("URI: " + link.Uri);
Debug.WriteLine("RelationshipType: " + link.RelationshipType);
Debug.WriteLine("MediaType: " + link.MediaType);
Debug.WriteLine("Length: " + link.Length);
}
}
}
}
Вывод следующий:
Название статьи: Подкаст № 50
Ссылки на товары
Название ссылки:
URI: http://blog.stackru.com/2009/04/podcast-50/
RelationshipType: alternate
MediaType:
Длина: 0
Название ссылки:
URI: http://itc.conversationsnetwork.org/audio/download/ITC.SO-Episode50-2009.04.21.mp3
RelationshipType: вложенность
MediaType: аудио / MPEG
Длина: 36580016
Вы можете определить ссылку на вложение по типу связи.
Вы можете использовать комбинацию LINQ и XPathNavigator для извлечения расширений синдикации элемента канала (на основе URI пространства имен расширения). Для вложений элементов вам нужно проверить коллекцию ссылок элементов на наличие ссылок, имеющих тип RelationshipType.
Пример:
HttpWebRequest webRequest = WebRequest.Create("http://www.pwop.com/feed.aspx?show=dotnetrocks&filetype=master") as HttpWebRequest;
using (Stream stream = webRequest.GetResponse().GetResponseStream())
{
XmlReaderSettings settings = new XmlReaderSettings();
settings.IgnoreComments = true;
settings.IgnoreWhitespace = true;
using(XmlReader reader = XmlReader.Create(stream, settings))
{
SyndicationFeed feed = SyndicationFeed.Load(reader);
foreach(SyndicationItem item in feed.Items)
{
// Get values of syndication extension elements for a given namespace
string extensionNamespaceUri = "http://www.itunes.com/dtds/podcast-1.0.dtd";
SyndicationElementExtension extension = item.ElementExtensions.Where<SyndicationElementExtension>(x => x.OuterNamespace == extensionNamespaceUri).FirstOrDefault();
XPathNavigator dataNavigator = new XPathDocument(extension.GetReader()).CreateNavigator();
XmlNamespaceManager resolver = new XmlNamespaceManager(dataNavigator.NameTable);
resolver.AddNamespace("itunes", extensionNamespaceUri);
XPathNavigator authorNavigator = dataNavigator.SelectSingleNode("itunes:author", resolver);
XPathNavigator subtitleNavigator = dataNavigator.SelectSingleNode("itunes:subtitle", resolver);
XPathNavigator summaryNavigator = dataNavigator.SelectSingleNode("itunes:summary", resolver);
XPathNavigator durationNavigator = dataNavigator.SelectSingleNode("itunes:duration", resolver);
string author = authorNavigator != null ? authorNavigator.Value : String.Empty;
string subtitle = subtitleNavigator != null ? subtitleNavigator.Value : String.Empty;
string summary = summaryNavigator != null ? summaryNavigator.Value : String.Empty;
string duration = durationNavigator != null ? durationNavigator.Value : String.Empty;
// Get attributes of <enclosure> element
foreach (SyndicationLink enclosure in item.Links.Where<SyndicationLink>(x => x.RelationshipType == "enclosure"))
{
Uri url = enclosure.Uri;
long length = enclosure.Length;
string mediaType = enclosure.MediaType;
}
}
}
}
Цитата: «Кажется, я не могу понять, как получить атрибуты тега вложения или значения тегов мультимедиа». Все, что отформатировано <... ...= >, называется «Атрибутом». Для получения всех атрибутов URL-адресов...
foreach(var item in feed.Items)
{
List<string> urlList = new List<string>();
foreach(SyndicationElementExtension extension in item.ElementExtensions)
{
XElement ele = extension.GetObject<XElement>();
if( ele.HasAttributes && ele.GetAttribute("url")!=null)
{
urlList.Add(ele.GetAttribute("url"));
}
}
//.... store/use item's urlList
}
Для определенного типа media:thumbnail
string thumnailUrl = null;
foreach (SyndicationElementExtension ext in item.ElementExtensions)
{
XmlElement ele = ext.GetObject<XmlElement>();
if (ele.Name == "media:thumbnail" && ele.HasAttributes)
{
thumnailUrl = ele.GetAttribute("url");
}
}