网站的RSS一般以两种形式引用。一种是已经存在的xml文件,然后在更新数据库的时候对其进行更新,或者使用其它维护程序为其更新。另一种是在动态生成RSS文件,即在访问某一个地址的时候,服务端方法从数据库读取最新记录,生成RSS文件,返回给访问者。

 

现讲述动态生成RSS文件的方法。

动态生成RSS文件也基本有两种方法,一种是用字符串累加的方法,另一种是使用xml文档生成的方法。字符串累加的方法也比较简单,我也就不多说了,这里着重说一下生成XmlDocument的方法,包括各种节点的创建,属性的创建等。当然在此也有必要说明一下为什么采用后者,因为后者符合XML DOM标准,有利于你认识dom模型,并且构造速度更快,构造出的xml文档更不容易出错,其中有一些细节我也会做一些必要的讲述。

 

主方法如下:

private void WriteRSS()

{

     XmlDocument domDoc = new XmlDocument();

     XmlDeclaration nodeDeclar = domDoc.CreateXmlDeclaration("1.0", System.Text.Encoding.UTF8.BodyName, "yes");

     domDoc.AppendChild(nodeDeclar);

 

     //如果rss有样式表文件的话,加上这两句

     XmlProcessingInstruction nodeStylesheet = domDoc.CreateProcessingInstruction("xml-stylesheet","type=\"text/css\" href=\"rss.css\"");

     domDoc.AppendChild(nodeStylesheet);

 

     XmlElement root = domDoc.CreateElement("rss");

     root.SetAttribute("version","2.0");  //添加属性结点

     domDoc.AppendChild(root);

 

     XmlElement chnode = domDoc.CreateElement("channel");

     root.AppendChild(chnode);

 

     XmlElement element = domDoc.CreateElement("title");

     XmlNode textNode = domDoc.CreateTextNode("搜狐焦点新闻");    //文本结点

     element.AppendChild(textNode);

     chnode.AppendChild(element);

 

     element = domDoc.CreateElement("link");

     textNode = domDoc.CreateTextNode("http://www.sohu.com");

     element.AppendChild(textNode);

     chnode.AppendChild(element);

 

     element = domDoc.CreateElement("description"); //引用结点

     XmlNode cDataNode = domDoc.CreateCDataSection("即时报道国内外时政大事,解读环球焦点事件");

     element.AppendChild(cDataNode);

     chnode.AppendChild(element);

 

     DataTable dt = GetDataTab();     //访问数据库,获取要在rss中显示的记录

 

     foreach(DataRow dr in dt.Rows)

     {

         element = domDoc.CreateElement("item");

 

         //...

         //创建内容结点,常见的如title,description,link,pubDate,创建方法同上

         //...

 

         chnode.AppendChild(element);

     }

 

     //输出

     XmlTextWriter objTextWrite = new XmlTextWriter(this.Response.OutputStream,System.Text.Encoding.UTF8);

     domDoc.WriteTo(objTextWrite);

     objTextWrite.Flush();

     objTextWrite.Close();

}

 

输出结果如下(item部分是为说明实例手工添加):

<?xml version="1.0" encoding="utf-8" ?>

<rss version="2.0">

<channel>

<title>搜狐焦点新闻</title>

<link>http://www.sohu.com</link>

<description>

<![CDATA[即时报道国内外时政大事,解读环球焦点事件

  ]]>

  </description>

<item id="">

        <title></title>

           <link></link>

           <pubDate>2006-10-15 21:59:36</pubDate>

  </item>

<item id="">

          <title></title>

           <link></link>

<pubDate>2006-10-15 10:33:53</pubDate>

</item>

  <title>[中介][出售住宅]明发国际新城32293万元/</title>

  <link>http://www.ewhouse.com/HouseInfo.aspx?publishId=3440</link>

  <pubDate>2006-10-12 10:50:18</pubDate>

  </item>

</channel>

</rss>

 

 

有几点值得说明的有:

1、  CreateTextNode,即创建文本结点

有人习惯使用InnerText来添加结点中的文本,虽然结果是一样的,但是要知道在DOM中文本也是结点,既然要符合DOM标准,就要进行到底!

2、  输出

我在实例中使用XmlTextWriter输出。

实际还可以使用如下:

Response.ContentType = "application/xml"; // 输出并按xml数据显示

Response.Write(domDoc.InnerXml);

但是,使用XmlTextWriter输出更快,所以也建议使用这个方法。

posted on 2006-10-16 14:08 不做懒人 阅读(3449) 评论(12) 编辑 收藏

 回复 引用 查看   
2006-10-16 14:20 | Vokobo      
不错,写得很好.其实,爱你就这么简单!
 回复 引用   
2006-10-16 14:32 | xdesigner
Response.Write(domDoc.InnerText) 就不对了,应该是InnerXML
建议全程采用XMLTextWriter,功能一样,但速度快,代码少,省内存.

 回复 引用 查看   
2006-10-16 14:38 | 不做懒人      
多谢xdesigner 指出,这句写错,赶紧改正!
 回复 引用 查看   
2006-10-16 15:33 | 不再忧郁      
用xslt啦!
 回复 引用   
2006-10-17 22:54 | Becky[匿名][未注册用户]
很好,学习!
 回复 引用 查看   
2006-10-19 18:04 | 不做懒人      
采纳xdesigner 朋友的意见用XMLTextWriter方法实现如下:
XmlTextWriter writer = new XmlTextWriter(this.Response.OutputStream,System.Text.Encoding.UTF8);
writer.Formatting = Formatting.Indented;
writer.Indentation = 3;

writer.WriteStartDocument();

writer.WriteComment("Create using XmlTextWriter at " + DateTime.Now);

writer.WriteStartElement("rss");
writer.WriteAttributeString("version","2.0");

writer.WriteStartElement("channel");
writer.WriteElementString("title","搜狐焦点新闻");
writer.WriteElementString("link","http://www.sohu.com");
writer.WriteCData("即时报道国内外时政大事,解读环球焦点事件");

//
//中间添加访问数据库部分...
//
writer.WriteEndElement();
writer.WriteEndElement();

writer.Flush();
writer.Close();

这个方法是把xml文件输出 ,如果要保存为xml文件,第一句用这样:
XmlTextWriter writer = new XmlTextWriter(Server.MapPath("grade.xml",null);

 回复 引用   
2007-10-28 13:15 | crcpp[未注册用户]
你好!在你的blog上看到这篇文章,感觉很好,我想请教你一个关于rss的问题,我的也是自己做了一个rss订阅,但是发现一个问题,rss上有文章,但是点不开,我看了一下好像是时间的问题,我看了你的xml上面可以打开,为什么?能帮我一下吗?
这是地址:http://www.crcpp.org/rss.asp

 回复 引用 查看   
2007-10-31 10:42 | 不做懒人      
我估计你碰到的也是这个问题,你看看下面的笨方法:

#region 时间处理
/// <summary>
/// 格式化时间方法,主要处理+0800格式时间
/// </summary>
/// <param name="datetime">时间字符串,RSS里面的时间</param>
/// <param name="style">要显示的时间格式,如dd日HH:mm</param>
/// <returns></returns>
public static string FormatDateTime(string olddatetime, string style)
{
string newstime = string.Empty;
try
{
if(olddatetime.IndexOf("+0800") != -1)
{
olddatetime = olddatetime.Replace("+0800","GMT");
newstime = DateTime.Parse(olddatetime).AddHours(-8).ToString(style);
}
else
{
newstime = DateTime.Parse(olddatetime).ToString(style);
}
}
catch
{
newstime = System.DateTime.Now.ToString(style);
}
return newstime;
}
#endregion

 回复 引用 查看   
2008-06-08 10:54 | 孤心自泪      
文章很好,得好好推荐.

crcpp提的问题很简单,是时间格式不对,我这里有个函数,可以解决你的问题。

'功能:Asp转换时间为GMT(RFC822)格式时间函数

Function DateTimeToGMT(sDate)
Dim dWeek,dMonth
Dim strZero,strZone
strZero="00"
strZone="+0800"
dWeek=Array("Sun","Mon","Tue","Wes","Thu","Fri","Sat")
dMonth=Array("Jan","Feb","Mar","Apr","May","Jun","Jul","Aug","Sep","Oct","Nov","Dec")
DateTimeToGMT = dWeek(WeekDay(sDate)-1)&", "&Right(strZero&Day(sDate),2)&" "&dMonth(Month(sDate)-1)&" "&Year(sDate)&" "&Right(strZero&Hour(sDate),2)&":"&Right(strZero&Minute(sDate),2)&":"&Right(strZero&Second(sDate),2)&" "&strZone
End Function

 回复 引用 查看   
2009-10-11 02:03 | 牛腩      
请教一下。。。读取RSS。。。
一些网站上生成的RSS就像文章中说的只取最新的十条新闻来构成RSS,我用ASP.NET读取也只能读取出十条记录,请问应该怎么才能读取以前的旧的新闻啊?
像google reader一样的。。他可以读取RSS中的所有的记录。。。。
但是我的RSS在生成的时候只取最新的前十条啊。。。

 回复 引用 查看   
2009-10-11 22:38 | 不做懒人      
一般来说,rss都是只提供最新的一部分数据。
我是没去研究google reader,也不清楚他的原理。
不过如果要我自己来做这个功能,我想我会每隔一定的时间就去读取一下rss,然后把rss的内容保存到数据库中,再次读取的时候与原有数据对比,仅保存新的部分。这样经过一段时间,我的数据库内就包含大量的历史数据了。

当然,如果提供rss的网站有某些方法可以让你获取到所有历史数据,那就另当别论。

 回复 引用 查看   
2009-10-12 09:36 | 牛腩      
我就是不知道用什么方法获取以前的rss数据的,
我想把javaeye博客上的内容都获取下来,但每次通过rss读取的都是最新的数据,不知道怎么获取以前的数据的,google reader中即使是新添加的rss,也能够获取到以前的数据,不知道他是用什么方法实现的...