草屋主人的blog

代码+生活

  博客园 :: 首页 :: 联系 :: 订阅 订阅 :: 管理
  19 Posts :: 0 Stories :: 57 Comments :: 0 Trackbacks

经过一周的研究,终于可以解析rss2.0,1.0,0.92,Atom0.3格式,今天在继续测试的时候让我又遭受一次挫折,
在碰到GBK编码的rss文件会抛出异常!
  比如 :http://club.sohu.com/rss.shtml
这个页的rss.
  在用

XmlDocument doc = new XmlDocument();
 doc.Load(url);
XmlTextWriter writer 
= new XmlTextWriter("data.xml",Encoding.Default);

就抛出一个异常,我后来用WebClient获取xml文件保存下来仍然没成功,存下来总会有几个字变成乱码,然后那个xml文件就变成一个无效xml文件!
 

希望各位能给指点下,感激!

posted on 2005-11-22 20:24 草屋主人 阅读(693) 评论(5)  编辑 收藏 所属分类: c#

Feedback

#1楼  2005-11-24 15:57 韦恩卑鄙      
encoding 用utf8试验下?
  回复  引用  查看    

#2楼 [楼主] 2005-11-24 18:28 草屋主人      
直接转换编码也不行
如果把encoding="gbk" ?> 三个字改成gb2312就可以了
好像xml碰到gbk就出问题
  回复  引用  查看    

#3楼  2006-04-17 15:05 rss reader [未注册用户]
我也在做 rss reader 也碰到你一样的问题。。如果你已经解决能发个EAMIL告诉我一声吗?

zhangjianxiong52@163.com 谢谢
  回复  引用    

#4楼 [楼主] 2006-04-30 00:03 草屋主人      
就像上面说的,取出来替换gbk就可以正常了,用webclient这样的取字符串回来
  回复  引用  查看    

gbk要替换
  回复  引用    


标题  
姓名  
主页
Email (博主才能看到) 
验证码 *  看不清,换一张 [登录][注册]
内容(请不要发表任何与政治相关的内容)  
  登录  使用高级评论  新用户注册  返回页首  恢复上次提交      
该文被作者在 2005-11-22 20:29 编辑过
"五向定位"职业成长路线公开课(上海、南京、大连)
Google站内搜索


相关链接: