dot net html分析类库

上次我写的
 【小技巧】如何得到一个网页的所有a标记 herf 链接代码
这样很是麻烦。


这里有个 非常好的分析 html的 类。
节约了不少时间。


项目地址
http://www.codeplex.com/Wiki/View.aspx?ProjectName=htmlagilitypack


For example, here is how you would fix all hrefs in an HTML file:

HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm");
foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a@href")
{
HtmlAttribute att = link"href";
att.Value = FixLink(att);
}
doc.Save("file.htm");

If you want to participate to the project - because that's the whole purpose of putting the source there, right - use the forums or drop me a note (simon underscore mourier at hotmail dot com)!

Happy coding, scraping, scanning, html-ing, xhtml-ing, etc... :^)
Simon Mourier.

posted on 2006-10-31 15:47 hello csharp 阅读(630) 评论(2)  编辑 收藏 所属分类: .net

评论

#1楼  2006-11-28 22:28 superstar      

怎么不提供下载类库的呀?   回复  引用  查看    

#2楼 [楼主] 2006-11-29 16:51 junmy      

@superstar

http://www.codeplex.com/SourceControl/ListDownloadableCommits.aspx?ProjectName=htmlagilitypack
这里下载   回复  引用  查看    

导航

公告

和我联系




推荐
周公解梦
订阅

统计

与我联系

搜索

 

常用链接

留言簿(3)

我参与的团队

随笔分类(17)

随笔档案(27)

收藏夹(4)

友情连接

积分与排名

最新评论

评论排行榜