2013 年 1月 18 日随笔档案 - primeli

2013年1月18日

摘要：在以前的项目中周公曾有解析HTML的情况，当时是采用正则表达式一步步将无关的HTML注释及JS代码部分删除掉，然后再用正则表达式找出需要提取的部分，可以说使用正则表达式来做是一个比较繁琐的过程，特别是对于正则表达式不是很熟悉或者要处理的HTML很复杂的情况下。前一阵子周公还是通过这个办法将http://wz.csdn.net/zhoufoxcn上保存的网址导入到http://cang.baidu.com，本来还想将周公博客上的文章好好整理一下，但是考虑到使用正则真的是很繁琐也很麻烦，所以就一直没有动手。直到前两天在网上发现了一个.NET下的HTML解析类库HtmlAgilityPack。Htm 阅读全文

posted @ 2013-01-18 20:41 primeli 阅读(446) 评论(0) 推荐(0) 编辑

我爱技术

淡薄名利，豁达人生，忌浮弃华，惜时珍情，寻心所向，追真求明，卧薪尝胆，造幸谋福，身心爱志，幸福人生

公告