01 2013 档案

摘要:在以前的项目中周公曾有解析HTML的情况,当时是采用正则表达式一步步将无关的HTML注释及JS代码部分删除掉,然后再用正则表达式找出需要提取的部分,可以说使用正则表达式来做是一个比较繁琐的过程,特别是对于正则表达式不是很熟悉或者要处理的HTML很复杂的情况下。前一阵子周公还是通过这个办法将http://wz.csdn.net/zhoufoxcn上保存的网址导入到http://cang.baidu.com,本来还想将周公博客上的文章好好整理一下,但是考虑到使用正则真的是很繁琐也很麻烦,所以就一直没有动手。直到前两天在网上发现了一个.NET下的HTML解析类库HtmlAgilityPack。Htm 阅读全文
posted @ 2013-01-18 20:41 primeli 阅读(459) 评论(0) 推荐(0)
摘要:1.OverviewSEDA Adaptive Overload Control for Busy Internet Servers An Architecture for Highly Concurrent,Well-Conditioned Internet Services SEDA(Staged Event-Driven Architecture)的核心思想是把一个请求处理过程分成几个Stag,不同资源消耗的Stag使用不同数量的线程来处理,Stag间使用事件驱动的异步通信模式。更进一步,在每个Stage中可以动态配置自己的线程数,在超载时降级运行(如输出纯文字页面)或拒绝服务。 在每. 阅读全文
posted @ 2013-01-17 11:04 primeli 阅读(419) 评论(0) 推荐(0)