上次和大家讨论了一些正文提取的细节问题,这次我把一些关键问题解决了,给大家上一下代码,并做了演示,能提取不少网站的正文了,当然在功能和代码组织上还有不少改进的地方。 Read More
网页的正文提取有好多种算法,有基于视觉的,基于标记窗的,基于双层决策等算法,这里讨论一些基于标记窗的算法(相对简单且效果还好)的相关细节问题,如下
Read More
本蛙刚弄的飞信美眉网,欢迎大家光临及入住 http://www.fetionmm.com/ 大家多多宣传哦,让更多的MM和GG知道飞信MM网,哈哈哈! 飞信美眉 飞信交友 Read More
优化 SQL Server 查询性能 http://technet.microsoft.com/zh-cn/magazine/cc137757.aspx 优化 SQL Server CPU 性能 http://technet.microsoft.com/zh-cn/magazine/cc137784.aspx 深入了解 Windows Server 2008 内核变化 http://technet... Read More
我们都知道在windbg里可以用!do命令查看一个引用对象的详细信息,但像DateTime,Guid,IpAddress等并不能直接用windbg命令打印出来。
Read More
如果一个服务被部署到了几十台机器上,我们往往需要每天花费很多的时间去查看每台机器上的服务的运行状况,虽然微软有MOM(Microsoft Operations Manager)和SMS(Systems Management Server),但处于成本上及其它方面的考虑,好多时候我们还用不上这些东西,其实微软公开了好多管理和监控方面的API和工具,比如WMIC,System.Managerment等,把这些零散的API和工具集中起来,便可以开发一些满足自定义需求的小软件。 Read More
结论1:tcpchannel的timeout设置对服务端处理时间过长时是起到超时作用的。
结论2:tcpchannel对连接网络慢或者网络层的执行时间太久是没有起到超时作用的。
结论3:使用新的ClientTransportSink解决了因为网络问题hang太久的问题, Read More
用windbg有一段时间了,今天抽空总结一点经验与大家分享 【抓dump】 1、一般抓法 adplus -hang -p 3230 -quiet 抓3230 pid进程,hang模式,相当于把那个进程暂停住,取内存快照 adplus -crash -pn w3wp -quiet 抓w3wp进程,crash模式,当那个进程崩溃结束的时候自动抓取当时的内存 adplus -hang -iis -qui... Read More
WaTu网是WawaKM的Portal, 目前要提供的功能是每日话题,先分大板块,如.net,java,娱乐等,每个版块每天定一个主题,然后大家可以匿名参与讨论,最终每天每个话题都会形成 一个讨论结果,浏览者可以对当日的主题有一个更好的认识,每天接受一个主题的讨论结果,积累下去,便是很多的知识经验了。每个人的讨论别人都可以评分,评 分最高的讨论意味着是该主题比较权威的做法或者说法。 另外还会提供r... Read More
好久不写javascript了,今天做一个脚本调用web服务的例子,发现javascript太好了,写出的代码太优雅了,最后我的脚本如下,太漂亮了,js还能模拟函数式编程,啥时候c#也这么灵活就牛了。 Code highlighting produced by Actipro CodeHighlighter (freeware) http://www.CodeHighlighter.com/ ... Read More