网页的正文提取有好多种算法,有基于视觉的,基于标记窗的,基于双层决策等算法,这里讨论一些基于标记窗的算法(相对简单且效果还好)的相关细节问题,如下 Read More
posted @ 2008-04-09 23:22 蛙蛙王子 Views(5868) Comments(13) Diggs(0)