2010年10月3日
摘要: 参考: python网络爬虫备忘记Python 网络爬虫dySE:一个 Java 搜索引擎的实现,第 1 部分: 网络爬虫数学之美系列六 -- 图论和网络爬虫 (Web Crawlers) 阅读全文
posted @ 2010-10-03 01:03 lbsx 阅读(920) 评论(0) 推荐(0)
摘要: [代码]这是通过邻接表实现。其他实现方式还有邻接矩阵实现。 这两种实现方式对所有图都通用。 参考: Python数据结构:图的实现 阅读全文
posted @ 2010-10-03 00:59 lbsx 阅读(614) 评论(0) 推荐(0)
摘要: 对于树或图,从根或某结点A开始:初始化:用一个队列Q来存储需要访问的结点 ,将A入队列while Q不为空  取Q的首个元素  访问该元素  将该元素的子结点入队列例:初始化,Q:AA出队列,访问A,将B,C,D加入队列Q:B,C,DB出队列,访问B,将E,F加入队列Q:C,D,E,FC出队列,访问C,将G加入队列Q:D,E,F,GD出队列,访问D,将H,I,J加入队列Q:E,F,G,H,I,JE... 阅读全文
posted @ 2010-10-03 00:54 lbsx 阅读(248) 评论(0) 推荐(0)
摘要: [代码]原文在最后除以(n-1),把数组的下标当作数组的长度了。参考: 协方差计算的c语言代码 阅读全文
posted @ 2010-10-03 00:40 lbsx 阅读(727) 评论(0) 推荐(0)
摘要: [代码]每个标签设一个标记,然后在handle_date里面判断读取假如要处理<title>Hello world!</title>碰到<title>的时候,title的标记由0变1;碰到数据的时候,验证title的标记的值,如果大于0则说明这是title的数据,可以提取出来;碰到</title>的时候,该标记由1变0,再碰到数据便可以识别出这不是t... 阅读全文
posted @ 2010-10-03 00:36 lbsx 阅读(6160) 评论(0) 推荐(0)