2010 年 10月 3 日随笔档案 - lbsx

2010年10月3日

python网络爬虫

摘要：参考： python网络爬虫备忘记Python 网络爬虫dySE：一个 Java 搜索引擎的实现，第 1 部分: 网络爬虫数学之美系列六 -- 图论和网络爬虫 (Web Crawlers) 阅读全文

posted @ 2010-10-03 01:03 lbsx 阅读(920) 评论(0) 推荐(0)

python中图的实现

摘要： [代码]这是通过邻接表实现。其他实现方式还有邻接矩阵实现。这两种实现方式对所有图都通用。参考： Python数据结构：图的实现阅读全文

posted @ 2010-10-03 00:59 lbsx 阅读(614) 评论(0) 推荐(0)

广度优先遍历

摘要：对于树或图，从根或某结点A开始：初始化：用一个队列Q来存储需要访问的结点，将A入队列while Q不为空　　取Q的首个元素　　访问该元素　　将该元素的子结点入队列例：初始化，Q：AA出队列，访问A，将B，C，D加入队列Q：B，C，DB出队列，访问B，将E，F加入队列Q：C，D，E，FC出队列，访问C，将G加入队列Q：D，E，F，GD出队列，访问D，将H，I，J加入队列Q：E，F，G，H，I，JE... 阅读全文

posted @ 2010-10-03 00:54 lbsx 阅读(249) 评论(0) 推荐(0)

协方差及计算代码

摘要： [代码]原文在最后除以(n-1)，把数组的下标当作数组的长度了。参考：协方差计算的c语言代码阅读全文

posted @ 2010-10-03 00:40 lbsx 阅读(729) 评论(0) 推荐(0)

python提取html特定标签的特定数据

摘要： [代码]每个标签设一个标记，然后在handle_date里面判断读取假如要处理<title>Hello world!</title>碰到<title>的时候，title的标记由0变1；碰到数据的时候，验证title的标记的值，如果大于0则说明这是title的数据，可以提取出来；碰到</title>的时候，该标记由1变0，再碰到数据便可以识别出这不是t... 阅读全文

posted @ 2010-10-03 00:36 lbsx 阅读(6161) 评论(0) 推荐(0)