摘要: [python]玩玩URL(使用urllib)初学的时候,会有人告诉你你把url当成网址就行了,URL(统一资源定位器),用它可以定位web上的一资源,可以是一个html,一个文档,或是调用以cgi,在后面的学习,我们会用python的urllib,对url做很多事情,如今的web框架,像django什么的,支持url映射,做出漂亮的url,所以url不只是网址这么简单。urllib.urlopen可以打看一个远程文件,然后它将返回一个文件对象,这很神奇,不是吗?你可以像操作本地文件一样,使用这个文件对象。比如f.read(),或者f.close()之类的,你还记得网络课上老师讲过的http头 阅读全文
posted @ 2013-06-19 20:56 fangFXQ 阅读(587) 评论(0) 推荐(1)
摘要: 简介日志分析往往是商业智能的基础,而日益增长的日志信息条目使得大规模数据处理平台的出现成为必然。MapReduce 处理数据的有效性为日志分析提供了可靠的后盾。本文将以对访问网页用户的日志进行分析,进而挖掘出用户兴趣点这一完整流程为例,详细解释 MapReduce 模型的对应实现,涵盖在 MapReduce 编程中对于特殊问题的处理技巧,比如机器学习算法、排序算法、索引机制、连接机制等。文章分三部分展开:首先介绍 MapReduce 编程模型,对其原理、对任务处理流程以及适用情况进行介绍;接下来描述了日志分析的例子 - 用户兴趣点挖掘的处理流程;最后对处理流程的几个模块分别进行了 MapRed 阅读全文
posted @ 2013-06-05 15:23 fangFXQ 阅读(245) 评论(0) 推荐(0)
摘要: python中,有三个库可以解析html文本,HTMLParser,sgmllib,htmllib。他们的实现方法不通,但功能差不多。这三个库中 提供解析html的类都是基类,本身并不做具体的工作。他们在发现的元件后(如标签、注释、声名等),会调用相应的函数,这些函数必须重载,因为基类中不 作处理。比如:"""<html><head><title>Advice</title></head><body><p>The <a href="http://ietf.org&q 阅读全文
posted @ 2013-05-29 18:10 fangFXQ 阅读(1037) 评论(0) 推荐(0)
摘要: 从B树、B+树、B* 树谈到R树作者:July、weedge、Frankie。编程艺术室出品。说明:本文从B树开始谈起,然后论述B+树、B*树,最后谈到R树。其中B树、B+树及B*树部分由weedge完成,R树部分由Frankie完成,全文最终由July统稿修订完成。出处:http://blog.csdn.net/v_JULY_v。第一节、B树、B+树、B*树1.前言:动态查找树主要有:二叉查找树(Binary Search Tree),平衡二叉查找树(Balanced Binary Search Tree),红黑树(Red-Black Tree ),B-tree/B+-tree/ B*-tr 阅读全文
posted @ 2013-05-28 14:15 fangFXQ 阅读(116) 评论(0) 推荐(0)
摘要: 约瑟夫环问题(Josephus)用户输入M,N值,从1至N开始顺序循环数数,每数到M输出该数值,直至全部输出。写出C程序。(约瑟夫环问题 Josephus)解法一(My Solution):思想:建立一个有N个元素的循环链表,然后从链表头开始遍历并记数,如果计数i==m(i初始为1)踢出元素,继续循环,当当前元素与下一元素相同时退出循环。代码: #include <stdio.h> #include <stdlib.h> // 链表节点 typedef struct _RingNode { int pos; // 位置 struct _RingNode *next; } 阅读全文
posted @ 2013-05-27 22:17 fangFXQ 阅读(149) 评论(0) 推荐(0)