摘要: test 阅读全文
posted @ 2012-11-09 11:48 byan 阅读(114) 评论(0) 推荐(0) 编辑
摘要: 个人比较喜欢Linux的简洁高效,但常常又离不开Windows下各种功能强大,习惯了操作的软件,因此有一段时间总是来回装系统,装完之后还要进行各种配置。配置倒不麻烦,但好多都需要在线去查,索性在这里给集合一下,以后安装完之后直接在这个页面找,方便,也给网友提供一个汇总的地方。本文不定时添加新内容,力求全。声明:本人现在装的是ubuntu linux因习惯了使用gnome环境,所以还停留在比较初级的阶段,高手莫笑。毕竟还是有娱乐功能的,逼我装red hat什么的有点打击积极性,哈哈1.输入法之前一直用scim的输入法,安装如下安装scim平台:sudo apt-get install scim安 阅读全文
posted @ 2012-11-09 07:28 byan 阅读(514) 评论(0) 推荐(0) 编辑
摘要: 求证:在任一含n个元素的堆中,至多有┌n/2h+1┐w个高度为h的节点。首先解释一下名词的概念:节点高度(height of node):从在该节点下的最低的叶子向上,该节点所在的层数节点深度(depth of node):从根节点向下,经过的层数。注意:以上计数都是从0开始的,如图1:节点4的高度为2,深度为2节点5的高度为1,深度为2因此,属于同一层的节点一定有同样的深度,但是高度可能相同,也可能相差1. 图1 图2证明:(1)先证当h=0时,该结论是成立的。h=0,即高度为0的节点,显然是叶子... 阅读全文
posted @ 2012-11-08 20:53 byan 阅读(1756) 评论(1) 推荐(0) 编辑
摘要: 一.TCP/IP的神奇IP协议通过路由转发,可以自动找到从一个地方到另一个地方最快捷的途径,即使你天天在上网,你也不知你的数据包究竟去过哪些地方。更神奇的地方在于,你是手机也好,电脑也好,哪怕一个板载的芯片,不管是什么设备,只要你实现了IP协议,都可以和连在互联网上的任何一台设备通信。没人管你是什么,在网上“没有人知道你是一条狗”。二.现在的网络条件怎么样QQ已经支持多人视频了,即使在中国这个神奇的国度里,大多数地方已经可以上网,而且网速也还不错(当然这和帝国主义国家没法比)。尤其在一线大中城市,地铁和步行街好多地方也在逐渐铺设免费的Wifi(台湾,香港的繁华地段这已经不新鲜了)。网络情况肯定 阅读全文
posted @ 2012-11-03 10:15 byan 阅读(229) 评论(0) 推荐(0) 编辑
摘要: 把所有爬虫要实现的功能集成到了一个类里,需要使用的时候,只用新建一个对象,再调用相应的方法即可。下面就分享一天写的这个爬虫类是如何工作的。 1 public: 2 CCrawler(void); 3 ~CCrawler(void); 4 CString GetSubsitesFromPage(CString pageStr);//从页面当中提取出所有的子页面 5 CString GetPageStr(CString url); //得到完整的页面数据,这里就要使用网络连接,为了简便,不把更细的细节分开写 6 CString GenerateUrl(CSt... 阅读全文
posted @ 2012-10-30 14:48 byan 阅读(2053) 评论(0) 推荐(0) 编辑
摘要: 先不说爬虫里的基本原理,这里先讨论一下是如何管理站点的。原理如下:针对每一个网站,以网站的首页为名字,存为一个临时文件,这个文件里保存它里面的子页面,这样,当扫描过一个首页的子页面时,就会向这个文件里记录。当程序需要对比哪些文件扫描过时,只需要看看这个日志文件里面有没有需要扫描的子页面即可。当然这里还有一个问题,就是网页地址里的所有符号(比如/ : ?)并不能都存在于文件名里,要做一个简单的替换(这样看起来就像专业的临时文件啦!!!!)有一个问题困惑住了我:程序是要允许用户修改站点和关键字信息的,当程序在扫描的时候,会不断地访问这些文件,得到需要的数据,这是一个独立的线程,而当用户修改这些信息 阅读全文
posted @ 2012-10-27 21:47 byan 阅读(799) 评论(0) 推荐(0) 编辑
摘要: 应挚友之邀,给他写一个爬虫性质的程序,主要的功能是建立一个网站列表(主要是一些新闻网站),然后定期地去扫描这些主页面上包含的所有子页面,分析这些子页面上面是包含有设置过的关键字。PS:几天前天始写这个程序,虽然有个大致的结构,可是写出来之后发现有太多地方不统一,功能重叠。于是想起来软件工程思想的伟大,决定从界面写起。而且有一个好的地方,就是我写的程序已经分好模块,因而即使换一个方向来写,之前的工作也没有白费,很不错。这款软件考虑到给别人用的时候装环境的话比较麻烦,因此放弃使用Java,改用VS开发,下面介绍一下软件的大致流程。需要定义两个线程,管理线程AdminThread和爬虫线程。作用如下 阅读全文
posted @ 2012-10-27 14:03 byan 阅读(1816) 评论(0) 推荐(0) 编辑
摘要: f(n) = O( g(n) )表示在某个n之后, f(n)一直位于g(n)的下面,eg. 2n2=O( n2 ),也有n = O( n2 )f(n) = o( g(n) )表示f(n)比g(n)阶数低,且不相等,即 lim[ f(n)/g(n) ] = 0;f(n) = Θ( g(n) )表示在某个n之后,f(n)被限定在g(n)的范围内,即 c1g(n) ≤f(n) ≤c2g(n)f(n) = Ω( g(n) )表示在某个n之后,f(n)一直位于g(n)之上,可等阶也可高阶f(n) = ω( g(n) )表示f(n)比g(n)高阶且不等阶,即lim[ f(n)/g(n) ] =∞ 阅读全文
posted @ 2012-10-27 10:16 byan 阅读(235) 评论(0) 推荐(0) 编辑