2011年5月26日

摘要: 上千万或亿条数据量,如何统计出重复记录最多的前N条:对于这个问题,我个人觉得可以通过统计的方法来完成:去重+统计,具体的做法是:(1)初始化一个空的集合A(具体的就不去说了,建议用hashtable)。(2)顺序读入这些数据,如果当前读入的数据不在该集合A中,则将其插入到A中,并将其出现次数标记为... 阅读全文
posted @ 2011-05-26 22:39 xuq 阅读(1178) 评论(0) 推荐(0)
摘要: 1. 给你A,B两个文件,各存放50亿条URL,每条URL占用64字节,内存限制是4G,让你找出A,B文件共同的URL。2. 有10个文件,每个文件1G,每个文件的每一行都存放的是用户的query,每个文件的query都可能重复。要你按照query的频度排序3. 有一个1G大小的一个文件,里面每一... 阅读全文
posted @ 2011-05-26 22:39 xuq 阅读(211) 评论(0) 推荐(0)
摘要: 1、索引是根据查询语句来建立的;2、通常后一次有索引的会比前一次快,之于快多少取决于数据量。比如:100条数据,没有索引时平均需要查询50次(从头到尾逐个比较),有索引则只需要比较大约7次(类似二分查找法);如果是1000条数据的话,没有索引时平均需要查询500次,有索引则只需要比较大约11~12... 阅读全文
posted @ 2011-05-26 22:38 xuq 阅读(128) 评论(0) 推荐(0)
摘要: 联合(union)1.联合说明和联合变量定义联合也是一种新的数据类型,它是一种特殊形式的变量。联合说明和联合变量定义与结构十分相似。其形式为:union联合名{ 数据类型成员名; 数据类型成员名; ...}联合变量名; 联合表示几个变量公用一个内存位置,在不同的时间保存不同的数据类型和不同长度的变... 阅读全文
posted @ 2011-05-26 22:06 xuq 阅读(319) 评论(0) 推荐(0)
摘要: 结构和联合有下列区别:1.结构和联合都是由多个不同的数据类型成员组成,但在任何同一时刻,联合中只存放了一个被选中的成员,而结构的所有成员都存在。2.对于联合的不同成员赋值,将会对其它成员重写,原来成员的值就不存在了,而对于结构的不同成员赋值是互不影响的。下面举一个例了来加对深联合的理解。例4:ma... 阅读全文
posted @ 2011-05-26 22:06 xuq 阅读(640) 评论(0) 推荐(0)
摘要: 字符指针我们已经知道,字符串常量是由双引号括起来的字符序列,例如:"astring" 就是一个字符串常量,该字符串中因为字符a后面还有一个空格字符,所以它由8个字符序列组成。在程序中如出现字符串常量C编译程序就给字符串常量按排一存贮区域,这个区域是静态的,在整个程序运行的过程中始终占用,平时所讲的... 阅读全文
posted @ 2011-05-26 22:05 xuq 阅读(250) 评论(0) 推荐(0)
摘要: 指针变量可出现在表达式中,设intx, y *px=&x;指针变量px指向整数x,则*px可出现在x能出现的任何地方。例如:y=*px+5;/*表示把x的内容加5并赋给y*/ y=++*px; /**px的内容加上1之后赋给y[++*px相当于++(*px)]*/ y=*px++;/*相当于y=*... 阅读全文
posted @ 2011-05-26 22:04 xuq 阅读(189) 评论(0) 推荐(0)
摘要: 我们定义一个整型数组和一个指向整型的指针变量:inta[10], *p; 和前面介绍过的方法相同,可以使整型指针p指向数组中任何一个元素,假定给出赋值运算p=&a[0];此时,p指向数组中的第0号元素,即a[0],指针变量p中包含了数组元素a[0]的地址,由于数组元素在内存中是连续存放的,因此,我... 阅读全文
posted @ 2011-05-26 22:04 xuq 阅读(725) 评论(0) 推荐(0)
摘要: 经过试验后发现,大部分的内存出错都是指针指向未知区域导致的,所以尽可能的在使用之前先分配内存,能用数组的用数组,不用数组用指针的时候要动态分配内存:str=(char*)malloc(2); 动态分配的时候,大小参数可以是变量名,这点比较好。 阅读全文
posted @ 2011-05-26 22:03 xuq 阅读(185) 评论(0) 推荐(0)
摘要: 我们知道变量在计算机内是占有一块存贮区域的,变量的值就存放在这块区域之中,在计算机内部,通过访问或修改这块区域的内容来访问或修改相应的变量。TurboC语言中,对于变量的访问形式之一, 就是先求出变量的地址,然后再通过地址对它进行访问,这就是这里所要论述的指针及其指针变量。所谓变量的指针,实际上指... 阅读全文
posted @ 2011-05-26 22:03 xuq 阅读(816) 评论(0) 推荐(0)
摘要: 增量运算在TurboC中有两个很有用的运算符, 在其它高级语言中通常没有。这两个运算符就是增1和减1运算符"++"和"--",运算符"++"是操作数加1,而"--" 则是操作数减1。 例如:x=x+1可写成x++, 或++x x=x-1可写成x--, 或--x x++(x--)与++x(--x)在... 阅读全文
posted @ 2011-05-26 22:02 xuq 阅读(141) 评论(0) 推荐(0)
摘要: ","运算符","运算符用于将多个表达式串在一起,","运算符的左边总不返回,右边表达式的值才是整个表达式的值。例如:main(){intx, y; x=50;y=(x=x-5,x/5); }上面程序执行后y值为9,因为x的初始值为50, 减5后变为45, 45除5为9赋给y。 阅读全文
posted @ 2011-05-26 22:02 xuq 阅读(106) 评论(0) 推荐(0)
摘要: main(){charm, n; /*定义字符型变量*/ m='c';/*给m赋小写字母'c'*/ n=m+'A'-'a';/*将c中的小写字母变成大写字母'B'后赋给n*/ ...}上例中m='c'即m=98,由于字母A和a的ASCII码值分别为65和97。这样可以将小写字母变成大写字母,反之,... 阅读全文
posted @ 2011-05-26 22:02 xuq 阅读(120) 评论(0) 推荐(0)
摘要: 指针型变量其大小为4字节表示地址,与里面存放的值的类型无关例如:main(){int*i; char*str; *i=100;str="Good";}*i表示i是一个指向整型数的指针,即*i是一个整型变量, i是一个指向该整型变量的地址。 *str表示str是一个字符型指针,即保留某个字符地址。在... 阅读全文
posted @ 2011-05-26 22:01 xuq 阅读(460) 评论(0) 推荐(0)
摘要: 数组与指针有密切的联系。数组名本身就是该数组的指针,反过来,也可以把指针看成一个数组,数组名和指针实质上都是地址,但是指针是变量,可以作运算。而数组名是常量,不能进行运算。例如:main(){chars[30], *p; /*定义字符型数组和指针变量*/ p=s;/*指针p指向数组s的第一个元素s... 阅读全文
posted @ 2011-05-26 22:01 xuq 阅读(111) 评论(0) 推荐(0)
摘要: 纯C对数组不作边界检查。例如用下面语句说明两个数组charstr1[5], str2[6];当赋给str1一个字符串"ABCDEFG"时,只有"ABCDE"被赋给, "E" 将会自动的赋给str2, 这点应特别注意。一、autoauto称为自动变量,已在前面作了介绍, 这里不再重复。 二、stat... 阅读全文
posted @ 2011-05-26 22:00 xuq 阅读(140) 评论(0) 推荐(0)
摘要: 例如:main(){chars[30]; strcpy(s,"Good News!"); /*给数组赋字符串*/ }上面程序在编译时,遇到chars[30]这条语句时,编译程序会在内存的某处留出连续30个字节的区域, 并将第一个字节的地址赋给s。当遇到strcpy( strcpy 为TurboC2... 阅读全文
posted @ 2011-05-26 22:00 xuq 阅读(1671) 评论(0) 推荐(0)
摘要: 例如:main(){chars[30]; strcpy(s,"Good News!"); /*给数组赋字符串*/ }上面程序在编译时,遇到chars[30]这条语句时,编译程序会在内存的某处留出连续30个字节的区域, 并将第一个字节的地址赋给s。当遇到strcpy( strcpy 为TurboC2... 阅读全文
posted @ 2011-05-26 22:00 xuq 阅读(223) 评论(0) 推荐(0)
摘要: 告别单身+成就霸业,强者必学的定律!!自美国《科学》杂志(Science Magazine)告别单身+成就霸业,强者必学的定律!!1、蓝斯登原则:在你往上爬的时候,一定要保持梯子的整洁,否则你下来时可能会滑倒。提出者:美国管理学家蓝斯登。点评:进退有度,才不至进退维谷;宠辱皆忘,方可以宠辱不惊。2... 阅读全文
posted @ 2011-05-26 21:57 xuq 阅读(183) 评论(0) 推荐(0)
摘要: #includeintmain(){inti = 3;cout<<((i&(i-1))?0:1)<<endl;getchar();}i&(i-1)为0时才是2的幂,否则不是2的幂 阅读全文
posted @ 2011-05-26 21:49 xuq 阅读(170) 评论(0) 推荐(0)
摘要: #include#includeintn=5;intp[6];intnum=0;voidperm(int m);intmain(){for(inti = 0;i<=5;i++){p[i]=0;}perm(n);getchar();}voidperm(int m){if(m==0) {for(int... 阅读全文
posted @ 2011-05-26 21:46 xuq 阅读(140) 评论(0) 推荐(0)
摘要: forward和redirect的区别forward是服务器请求资源,服务器直接访问目标地址的URL,把那个URL的响应内容读取过来,然后把这些内容再发给浏览器,浏览器根本不知道服务器发送的内容是从哪儿来的,所以它的地址栏中还是原来的地址。redirect就是服务端根据逻辑,发送一个状态码,告诉浏... 阅读全文
posted @ 2011-05-26 21:43 xuq 阅读(233) 评论(0) 推荐(0)
摘要: 首先是环境的搭建:1.ubuntu下面自带的有python,也自己自己去安装别的版本,几个版本可以同时存在没有任何问题2.安装django,下载django安装文件,python setup.py install,如果安装了别的版本的python,比如说python2.7 那相应的安装指令改为py... 阅读全文
posted @ 2011-05-26 11:09 xuq 阅读(213) 评论(0) 推荐(0)

2011年4月26日

摘要: xrdp查找进程ps -ef|grep xx防火墙iptables startiptables stop/etc/init.d/mysql start按内容查找find . -name "*.* " |xargs grep AAAtomcat相关:$ sudo service tomc... 阅读全文
posted @ 2011-04-26 14:58 xuq 阅读(121) 评论(0) 推荐(0)

2010年12月26日

摘要: 这段时间实验室有一个分析a型病毒序列的项目,中间有一块是分析一系列蛋白的发育树,并且把模型web化,集成到联合科研平台上,所以这几天一直在琢磨这方面的技术。1,用过matlab生物工具箱的都知道,里面有发育树函数,就给定特殊结构的数据可以算出发育树(具体参见帮助文档Bird Flu的demo),在... 阅读全文
posted @ 2010-12-26 22:14 xuq 阅读(335) 评论(0) 推荐(0)
摘要: 我们知道在jsp中要实现无刷新技术最好是使用ajax技术,但是对初学者或者一些简单的应用当中没有必要使用这个的时候我们就会选用一种假的ajax方法,最经典的例子就是给form设置一个target,而又把跳转页面隐藏。还有一种初学者常用的应用是给form设置一个target,单击提交按钮后,调... 阅读全文
posted @ 2010-12-26 21:55 xuq 阅读(1121) 评论(0) 推荐(0)

2010年12月22日

摘要: 一、jsp连接Oracle8/8i/9i数据库(用thin模式) testoracle.jsp如下: 您的第一个字段内容为: 您的第二个字段内容为: 二、jsp连接Sql Server7.0/2000数据库 testsqlserver.jsp... 阅读全文
posted @ 2010-12-22 19:31 xuq 阅读(227) 评论(0) 推荐(0)

2010年12月16日

摘要: 在实际中我们会经常遇到这些的问题,给你一组城市,你总能从地图上测出任何一对城市之间的距离。但若给你若干城市的距离,你能否确定这些城市之间的相对位置呢?假定你知道只是哪两个城市最近,哪两个城市次近等等,你是否还能确定它们之间的相对位置呢?假定通过调查了解了10种饮料产品在消费者心中的相似程度,你能... 阅读全文
posted @ 2010-12-16 18:11 xuq 阅读(626) 评论(0) 推荐(0)

2010年12月15日

摘要: java中的类访问控制符分四种:public protected friendly(缺省) privatepublic最简单:使用范围可以是同一个类,同包的子类和非子类,不同包的子类和非子类protected:使用范围可以是同一个类,同包的子类和非子类friendly(最复杂):使用范围可以是同一... 阅读全文
posted @ 2010-12-15 23:57 xuq 阅读(383) 评论(0) 推荐(0)
摘要: java语言深入(java中是传值还是引用)关键字: java基础深入 熟悉C的程序员都用过指针,对指针可谓爱之深恨之切。指针是指向一块内存地址的内存数据(有些拗口),也就是说指针本身是一个占用4字节内存的 int(32 位系统内),而这个int值恰恰又是另一块内存的地址。比如"hello"这个字... 阅读全文
posted @ 2010-12-15 23:54 xuq 阅读(276) 评论(0) 推荐(0)
摘要: 第一种方法使用 Desktop类,该类继承自Objectimport java.awt.*;import java.io.*;class DesktopTest {public static void main(String args[]){ if (!Desktop.isDesktopSuppo... 阅读全文
posted @ 2010-12-15 23:50 xuq 阅读(362) 评论(0) 推荐(0)

导航