摘要:> 问题:给40亿个不重复的unsigned int的整数,没排过序的,然后再给几个数,如何快速判断这几个数是否在那40亿个数当中?> 解决:unsigned int 的取值范围是0到2^32-1。我们可以申请连续的2^32/8=512M的内存,用每一个bit对应一个unsigned int数字。首先将512M内存都初始化为0,然后每处理一个数字就将其对应的bit设置为1。当需要查询时,直接找到对...
阅读全文
摘要:lazy的属性有false、true、extrafalse和true用得比较多,extra属性是不大容易重视的,其实它和true差不多extra有个小的智能的地方是,即调用集合的size/contains等方法的时候,hibernate并不会去加载整个集合的数据,而是发出一条聪明的SQL语句,以便获得需要的值,只有在真正需要用到这些集合元素对象数据的时候,才去发出查询语句加载所有对象的数据
阅读全文
摘要:本文将介绍在Linux(Red Hat 9)环境下搭建Hadoop集群,此Hadoop集群主要由三台机器组成,主机名分别为:linux 192.168.35.101linux02 192.168.35.102linux03 192.168.35.103从map reduce计算的角度讲,linux作为master节点,linux02和linux03作为slave节点。从hdfs数据存...
阅读全文
摘要:引言 Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS放宽了一部分POSIX约束,来实现流...
阅读全文
摘要:function is_email($email) { $exp = "^[a-z'0-9]+([._-][a-z'0-9]+)*@([a-z0-9]+([._-][a-z0-9]+))+$"; if(eregi($exp,$email)) { return true; } return false;}
阅读全文
摘要:function remove_quote(&$str) { if (preg_match("/^\"/",$str)){ $str = substr($str, 1, strlen($str) - 1); } //判断字符串是否以'"'结束 if (preg_match("/\"$/",$str)){ ...
阅读全文
摘要:function is_chinese($s){ $allen = preg_match("/^[^\x80-\xff]+$/", $s); //判断是否是英文 $allcn = preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/",$s); //判断是否是中文 if($allen){ ...
阅读全文
摘要:DML(data manipulation language): 它们是SELECT、UPDATE、INSERT、DELETE,就象它的名字一样,这4条命令是用来对数据库里的数据进行操作的语言DDL(data definition language): DDL比DML要多,主要的命令有CREATE、ALTER、DROP等,DDL主要是用在定义或改变表(TABLE)的结构,数...
阅读全文
摘要:今天启动Eclipse时,弹出错误提示:解决办法:将Eclipse下的eclipse.ini文件做如下改动=>
阅读全文
摘要:1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如: select id from t where num is null 可以在num上设置默认值0,确保表中num列没有null值,然后这样查询: select id fro...
阅读全文
摘要:SELECT * FROM table LIMIT [offset,] rows | rows OFFSET offsetLIMIT子句可以被用于强制SELECT语句返回指定的记录数。LIMIT接受一个或两个数字参数,参数必须是一个整数常量。如果给定两个参数,第一个参数指定第一个返回记录行的偏移量,第二个参数指定返回记录行的最大数目。初始记录行的偏移量是0(而不是1):为了与 PostgreSQL...
阅读全文
摘要:tmp_table_size = 500mb //临时表大小设置//指定用于索引的缓冲区大小,增加它可得到更好的索引处理性能。//对于内存在4GB左右的服务器该参数可设置为256M或384M。//注意:该参数值设置的过大反而会是服务器整体效率降低!key_buffer_size = 384msort_buffer_size = 17mb //排序缓存read_buffer_size=4m //读取...
阅读全文
摘要:注意:要把php.ini中 extension=php_mbstring.dll 前的;号去掉,重启apache就可以了。我创建三个文件:text1.txt text2.txt text3.txt分别以ASCII UTF-8 UNICODE 的编码方式保存';$file = 'text2.txt';echo getFileEncoding(file_get_contents($fil...
阅读全文
摘要:1. 下载PostgreSQL数据库zip版本2. 解压到D盘,例如:D:\database\postgresql3. cmd窗口进入D:\database\postgresq\bin,依次执行如下命令:set PGHOME=D:\database\postgresqset PGDATA=%PGHOME%\dataset PGLIB=%PGHOME%\libset PGHOST=localho...
阅读全文
摘要:postgres=# select uuid_generate_v1();uuid_generate_v1--------------------------------------86811bd4-22a5-11df-b00e-ebd863f5f8a7(1 row)postgres=# select uuid_generate_v4();uuid_generate_v4-------------...
阅读全文
摘要:> memcache介绍Memcached是一个高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库负载。它通过在内存中缓存数据和对象来减少读取数据库的次数,从而提供动态、数据库驱动网站的速度。Memcached基于一个存储键/值对的hashmap。其守护进程(daemon )是用C写的,但是客户端可以用任何语言来编写,并通过memcached协议与守护进程通信。但是它并不提供冗余(例如...
阅读全文