摘要:
你是否曾经有过要计算一个非常大的数据(几百GB)的需求?或在里面搜索,或其它操作——一些无法并行的操作。数据专家们,我是在对你们说。你可能有一个4核或更多核的CPU,但我们合适的工具,例如 grep, bzip2, wc, awk, sed等等,都是单线程的,只能使用一个CPU内核。借用卡通人物Ca... 阅读全文
posted @ 2014-05-20 15:53
Martin2
阅读(477)
评论(0)
推荐(0)
摘要:
最近公司业务调整,需要对属于百度某公司的域名进行剥离分开,属于本公司的域名更改掉。 域名非常之多之杂乱。各自分别整理手上的域名, 后面再整理无家可归的域名。这就需要对文件进行操作,也就是把文件当作集合,求集合的交集差集等等集合论相关的数学理论。下面介绍两个命令:1. comm命令comm命令可以用于... 阅读全文
posted @ 2014-05-20 15:44
Martin2
阅读(488)
评论(0)
推荐(0)
摘要:
毫无疑问,Redis开创了一种新的数据存储思路,使用Redis,我们不用在面对功能单调的数据库时,把精力放在如何把大象放进冰箱这样的问题上,而是利用Redis灵活多变的数据结构和数据操作,为不同的大象构建不同的冰箱。希望你喜欢这个比喻。下面是一篇新鲜出炉的文章,其作者是Redis作者@antirez... 阅读全文
posted @ 2014-05-20 15:24
Martin2
阅读(165)
评论(0)
推荐(0)
摘要:
当我们对MySQL进行分表操作后,将不能依赖MySQL的自动增量来产生唯一ID了,因为数据已经分散到多个表中。应尽量避免使用自增ID来做为主键,为数据库分表操作带来极大的不便。在postgreSQL、oracle、db2数据库中有一个特殊的特性—sequence。 任何时候数据库可以根据当前表中的记... 阅读全文
posted @ 2014-05-20 11:09
Martin2
阅读(767)
评论(0)
推荐(0)