会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
JiangC
163博客 http://picacure.blog.163.com/
博客园
首页
新随笔
联系
订阅
管理
09 2011 档案
海量数据题目分析(转自网络)
摘要:给你A,B两个文件,各存放50亿条URL,每条URL占用64字节,内存限制是4G,让你找出A,B文件共同的URL对于这个题目,我们可以利用C语言的位数组来解决,建一个100亿的位数组,即,bit b[10000000000];//10个0,不用担心超过内存大小,我们可以算一下1*10的10次方bit,一共是大概1.25个G这样的内存, 然后我们按顺序读入数据A,每从a中获得一条url时,我们可以用...
阅读全文
posted @
2011-09-23 22:59
jiangC
阅读(185)
评论(0)
推荐(0)
公告