2013年10月21日

云计算面试题集锦

摘要: 1. 一个大的含有50M个URL的记录,一个小的含有500个URL的记录,找出两个记录里相同的URL。回答:首先使用包含500个url的文件创建一个hash_set。然后遍历50M的url记录,如果url在hash_set中,则输出此url并从hash_set中删除这个url。所有输出的url就是两个记录里相同的url。2. 海量日志数据,提取出某日访问百度次数最多的那个IP。回答:如果日志文件足够的大,大到不能完全加载到内存中的话。那么可以考虑分而治之的策略,按照IP地址的hash(IP)%1024值,将海量日志存储到1024个小文件中。每个小文件最多包含4M个IP地址。对于每个小文件,可以 阅读全文

posted @ 2013-10-21 07:23 洪雁君 阅读(3135) 评论(0) 推荐(0) 编辑

程序员笔试概念题集锦

摘要: 1. Linux进程间的通信方式?两个进程是如何来共享内存的?两个进程如何通过信号量通信?(1)Linux下进程间通信的方式有: 管道(有名/无名) 、消息、信号、信号量、共享内存、邮箱、socket。(2)Linux下共享内存是进程间通信的方式之一,共享内存允许两个或多个进程访问同一块内存,比如像 malloc函数 向不同的进程返回执行同一块物理内存区域的指针。当一个进程改变了这块地址中的内容的时候,其他拥有这块物理内存指针的进程也会察觉到这个更改。在进程间的通信方式中,共享内存是通信效率最高的,访问共享内存区域和访问进程独有的内存区域一样快,并不需要通过系统调用或者其他通过内核的过程来完成 阅读全文

posted @ 2013-10-21 01:22 洪雁君 阅读(393) 评论(0) 推荐(0) 编辑

导航