会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
橙宝技术
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
3
4
5
6
7
8
9
10
11
下一页
2020年6月13日
如何从 5 亿个数中找出中位数
摘要: 题目描述: 从 5 亿个数中找出中位数。数据排序后,位置在最中间的数就是中位数。当样本数为奇数时,中位数 =(N+1)/2;当样本数为偶数时,中位数为 N/2 与 1+N/2 的均值。 分析与解答: 如果这道题目没有内存大小的限制,则可以把所有的数字排序后找出中位数,但是最好的排序算法的时间复杂度都
阅读全文
posted @ 2020-06-13 21:05 橙宝技术
阅读(1166)
评论(0)
推荐(0)
2020年6月12日
排序算法
摘要: 使一串记录,按照其中的某个或某些关键字的大小,递增或递减排列起来的操作叫作排序。排序算法就是如何使记录按照要求排列的方法。排序算法在很多领域都得到了足够的重视,尤其是在大量数据的处理方面。一个优秀的算法可以节省大量的资源。在各个领域,考虑到数据的各种限制和规范,要想得到满足实际需要的优秀算法,需要经
阅读全文
posted @ 2020-06-12 15:17 橙宝技术
阅读(161)
评论(0)
推荐(0)
如何统计不同电话号码的个数
摘要: 题目描述: 已知某个文件内包含一些电话号码,每个号码为 8 位数字,统计不同号码的个数。 分析与解答: 这个题目本质上也是求解数据重复的问题,对于这类问题,首先会考虑位图法。对本题而言,8 位电话号码可以表示的范围为 00000000~99999999。如果用 1bit 表示一个号码,那么总共需要
阅读全文
posted @ 2020-06-12 15:14 橙宝技术
阅读(1965)
评论(0)
推荐(0)
如何查询最热门的查询串
摘要: 题目描述: 搜索引擎会通过日志文件把用户每次检索使用的所有查询串都记录下来,每个查询串的长度为 1~255B。 假设目前有 1000 万个记录(这些查询串的重复度比较高,虽然总数是 1000 万,但如果除去重复后,则不超过 300 万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门)。
阅读全文
posted @ 2020-06-12 14:56 橙宝技术
阅读(267)
评论(0)
推荐(0)
2020年6月10日
如何在大量的数据中判断一个数是否存在
摘要: 题目描述: 在 2.5 亿个整数中判断一个数是否存在。注意:内存不足以容纳这 2.5 亿个整数。 分析与解答: 显然 2.5 亿数据量太大,不可能一次性把所有的数据都加载到内存中,那么最容易想到的方法就是分治法。 方法一:分治法 对于大数据相关的算法题,分治法是一个非常好的方法。针对这道题,主要的思
阅读全文
posted @ 2020-06-10 20:48 橙宝技术
阅读(1318)
评论(0)
推荐(0)
如何在大量的数据中找出不重复的整数
摘要: 题目描述: 在 2.5 亿个整数中找出不重复的整数。注意:内存不足以容纳这 2.5 亿个整数。 分析与解答: 由于这道题目与前面的题目类似,也是无法一次性把所有数据加载到内存中,因此也可以采用类似的方法求解。 方法一:分治法 采用 hash 函数的方法,把这 2.5 亿个整数划分到更小的文件中,从而
阅读全文
posted @ 2020-06-10 20:35 橙宝技术
阅读(589)
评论(0)
推荐(0)
如何找出某一天访问百度网站最多的 IP
摘要: 题目描述: 现有海量日志数据保存在一个超级大的文件中,该文件无法直接读入内存,要求从中提取某天访问百度次数最多的那个 IP。 分析与解答: 由于这道题只关心某一天访问百度最多的 IP,因此可以先对文件进行一次遍历,把这一天访问百度网站的 IP 的相关信息记录到一个单独的文件中。接下来可以用上一节介绍
阅读全文
posted @ 2020-06-10 16:13 橙宝技术
阅读(290)
评论(0)
推荐(0)
拿几个乒乓球
摘要: 题目描述: 假设排列着 100 个乒乓球,由两个人轮流拿球装入口袋,能拿到第 100 个乒乓球的人为胜利者。条件是:每次拿球者至少要拿 1 个,但最多不能超过 5 个。问:如果你是最先拿球的人,那么你该拿几个?以后怎么拿就能保证你能得到第 100 个乒乓球? 分析与解答: 拿出 4 个,然后按照 6
阅读全文
posted @ 2020-06-10 10:18 橙宝技术
阅读(494)
评论(0)
推荐(0)
如何从大量数据中找出高频词
摘要: 题目描述: 有一个 1GB 大小的文件,文件里面每一行是一个词,每个词的大小不超过 16B,内存大小限制是 1MB,要求返回频数最高的 100 个词。 分析与解答: 由于文件大小为 1GB,而内存大小只有 1MB,因此不可能一次把所有的词读入到内存中处理,需要采用分治的方法,把一个大的文件分解成多个
阅读全文
posted @ 2020-06-10 09:56 橙宝技术
阅读(2215)
评论(0)
推荐(0)
2020年6月9日
赔了多少钱
摘要: 题目描述: 一天,店里来了一位顾客,挑了 25 元的货,顾客拿出 100 元,店里没零钱找不开,就到隔壁的店里把这 100 元换成零钱,回来给顾客找了 75 元零钱。过一会儿,隔壁来找这家店,说刚才的 100 元是假钱,店里马上给隔壁店换了张真钱,问店里赔了多少钱? 分析与解答: 100 元。 根据
阅读全文
posted @ 2020-06-09 15:29 橙宝技术
阅读(271)
评论(0)
推荐(0)
上一页
1
···
3
4
5
6
7
8
9
10
11
下一页
公告