会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
mghio
博客园
首页
新随笔
联系
订阅
管理
2020年4月19日
如何在亿级数据中判断一个元素是否存在?
摘要: 前言 在日常工作中,经常要判断一个元素是否在一个集合中。假设你要向浏览器添加一项功能,该功能可以通知用户输入的网址是否是恶意网址,此时你手上有大约 1000 万个恶意 URL 的数据集,你该如何实现该功能。按我之前的思维,要判断一个元素在不在当前的数据集中,首先想到的就是使用 ,通过哈希函数运行所有
阅读全文
posted @ 2020-04-19 21:42 mghio
阅读(1711)
评论(2)
推荐(7)
编辑
公告