• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
qianye0905
博客园    首页    新随笔    联系   管理    订阅  订阅
在无序数中查找是否存在重复元素

给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?

http://blog.csdn.net/v_JULY_v/article/details/6279498

 

看到这个题的第一反应就是使用位图,使用内存空间为2^32bit = 512MB,遍历序列,把对应的bit位置一,查找的时间复杂度为O(1)

 

用位图来操作效率很高,这里提出了一种新的方法,在编程珠玑里边把每一个整数用32位的二进制来表示,然后把40亿的数据分为两类最低位为0和最低位为1,并把它们分别存入两个文件中,其中一个文件中整数个数大于20亿,另外一个文件中整数个数小于20亿,判断要查找的整数的最低位是0还是1,并在相应的文件中进行查找。

 

第二次再根据次低位把文件分成两部分,次低位分别为0和1的,然后再缩小查找范围,这样每次查找总能把范围缩小将近一半,这样经过31次划分之后,如果目标文件大小为0则表示目标数字不存在,如果为1则表示存在,如果大于1表示存在重复元素,时间复杂度为O(nlogn)

posted on 2012-11-29 10:34  qianye0905  阅读(293)  评论(0)    收藏  举报
刷新页面返回顶部
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3