eaglet

本博专注于基于微软技术的搜索相关技术
posts - 182, comments - 3152, trackbacks - 26, articles - 0
  博客园 :: 首页 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理

公告

01 2011 档案

摘要: 本文将讲述一个高效的不重复随机数列的生成算法,其效率比通常用hashtable 消重的方法要快很多。阅读全文

posted @ 2011-01-17 09:30 eaglet 阅读(5656) | 评论 (72) 编辑 |

摘要: 今天专门测试了对索引文件全部缓存到内存以及对单词的倒排索引结果进行缓存。测试下来文件缓存到内存对搜索的速度提高非常有限,即便在磁盘的 Avg Disk Queue length = 100 时,性能的提升也很有限。分析下来,原因大致是因为顺序读取文件时操作系统已经做了缓存。 而倒排结果的缓存对性能提升能起到一定的作用,但在返回结果集 100万以下时,提升有限。今天测试返回结果集达到 780 万时,采用倒排结果缓存技术用时搜索是 99ms,而直接读文件方式下搜索用时500ms,这个性能的提升还是比较明显,但同时带来的是大量的内存开销,大约1000万的倒排结果需要消耗160M左右的内存。 从测试结阅读全文

posted @ 2011-01-11 12:28 eaglet 阅读(541) | 评论 (5) 编辑 |

摘要: 这个算法主要用于需要针对坐标的高速插入移动和查询。比如游戏的坐标定位,查找。阅读全文

posted @ 2011-01-04 09:45 eaglet 阅读(2067) | 评论 (9) 编辑 |