火星文 技术研习社

Noname Cat, Keep Thinking
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

真是经典:中科院的“内战”

Posted on 2007-04-15 17:52  剑廿三  阅读(311)  评论(0)    收藏  举报
原文:http://www.linuxfans.org/nuke/modules.php?name=News&file=article&sid=3262

先看一篇回帖:


littlelong 发表于 4月 15 @ 13:21:26 CST

1、Linux下桌面搜索你这个肯定不是第一款,起码也要知道beagle这个东西吧?

2、建立的只是文件索引,而不是全文索引,所以这个速度根本没有什么值的炫耀的,建立索引的快慢只是和索引的详细程度有关系,这里的索引大小,索引速度和索引时间均是trade off的关系。“对含有80多万文件、容量为1000G的硬盘,扫描和索引整个硬盘文件系统只需要12秒左右。”鄙人觉得此处有偷换概念的嫌疑。

3、程序代码实在是一般,由于没有全文索引,即使是先进的模式匹配算法,全文搜索时候也会远远比不上索引过的搜索效率,而是和文章的长度相关。全文搜索时候的速度根本没法和googledesktop这种建立的全文索引的软件比较。

4、你的测试方法有问题,linux会缓存过去访问过的文件。你在详细设计报告中提到:
“如在机器A上第一次扫描耗费129秒,而其它测试时间都不超过20秒。机器A是一台供30人同时使用的服务器,作者推断第一次扫描时服务器负载很重。gsearch还受当前文件系统在内存状况影响。例如作者发现,在负载相似的情况下,连续两次硬盘扫描,第一次扫描的时间明显高于第二次硬盘扫描的时间。”

这是linux缓存的鲜明表现,正确的测试方法是测试一次之后重新启动之后重新测试。也说明了你对linux机制不甚了解。

5、对比的例子,不能用find和grep来对比,find是直接扫描然后执行相应的操作,而并不建立索引。即使对比,也应该和相应的同功能的软件对比。


还希望能够踏实地走路,少以“第一”等字眼冠之,浮躁的科研是经不起检验的。

顺便说,我也是中科院的人。


原文节选

gongcaichun写著 '中国科学院计算技术研究所龚才春博士开发了Linux平台下第一款高效桌面搜索软件--GSearch。