原文:http://www.linuxfans.org/nuke/modules.php?name=News&file=article&sid=3262
先看一篇回帖:
由 littlelong 发表于 4月 15 @ 13:21:26 CST
1、Linux下桌面搜索你这个肯定不是第一款,起码也要知道beagle这个东西吧?
2、建立的只是文件索引,而不是全文索引,所以这个速度根本没有什么值的炫耀的,建立索引的快慢只是和索引的详细程度有关系,这里的索引大小,索引速度和索引时间均是trade off的关系。“对含有80多万文件、容量为1000G的硬盘,扫描和索引整个硬盘文件系统只需要12秒左右。”鄙人觉得此处有偷换概念的嫌疑。
3、程序代码实在是一般,由于没有全文索引,即使是先进的模式匹配算法,全文搜索时候也会远远比不上索引过的搜索效率,而是和文章的长度相关。全文搜索时候的速度根本没法和googledesktop这种建立的全文索引的软件比较。
4、你的测试方法有问题,linux会缓存过去访问过的文件。你在详细设计报告中提到:
“如在机器A上第一次扫描耗费129秒,而其它测试时间都不超过20秒。机器A是一台供30人同时使用的服务器,作者推断第一次扫描时服务器负载很重。gsearch还受当前文件系统在内存状况影响。例如作者发现,在负载相似的情况下,连续两次硬盘扫描,第一次扫描的时间明显高于第二次硬盘扫描的时间。”
这是linux缓存的鲜明表现,正确的测试方法是测试一次之后重新启动之后重新测试。也说明了你对linux机制不甚了解。
5、对比的例子,不能用find和grep来对比,find是直接扫描然后执行相应的操作,而并不建立索引。即使对比,也应该和相应的同功能的软件对比。
还希望能够踏实地走路,少以“第一”等字眼冠之,浮躁的科研是经不起检验的。
顺便说,我也是中科院的人。
原文节选
gongcaichun写著 '中国科学院计算技术研究所龚才春博士开发了Linux平台下第一款高效桌面搜索软件--GSearch。
先看一篇回帖:
由 littlelong 发表于 4月 15 @ 13:21:26 CST
1、Linux下桌面搜索你这个肯定不是第一款,起码也要知道beagle这个东西吧?
2、建立的只是文件索引,而不是全文索引,所以这个速度根本没有什么值的炫耀的,建立索引的快慢只是和索引的详细程度有关系,这里的索引大小,索引速度和索引时间均是trade off的关系。“对含有80多万文件、容量为1000G的硬盘,扫描和索引整个硬盘文件系统只需要12秒左右。”鄙人觉得此处有偷换概念的嫌疑。
3、程序代码实在是一般,由于没有全文索引,即使是先进的模式匹配算法,全文搜索时候也会远远比不上索引过的搜索效率,而是和文章的长度相关。全文搜索时候的速度根本没法和googledesktop这种建立的全文索引的软件比较。
4、你的测试方法有问题,linux会缓存过去访问过的文件。你在详细设计报告中提到:
“如在机器A上第一次扫描耗费129秒,而其它测试时间都不超过20秒。机器A是一台供30人同时使用的服务器,作者推断第一次扫描时服务器负载很重。gsearch还受当前文件系统在内存状况影响。例如作者发现,在负载相似的情况下,连续两次硬盘扫描,第一次扫描的时间明显高于第二次硬盘扫描的时间。”
这是linux缓存的鲜明表现,正确的测试方法是测试一次之后重新启动之后重新测试。也说明了你对linux机制不甚了解。
5、对比的例子,不能用find和grep来对比,find是直接扫描然后执行相应的操作,而并不建立索引。即使对比,也应该和相应的同功能的软件对比。
还希望能够踏实地走路,少以“第一”等字眼冠之,浮躁的科研是经不起检验的。
顺便说,我也是中科院的人。
原文节选
gongcaichun写著 '中国科学院计算技术研究所龚才春博士开发了Linux平台下第一款高效桌面搜索软件--GSearch。
浙公网安备 33010602011771号