关于通过标签取得相关文章的算法
摘要:        
比如有10000篇文章,每篇可能有0-10个标签,不同的标签共有1000个,用什么算法能最快地获取与指定文章相关度最高的其它文章?用一个1000bit(归约为1024bit)数据类型来记录每篇文章包含了哪些标签,然后对这个数据进行与运算,以结果里出现的1的个数为标准排序即可。规模大约为:数据传输:1024bit=128Byte, 128Byte*10000=128B*10K=1MB(可以缓存,不是...    阅读全文
        
            posted @ 2007-05-11 04:17
deerchao
阅读(1304)
评论(0)
推荐(0)
        
     浙公网安备 33010602011771号
浙公网安备 33010602011771号