代码改变世界

随笔档案-2011年8月29日

全文检索、数据挖掘、推荐引擎系列7---条目相似度算法

2011-08-29 17:11 by java ee spring, 499 阅读, 收藏,
摘要: 在实际的项目中,有许多场合需要进行条目相似度计算,比如在电商系统中,经常有喜欢这个商品的用户还喜欢,通常计算商品的相似度是实现这种功能的方法之一,这可以视为一种基于内容的推荐系统的应用。同时,计算相似度不仅可以用于推荐商品,利用同样的算法,我们还可以计算出用户的相似度,可以向用户推荐其感兴趣的其他用户。与文本分析不同,对相似度的计算一般基于与用户的交互数据,如用户对商品进行投票、打分、浏览、购买等行为,经过适当的流程,将这些交互数据进行数字化,如浏览、购买、投票与否用0/1表示,对打分用实际的分数计算。这类算法与文本分析算法相比具有两个明显的优势:第一是文本分析算法需要处理英文和中文问题,并且 阅读全文

最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用18

2011-08-29 12:50 by java ee spring, 262 阅读, 收藏,
摘要: 专注还是活着转眼一个月过去,吴言的项目在缓慢但是坚定的进步着,再有两三个月,这个产品应该就可以上线了,这使吴言很欣慰。但是这个介于alpha版和Beta版之间的版本上线之后,下一步再要做什么吴言目前还没有很好的打算。这天吴言正在做着程序,忽然接到了同学钟永发的电话,吴言与钟永发大毕业后的联系并不多,只知道他去了江西的一家科研院所,是做导弹的,前几年因为台湾问题,忙得总是加班,不过每年都能分个二三十万,后来在当地找了一个特别漂亮的媳妇,日子过得挺滋润。他打电话来干什么呢?吴言充满疑惑地接起了电话:“喂?永发呀!最近怎么样?”“还行吧!听小A说你开始创业了,打电话过来问问。就是,像你们这些牛人,早 阅读全文