随笔分类 -  NLP

natural language processing
NLP之统计机器学习中的协同推荐
摘要:这次通过一个实例来讲解一下协同推荐的问题。在实际生活中,我们会经常收到当当,卓马逊等购物网站发来的商品推荐邮件。很奇怪卓马逊是依据什么来给我发一些相关商品的推荐,但是今天我们就假定他是根据协同推荐的机制来实现这一功能的吧。很多时候购物网站都是根据其他用户的评价给一个用户推荐商品或者图书等。很多购物网站都会有这种长尾效益,用户购买或者评价的商品都是少数,而大多数商品只是得到很少几个用户的评价。所以存在数据稀疏的问题。这里就叫“cold start”问题。SlopeOne算法可以用来解决这个问题,这个算法很简单,易于实现且效率较高。SlopeOne的基本概念很简单,例如用户X,Y和A都对项目1打了 阅读全文

posted @ 2012-10-30 16:53 翠竹林 阅读(385) 评论(0) 推荐(0)

NLP之统计机器学习中的生成式和判别式
摘要:机器学习的方法主要分为生成式和判别式两种。生成式模型:假定输入是X,类别标签是Y。产生式模型估计联合概率P(X,Y),因为可以根据联合概率来生成样本。判别式模型:假定输入是X,类别标签是Y。判别式模型估计条件概率P(X|Y),该模型只能用来判断分类,因为其不包含有关X的知识。举个例子来说明这两个概念:假如我现在给出了一组样本:(1,0),(1,1),(2,0),(2,1)。假定这就是能观察到的全部生成模型估计P(Y,X)如:P(1,0)=1/2;P(1,1)=0;P(2,0)=1/4;P(2,1)=1/4;判别模型估计P(X|Y)如:P(0|1)=1,P(1|1)=0,P(0|2)=1/2,P 阅读全文

posted @ 2012-10-29 16:41 翠竹林 阅读(979) 评论(0) 推荐(0)

导航