随笔分类 -  推荐系统

基于大规模语料的新词发现算法【转自matix67】
摘要:最近需要对商品中的特有的词识别,因此需新词发现算法,matrix的这篇算法很好。 对中文资料进行自然语言处理时,我们会遇到很多其他语言不会有的困难,例如分词——汉语的词与词之间没有空格,那计算机怎么才知道“已结婚的和尚未结婚的”究竟是“已/结婚/的/和/尚未/结婚/的”,还是“已/结婚/的/和尚/未 阅读全文

posted @ 2016-07-18 17:08 chybot 阅读(913) 评论(0) 推荐(0)

推荐系统中的特征处理
摘要:转自csdn,加上一些自己的理解。基于特征化工程进行用户特征化,结合相关的机器学习算法对业务进行挖掘建模,在广告的精准投放、预测、风控等领域中应用的非常广泛。无论是有监督的学习分类算法,还是无监督的聚类也罢,都需要建立特征向量,对特征进行预处理;其中对于有监督的训练时,还需要进行样本的筛选。本章节讲... 阅读全文

posted @ 2015-07-17 20:01 chybot 阅读(2799) 评论(0) 推荐(0)

推荐系统之协同过滤
摘要:这个转自csdn,很贴近工程。协同过滤(Collective Filtering)可以说是推荐系统的标配算法。在谈推荐必谈协同的今天,我们也来谈一谈基于KNN的协同过滤在实际的推荐应用中的一些心得体会。我们首先从协同过滤的两个假设聊起。两个假设:用户一般会喜欢与自己喜欢物品相似的物品用户一般会喜欢与... 阅读全文

posted @ 2015-07-12 23:24 chybot 阅读(3644) 评论(0) 推荐(0)

推荐系统资料汇总
摘要:大数据/数据挖掘/推荐系统/机器学习相关资源Share my personal resources视频大数据视频以及讲义http://pan.baidu.com/share/link?shareid=3860301827&uk=3978262348浙大数据挖掘系列http://v.youku.com... 阅读全文

posted @ 2015-07-06 19:24 chybot 阅读(813) 评论(0) 推荐(0)

LDA学习之beta分布和Dirichlet分布
摘要:---恢复内容开始---今天学习LDA主题模型,看到Beta分布和Dirichlet分布一脸的茫然,这俩玩意怎么来的,再网上查阅了很多资料,当做读书笔记记下来:先来几个名词: 共轭先验: 在贝叶斯统计理论中,如果某个随机变量Θ的后验概率p(θ|x)和他的先验概率p(θ)属于同一个分布簇的,那么称p(... 阅读全文

posted @ 2015-05-15 23:25 chybot 阅读(813) 评论(0) 推荐(0)