微平台推荐系统介绍(基于java)

1、推荐系统整体框架

 

2、推荐系统所用算法及所需数据

  基于协同过滤的推荐

  基于内容的推荐 

  基于内容推荐的原理:

  01、如何定义内容相似度,新闻作为文本类的数据,本身可以从文本特征几个方面去提取它的特征信息,进而将不同的新闻间的特征信息进行比较

  常见的特征信息有:新闻文本长度、新闻所属话题类型(社会、健康、国家政策)、来源(今日头条,知乎)、关键词(美国大选、希拉里)

  关键词具有比较强的新闻核心内容表征能力

  02、如何提取新闻关键词

  TF-IDF算法

  03、用户偏好构建

  (1)数据库中为每个用户维持一个关键词列表,这个关键词列表是针对每个微平台模块这一层面的,即每个模块享有一个大小相同,但内容独立的关键词列表

  如:用小明的关键词列表:“知乎精选”:{金融、计算机科学与技术、....} “36克”:{人工智能、VR}

  (2)用户浏览了某个模块的某个新闻news 利用tf-idf算法提取出news的k个关键词即对应的TF-idf值(关键程度),并将他们存入用户相应模块的关键词列表中

    如用户小明看了“知乎精选”里的一个新闻《》,通过tf-idf抽取出该新闻的三个关键词,刘慈欣:100.23,三体:70.21,民主政治:96.02,于是在小明的“知乎精选”关键词列表中,插入

    {....刘慈欣:100.23,三体:70.31,民主政治:96.02}

    若小明之前的“知乎精选”列表中已经有了“三体”关键词及对应的tf-idf值,将tf-idf进行叠加,表示用以加强用户对该关键词的感性去程度

   可能导致的用户的喜好,推荐结果收敛到用户以前特别喜欢的几个关键词上-----解决方法,每一次更新列表设置一个衰减系数lamada 定期对用户的喜好关键词的tf-idf值进行更新,减少关键词的收敛倾向

  如:“知乎精选”关键词列表:{刘慈欣:100,三体:80} 今天更新为:{刘慈欣:80,三体:64}

  (3)新闻内容与用户喜好拟合度计算

    有了用户的喜好关键词列表。以及新闻的关键词列表了只需要再做两个map匹配与值得计算即可,若有相同的值,则值想乘排序,若没有,则乘机为0

  基于热点新闻的推荐

  基于模型的推荐

  基于静态数据的推荐  

3、推荐系统所需微平台配合

  

4、推荐系统使用方法

 

posted @ 2018-03-28 14:55  lxwlxw  阅读(1630)  评论(0编辑  收藏  举报