阅读心得14:《新浪微博用户兴趣建模系统架构》

本周阅读了老师推荐阅读的公众号:架构师中的推文《新浪微博用户兴趣建模系统架构》,感想如下:

新浪微博,众所周知,已成为年轻人社交必不可少的一部分,相比微信朋友圈,微博所代表的社交空间是面向整个所有用户的,而在注册微博时,便会提示兴趣点,微博会推送给新用户一些大众所感兴趣,所关注的一些V+用户等。而兴趣建模在这一点就先的极其重要个性化系统就是能够针对不同用户的信息需求表现出不同运行效果的软件,而这样的软件提供的服务就是个性化服务。个性化系统的核心是用户建模,即对用户信息需求的模型表示。    在阅读本片文章之前,如果让我去想兴趣推荐系统如何实现,我的想法是根据用户点赞浏览的内容,进行分词,分词通过python搭建的词语预测模块来判断该条微博是属于什么类型的,比如搞笑类、时事类、热点类、八卦类、等等,当给用户数据库设置一个count参数,当用户的count达到一定数值时,可以向用户推荐同类词频的微博,此时就是我理解的如何去构建兴趣建模系统。

阅读完文章之后,微博推荐3.0的架构,也是当前实行的架构体系,大家其实可以发现,这是基于2.0 发展起来的,既然还保留了大量2.0中使用的分层体系以及工具框架。在这里重点描述几个差异:

两个标准:一个是针对应用层,作为整体框架输出,应用层设定all in one 接口标准,其标准包含了输入以及输出参数;另外一个是针对动态输入rin,由于离线计算我们可以确定结构,因此一个输入层工具r9-interface不需要设定规范,但是rin是需要进行标准设定,从属性/交互数据/日志等等层面进行划分。

计算层增加对于候选的标准生成方法:Artemis内容候选模块,item-cands用户候选模块、……,在项目开发中只需要选择这些候选生成方法即可。

增加了策略平台EROS,解决算法模型的问题。EROS主要的几个功能是:1)训练模型 2)特征选取 3)上线对比测试。

数据层中的r9-interface以及rin增加对于候选的生成方法,在线以及离线使用推荐通用策略生成结果。

此时,新浪微博的兴趣建模推荐系统便更加完善,优点如下:

继承了原有2.0的特点,保留了其优势

对于推荐理解更为深入,结合更为紧密

解决了推荐候选/排序/训练的算法最重要问题

微博推荐3.0的诞生,其成果如下:

1) 微博推荐的核心业务会逐步迁移到该体系下,以算法数据作为驱动,提升效果

2) 诞生了EROS的训练流程,提出了训练的标准方法

3) 针对推荐设定了标准的输入输出方法

4) 针对候选,产生了具有抽象意义的推荐方法集合

文章地址:

https://mp.weixin.qq.com/s?__biz=MzAwNjQwNzU2NQ==&mid=209199498&idx=1&sn=12556bfc94311a0a33d67d361f6237af&scene=21#wechat_redirect

 

 


posted @ 2019-06-11 01:34  李嘉来  阅读(269)  评论(0编辑  收藏  举报