转载 AI-Talking 图算法

https://mp.weixin.qq.com/s/2XRgJr-ydxHA3JxAZ_5HeA

图算法在风控业务的实践

 

直播行业中有很多业务风控问题,比如说批量注册、刷热度、垃圾信息以及薅羊毛等。图兴起以来,目前用得很广泛的一个场景便是业务风控。

 

 

 

图视角进行业务风控的优势是:

  • 图可以描述黑产团伙作案的聚集性和关联性。

  • 图特征对新的攻击方式抗性较高,具有很强的鲁棒性。

  • 图算法对数据的要求比较灵活,可以进行各种 机器学习任务。

  • 使用图容易对大规模数据做并行化处理,计算效率高 。

     

图算法整体框架

在业务风控中,图算法的整体框架包括三个部分,首先是数据层,包括实体关系和属性(比如账户、设备、IP等等信息),还有行为数据(比如注册、登录、抽奖等信息)这些都是风控中非常有价值的数据。其次是算法层,算法有很多,包括像图嵌入的,高密子图挖掘等。最后就是将这些算法模型应用到实际的业务中去。

 

图的设计

 

 

 

异构图

 

 

同构图的特点:由异构关系转化得到,行为具有同步性,Embedding 向量的相似度,多个弱信息拼接。

 

图算法应用流程

主要分为四个流程:首先是图构建与分析,其过程包括节点和边的定义,Hubs的处理,基于标签的分析以及基于特征的分析。然后就是构建图算法,并基于业务规则进行相应的调整。训练模型之后要进行结果的评估和监控,包括效果指标监控,算法结果的优化以及可解释性。最后就是应用到业务中去。

posted @ 2019-10-31 09:54  fionaplanet  阅读(343)  评论(0编辑  收藏  举报