随笔分类 -  深度学习推荐系统实战

摘要:https://blog.csdn.net/u013185349/article/details/108761332 阅读全文
posted @ 2022-08-16 17:04 Marklong 阅读(13) 评论(0) 推荐(0)
摘要:https://blog.csdn.net/weixin_43469047/article/details/114705787?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_baidulandingword~de 阅读全文
posted @ 2022-07-26 19:20 Marklong 阅读(167) 评论(0) 推荐(0)
摘要:https://zhuanlan.zhihu.com/p/411010918?ivk_sa=1024320u 阅读全文
posted @ 2022-07-26 19:17 Marklong 阅读(15) 评论(0) 推荐(0)
摘要:互联网中的图数据: 社交关系、知识图谱、行为关系图 基于图数据的 Graph Embedding 方法: 1基于随机游走的Graph Embedding 方法(注意:DeepWalk 的跳转概率就是跳转边的权重占所有相关出边权重之和的比例): 2.同质性与结构性权衡的方法,Node2Vec: 同质性 阅读全文
posted @ 2021-01-02 16:24 Marklong 阅读(77) 评论(0) 推荐(0)
摘要:embedding:用一个数值向量表示一个对象的方法,主要用以表示对象之间的关系 重要性: 1.将高维稀疏特征转为低维稠密特征。 2.融合大量有价值的信息,表达能力强。 以下为word2vector的模型结构(输入词的 one-hot编码,拟合该词的muti-hot编码,利用反向传播,激活函数是so 阅读全文
posted @ 2021-01-02 15:55 Marklong 阅读(165) 评论(0) 推荐(0)
摘要:Spark架构图如下: Spark 的计算过程:Stage内部数据高效并行计算,Stage边缘处进行消耗资源的shuffle或者reduce操作。 特征处理方法: 1.类别特征:one-hot编码 2.数值特征:归一化(不同类别特征权重不统一)与分桶(解决特征值分布不均与,过程:特征值高低排序->分 阅读全文
posted @ 2020-12-31 15:28 Marklong 阅读(121) 评论(0) 推荐(0)
摘要:下图是特征工程在推荐系统中的位置: 推荐系统常用的特征: 1.用户行为数据:显性反馈与隐性反馈(容易获得)。 2.用户关系数据:强关系(好友)和弱关系(有点关系)。 3.属性与特征数据:一般先用muti-hot编码,再进行embedding,目前业界大多先构建属性与主体之间的知识图谱,再进行embe 阅读全文
posted @ 2020-12-31 13:36 Marklong 阅读(146) 评论(0) 推荐(0)