随笔分类 - Machine Learning
摘要:source: 浅谈微视推荐系统中的特征工程 - 知乎 (zhihu.com) 这篇博文分为特征提取, 特征选择, 特征重要性三个部分, 围绕短视频平台推荐系统进行了特征工程的介绍 一、特征提取 确定了哪些因素可能与预测目标相关后,我们需要将此信息抽取成特征 从描述对象上,微视推荐系统中的特征可分为
阅读全文
摘要:AUC:TPR为纵轴,FPR为横轴,不同阈值下的散点连成ROC曲线,曲线下与x轴围合的面积即为AUC值 source:为什么搜索与推荐场景用AUC评价模型好坏? (qq.com) 1.AUC值与模型预测值的大小无关, 只关注排序效果, 所以特别适合排序业务 2.AUC值一个通俗易懂的解释: 例如0.
阅读全文
摘要:随机森林的生成方法 从样本集中通过重采样的方式产生n个样本。 建设样本特征数目为a,对n个样本选择a中的k个特征,用建立决策树的方式获得最佳分割点。 重复m次,产生m棵决策树。 多数投票机制进行预测。 随机森林的优点 (随机森林(Random forest,RF)的生成方法以及优缺点_zhongju
阅读全文
摘要:在一个大规模的推荐系统中,我们可以从三个角度来理解多样化的推荐结果: quality: 供应与用户兴趣匹配 diversity: 发现/扩展用户兴趣 fairness: 对长尾和小众items公平 对于quality, 可以来自用户历史兴趣, 也可以是用户兴趣的发现和拓展. 我们可以对点击率, 时长
阅读全文
摘要:2021/8/6 FFM 相比FM的改进: 当特征$x_i$与每个$x_j$交叉时, 会根据$x_j$所属的不同field, 贡献出不同的隐向量$v_{if_j}$用于内积求权重. 具体地, FFM的特征组合项为: $$ y(x) = \omega_0 + \sum_{i=1}^n \omega_i
阅读全文

浙公网安备 33010602011771号