摘要: 竞价广告计算法 常用的定价策略 广义第二高价(GSP) 市场保留价(MRP) 价格挤压 最关键的两个计算问题 广告检索 广告排序 搜索广告系统 优化目标 关键技术 查询扩展 意义:需求方通过扩展关键词获得更多的流量,供给方借此来变现更多流量和提高竞价的激烈程度 扩展方法 第五章介绍了精确匹配、短语匹 阅读全文
posted @ 2025-02-09 12:57 稳住·能赢 阅读(98) 评论(0) 推荐(0)
摘要: 信息检索 倒排索引:从大量文档中查找包含某些词的文档集合 向量空间模型(Vector Space Model, VSM):最基础最重要的相似度度量方法之一 文档表示方法:用各个关键词在文档中的强度(如TF-IDF)组成的矢量来表示文档 词频(Term Frequency, TF):某文档中,该词出现 阅读全文
posted @ 2025-02-09 12:56 稳住·能赢 阅读(1) 评论(0) 推荐(0)
摘要: 个性化系统框架 计算广告是根据个体用户信息投送个性化内容的典型系统之一 个性化系统的构成部分 用于实时响应请求,完成决策的『在线投放引擎』 离线的『分布式计算』数据处理平台 用于在线实时反馈的『流计算平台』 连接和转运上面三部分数据流的『数据高速公路』 协作流程 『在线投放系统』的日志接入『数据高速 阅读全文
posted @ 2025-02-09 12:56 稳住·能赢 阅读(15) 评论(0) 推荐(0)
摘要: 1. 离线评估 (1)介绍 离线评估是最常用、最基本的。顾名思义就是:我们将模型部署于线上环境之前,在离线环境下进行的评估。由于不用部署到生产环境,“离线评估”没有线上部署的工程风险,也不会浪费宝贵的线上流量资源,而且具有测试时间短,可多组并行,以及能够利用丰富的线下计算资源等诸多优点。 (2)评估 阅读全文
posted @ 2025-02-09 12:50 稳住·能赢 阅读(68) 评论(0) 推荐(0)
摘要: 参考资料 《深度学习推荐系统实战》 -- 极客时间,王喆 阅读全文
posted @ 2025-02-09 12:50 稳住·能赢 阅读(7) 评论(0) 推荐(0)
摘要: 特征组合和特征交叉问题非常常见,特征的种类非常多,特征交叉的复杂程度也要大得多。解决这类问题的关键,就是模型对于特征组合和特征交叉的学习能力,因为它决定了模型对于未知特征组合样本的预测能力,而这对于复杂的推荐问题来说,是决定其推荐效果的关键点之一。 那特征交叉与深度学习模型的拟合能力有什么关系呢?以 阅读全文
posted @ 2025-02-09 12:50 稳住·能赢 阅读(126) 评论(0) 推荐(0)
摘要: 1. 深度学习模型拟合能力更强 特征交叉方式中,点积等方式过于简单,在样本数据比较复杂的情况下,容易欠拟合。而深度学习可以大大提高模型的拟合能力,比如在 NeuralCF(神经网络协同过滤)模型中,点积层被替换为多层神经网络,理论上多层神经网络具备拟合任意函数的能力,所以我们通过增加神经网络层的方式 阅读全文
posted @ 2025-02-09 12:49 稳住·能赢 阅读(31) 评论(0) 推荐(0)
摘要: 1. 协同过滤(CF) 1. 里程碑 2003年,Amazon发表论文《Amazon.com recommendations: item-to-item collaborative filtering》,不仅让Amazon的推荐系统广为人知,更让协同过滤成为今后很长时间的研究热点和业界主流的推荐模型 阅读全文
posted @ 2025-02-09 12:49 稳住·能赢 阅读(41) 评论(0) 推荐(0)
摘要: 基础架构、特征工程、线上服务融会贯通 一张脑图比较大,加载比较慢。 参考资料 《深度学习推荐系统实战》 -- 极客时间,王喆 阅读全文
posted @ 2025-02-09 12:48 稳住·能赢 阅读(3) 评论(0) 推荐(0)
摘要: 1. 高并发线上服务 1. 工业级推荐服务器功能 需要跟离线训练好的模型打交道,把离线模型进行上线,在线进行模型服务(Model Serving), 需要跟数据库打交道,把候选物品和离线处理好的特征载入到服务器 召回层、排序层、业务逻辑(结果多样性、流行度) AB 测试 2. 高并发推荐服务整体架构 阅读全文
posted @ 2025-02-09 12:48 稳住·能赢 阅读(20) 评论(0) 推荐(0)