GlenTt

导航

2025年8月7日 #

PLE模型简洁解读

摘要: PLE模型简洁解读 基础设定 有 2 个任务:CTR、CVR 使用 1 层 PLE(num_levels = 1) 每个任务 2 个任务特定专家(specific_expert_num = 2) 有 1 个共享专家(shared_expert_num = 1) 输入 embedding 是:[bat 阅读全文

posted @ 2025-08-07 20:10 GlenTt 阅读(241) 评论(0) 推荐(0)

ESMM 核心总结笔记

摘要: ESMM 核心总结笔记 背景 在电商推荐场景下,我们的最终目标是让用户在看到商品(曝光)后完成下单(转化)。如果直接把这个“曝光→转化”的联合概率当成一个单一的预测目标(CTCVR)来训练,正样本——也就是既被曝光又产生了转化的记录——在海量用户行为日志里极度稀少,模型很难从如此稀疏的数据中学到有用 阅读全文

posted @ 2025-08-07 14:12 GlenTt 阅读(89) 评论(0) 推荐(0)

2025年8月2日 #

深度学习归一化技术全景解析:原理、对比与应用建议

摘要: 🔧 深度学习归一化技术全景解析:原理、对比与应用建议 一、引言 大家好,我是Glen。今天和大家分享我对归一化技术的理解。当我第一次接触深度神经网络时,最困扰我的问题就是训练不稳定——有时候模型训练得很好,有时候梯度就爆炸了,有时候又消失得无影无踪。直到我深入理解了归一化技术,才意识到这些问题的根 阅读全文

posted @ 2025-08-02 11:13 GlenTt 阅读(360) 评论(0) 推荐(0)

2025年7月28日 #

长文!推荐‑搜索‑广告系统评估指标与损失函数技术报告

摘要: 推荐‑搜索‑广告系统评估指标与损失函数技术报告 Executive Summary 本报告系统梳理了推荐系统、搜索排序和精准广告中的评估指标体系与模型损失函数设计。从业务场景和实验流程差异入手,阐述了各类系统在离线与在线评测中的关注点;随后深入探讨常用的离线训练损失函数,包括点播式(point-wi 阅读全文

posted @ 2025-07-28 20:11 GlenTt 阅读(338) 评论(0) 推荐(0)

2025年7月27日 #

wide&deep在adult数据集上的应用

摘要: wide&deep在adult数据集上的应用 wide&deep在adult数据集上的应用 1 数据读取与清洗 train_df = pd.read_csv(...); test_df = pd.read_csv(...) # CSV → DataFrame train_df = _clean_data(train_df) # 去 ?、stri 阅读全文

posted @ 2025-07-27 14:24 GlenTt 阅读(31) 评论(0) 推荐(0)

2025年7月22日 #

attention

摘要: Attention的发展脉络 1 背景与动机 早期序列到序列(Seq2Seq)模型使用一个固定长度的上下文向量来表示整个源序列,这在 Bahdanau 等人(2014)提出的工作中被明确指出是性能瓶颈。他们发现在长句翻译任务中,用单个向量来编码任意长度的输入会限制模型表达能力。因此,Bahdanau 阅读全文

posted @ 2025-07-22 23:34 GlenTt 阅读(99) 评论(0) 推荐(0)