上一页 1 2 3 4 5 6 7 8 ··· 40 下一页
摘要: def inbatch_softmax_loss(user_pred_vector, item_pred_vector, item_id, labels): labels = tf.linalg.diag(tf.reshape(tf.ones_like(labels),[-1])) diff = t 阅读全文
posted @ 2025-01-22 18:13 AI_Engineer 阅读(138) 评论(0) 推荐(0)
摘要: 论文链接:HoME: Hierarchy of Multi-Gate Experts for Multi-Task Learning at Kuaishou 背景 论文指出现在的MMOE/PLE等multitask模型存在以下几个问题: 专家崩溃:专家的输出分布存在显著差异,并且一些专家使用 ReL 阅读全文
posted @ 2025-01-22 12:04 AI_Engineer 阅读(453) 评论(0) 推荐(0)
摘要: 模型结构 transform模型结构由以下几个部分组成: 左边的解码部分:由多个encoder结构堆叠而成,输入src emb 和 position emb的和,输出编码后结果memory 右边的编码部分:由多个decoder结构堆叠而成,输入tgt emb 和 position emb的和以及编码 阅读全文
posted @ 2025-01-21 10:46 AI_Engineer 阅读(21) 评论(0) 推荐(0)
摘要: #include <iostream> #include <vector> class DynamicArray { private: std::vector<int> arr; public: // 默认构造函数 DynamicArray() {} // 析构函数 ~DynamicArray() 阅读全文
posted @ 2025-01-20 11:03 AI_Engineer 阅读(12) 评论(0) 推荐(0)
摘要: 1. 样本加权 2. 使用Focal Loss or GHM Loss 3. 样本采样 参考资料 广告行业中那些趣事系列24:从理论到实践解决文本分类中的样本不均衡问题 阅读全文
posted @ 2025-01-15 11:53 AI_Engineer 阅读(30) 评论(0) 推荐(0)
摘要: RecSys'24 | 腾讯广告NISE:使用非点击样本做CVR预估 阅读全文
posted @ 2024-12-24 12:03 AI_Engineer 阅读(61) 评论(0) 推荐(0)
摘要: KDD'21 | 淘宝搜索中语义向量检索技术 阅读全文
posted @ 2024-12-24 11:12 AI_Engineer 阅读(49) 评论(0) 推荐(0)
摘要: KDD'21 | 揭秘Facebook升级版语义搜索技术 阅读全文
posted @ 2024-12-18 16:08 AI_Engineer 阅读(28) 评论(0) 推荐(0)
摘要: 用户序列建模 用户序列建模的六道剑匣 阅读全文
posted @ 2024-12-13 10:31 AI_Engineer 阅读(17) 评论(0) 推荐(0)
摘要: https://zhuanlan.zhihu.com/p/452827958 阅读全文
posted @ 2024-12-11 17:55 AI_Engineer 阅读(28) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 8 ··· 40 下一页