摘要: 数据集 数据集概述 TencentGR_1k/是一个腾讯广告推荐系统的数据集,包含用户行为序列、物品特征、多模态嵌入等多种数据格式。该数据集主要用于推荐系统模型的训练和评估。 目录结构 TencentGR_1k/ ├── seq.jsonl # 用户行为序列数据 ├── item_feat_dict 阅读全文
posted @ 2025-12-02 00:23 Orzjh 阅读(1) 评论(0) 推荐(0)
摘要: AI Infra 综述(二)5 计算优化 COMPUTATION OPTIMIZATIONS核心思想: 现代AI芯片(如GPU)的算力非常强大,但要充分利用这些算力,就需要精巧的优化技术。本节主要介绍两大类方法:算子优化 (Operator Optimization)核心算子优化: 针对模型里最耗费 阅读全文
posted @ 2025-12-02 00:20 Orzjh 阅读(0) 评论(0) 推荐(0)
摘要: AI Infra 综述(一)Efficient Training of Large Language Models on Distributed Infrastructures: A Survey参考资料https://arxiv.org/abs/2407.20018https://github.c 阅读全文
posted @ 2025-12-02 00:18 Orzjh 阅读(0) 评论(0) 推荐(0)