摘要: RAPTOR:递归摘要与树形检索的结合,提升RAG检索性能 RAPTOR:递归摘要,树形检索,助力RAG中的多粒度语义文本块检索 阅读全文
posted @ 2024-02-08 08:58 Milkha 阅读(227) 评论(0) 推荐(1) 编辑
摘要: 简明Pytorch分布式训练 — DistributedDataParallel 实践 一键带你运行Pytorch分布式模型训练 阅读全文
posted @ 2024-03-30 23:22 Milkha 阅读(3) 评论(0) 推荐(0) 编辑
摘要: Huggingface初上手即ERNIE-gram句子相似性实战 大模型如火如荼的今天,不实操实操一下语言模型实在说不过去了 阅读全文
posted @ 2024-02-29 22:52 Milkha 阅读(188) 评论(0) 推荐(2) 编辑
摘要: PyTorch数据并行(DP/DDP)浅析 带你一键运行数据并行(DP/DDP)代码 阅读全文
posted @ 2024-01-05 01:52 Milkha 阅读(178) 评论(0) 推荐(0) 编辑
摘要: Empowering Long-tail Item Recommendation through Cross Decoupling Network (CDN) 长尾问题是个老大难问题了。 在推荐中可以是用户/物料冷启动,在搜索中可以是中低频query、文档,在分类问题中可以是类别不均衡。长尾数据就像机器学习领域的一朵乌云,飘到哪哪里就阴暗一片。今天就介绍来自Google的一篇解决长尾物品推荐的论文。 阅读全文
posted @ 2023-09-03 00:36 Milkha 阅读(306) 评论(0) 推荐(0) 编辑
摘要: Improved Deep Metric Learning with Multi-class N-pair Loss Objective 从N-pair loss开始初探度量学习 阅读全文
posted @ 2023-08-10 01:29 Milkha 阅读(21) 评论(0) 推荐(0) 编辑
摘要: Rethinking the Role of Pre-ranking in Large-scale E-Commerce Searching system 这篇论文对粗排的角色进行了分析,讨论了粗排过度模拟精排的问题,分别从离线评估方式、样本构造、目标构造和学习框架上进行了改进。论文没有花太多篇幅在模型框架的创新上,而是在深入的分析和解决真实粗排场景中常见的问题,在各种细节上也处理的很到位,如多个正样本的list-wise损失函数的改造上。完整、仔细地读下来,对理清粗排的整个流程和挑战都很有帮助,值得学习。 阅读全文
posted @ 2023-07-09 22:20 Milkha 阅读(26) 评论(0) 推荐(0) 编辑
摘要: [TOC] 大语言模型势不可挡啊。 哲学上来说,语言就是我们的一切,语言所不能到达的地方我们也不能达到。就人类来说,语言或许已经不仅仅是一种工具那么简单,其不仅是人类在物理世界进行活动时不可或缺的媒介,也是我们自身构建精神世界时的一砖一瓦。语言的重要性已经无需多言了。 教会计算机人类的语言(用人类的 阅读全文
posted @ 2023-06-22 22:03 Milkha 阅读(312) 评论(0) 推荐(0) 编辑
摘要: Addictive & Multiplicative in NN 浅谈一下Addictive和Multiplicative 阅读全文
posted @ 2023-05-05 18:02 Milkha 阅读(11) 评论(0) 推荐(0) 编辑
摘要: 机器学习中常用的模型评价指标及其应用场景 Accuracy, Recall, Precision, F-score 先看一下它们的计算公式: $$ ACC = \frac{TP + TN}{TP+FN+TN+FP}\quad Recall = \frac{TP}{TP+FN}\quad Precision = \frac{TP}{TP+FP 阅读全文
posted @ 2023-04-06 16:31 Milkha 阅读(26) 评论(0) 推荐(0) 编辑