Milkha

2024年2月8日

RAPTOR：递归摘要与树形检索的结合，提升RAG检索性能

摘要：

RAPTOR：递归摘要，树形检索，助力RAG中的多粒度语义文本块检索阅读全文

posted @ 2024-02-08 08:58 Milkha 阅读(1677) 评论(0) 推荐(1)

2024年1月5日

PyTorch数据并行（DP/DDP）浅析

摘要：

带你一键运行数据并行（DP/DDP）代码阅读全文

posted @ 2024-01-05 01:52 Milkha 阅读(5159) 评论(0) 推荐(1)

2023年9月3日

Empowering Long-tail Item Recommendation through Cross Decoupling Network (CDN)

摘要：

长尾问题是个老大难问题了。在推荐中可以是用户/物料冷启动，在搜索中可以是中低频query、文档，在分类问题中可以是类别不均衡。长尾数据就像机器学习领域的一朵乌云，飘到哪哪里就阴暗一片。今天就介绍来自Google的一篇解决长尾物品推荐的论文。阅读全文

posted @ 2023-09-03 00:36 Milkha 阅读(1062) 评论(0) 推荐(0)

2023年8月10日

Improved Deep Metric Learning with Multi-class N-pair Loss Objective

摘要：

从N-pair loss开始初探度量学习阅读全文

posted @ 2023-08-10 01:28 Milkha 阅读(224) 评论(0) 推荐(0)

2023年7月9日

Rethinking the Role of Pre-ranking in Large-scale E-Commerce Searching system

摘要：

这篇论文对粗排的角色进行了分析，讨论了粗排过度模拟精排的问题，分别从离线评估方式、样本构造、目标构造和学习框架上进行了改进。论文没有花太多篇幅在模型框架的创新上，而是在深入的分析和解决真实粗排场景中常见的问题，在各种细节上也处理的很到位，如多个正样本的list-wise损失函数的改造上。完整、仔细地读下来，对理清粗排的整个流程和挑战都很有帮助，值得学习。阅读全文

posted @ 2023-07-09 22:19 Milkha 阅读(281) 评论(0) 推荐(0)

2023年6月22日

浅尝Transformer和LLM

摘要： [TOC] 大语言模型势不可挡啊。哲学上来说，语言就是我们的一切，语言所不能到达的地方我们也不能达到。就人类来说，语言或许已经不仅仅是一种工具那么简单，其不仅是人类在物理世界进行活动时不可或缺的媒介，也是我们自身构建精神世界时的一砖一瓦。语言的重要性已经无需多言了。教会计算机人类的语言（用人类的阅读全文

posted @ 2023-06-22 22:03 Milkha 阅读(1272) 评论(0) 推荐(0)

2023年5月5日

Addictive & Multiplicative in NN

摘要：

浅谈一下Addictive和Multiplicative 阅读全文

posted @ 2023-05-05 18:02 Milkha 阅读(63) 评论(0) 推荐(0)

2023年4月6日

机器学习中常用的模型评价指标及其应用场景

摘要：

Accuracy, Recall, Precision, F-score 先看一下它们的计算公式： $$ ACC = \frac{TP + TN}{TP+FN+TN+FP}\quad Recall = \frac{TP}{TP+FN}\quad Precision = \frac{TP}{TP+FP 阅读全文

posted @ 2023-04-06 16:31 Milkha 阅读(227) 评论(0) 推荐(0)

2023年3月23日

关于大模型对未来影响的一点看法

摘要：

人们总是高估了未来一到两年的变化，低估了未来十年的变革。比尔盖茨近来OpenAI的GPT技术可以说在全球都带来了巨大的影响，也让大家看到了什么叫大力出奇迹。chatGPT和GPT4的能力给了大家很大的震撼，其流畅自如、逻辑清晰、出众的能力，给使用过的人都留下了深刻的印象，同时也让无数人对这项技术阅读全文

posted @ 2023-03-23 20:16 Milkha 阅读(547) 评论(0) 推荐(1)

2023年3月8日

一个例子了解operator+

摘要：

直击 operator+ 的秘密阅读全文

posted @ 2023-03-08 09:36 Milkha 阅读(48) 评论(0) 推荐(0)

公告