长文本 Embedding 模型中的“迟分”策略
摘要:
大约一年前,2023 年 10 月,我们推出了全球首个支持 8K 上下文长度的开源 Embedding 模型 —— jina-embeddings-v2-base-en。自此,长文本在 Embedding 模型中的应用引发了广泛讨论和争议。 信息压缩问题:将数千字的长文本编码为单一 Embeddin 阅读全文
posted @ 2025-02-21 19:19 ExplorerMan 阅读(163) 评论(0) 推荐(0)
浙公网安备 33010602011771号