2025 年 2月 21 日随笔档案 - ExplorerMan

长文本 Embedding 模型中的“迟分”策略

摘要：大约一年前，2023 年 10 月，我们推出了全球首个支持 8K 上下文长度的开源 Embedding 模型 —— jina-embeddings-v2-base-en。自此，长文本在 Embedding 模型中的应用引发了广泛讨论和争议。信息压缩问题：将数千字的长文本编码为单一 Embeddin 阅读全文

posted @ 2025-02-21 19:19 ExplorerMan 阅读(163) 评论(0) 推荐(0)

DistilQwen2：通义千问大模型的知识蒸馏实践

摘要：背景在人工智能快速发展的今天，大语言模型已经成为了人工智能的研究热点。其中，通义千问（Qwen）大模型系列凭借其强大的语言理解和生成能力，吸引了开源社区越来越多的关注。随着这些模型的应用场景不断扩大，如何提高它们的运算效率，降低部署成本，成为了一项重要的课题。知识蒸馏作为一种有效的模型压缩技术，通过阅读全文

posted @ 2025-02-21 17:49 ExplorerMan 阅读(273) 评论(0) 推荐(0)

从本地部署到企业级服务：十种主流LLM推理框架的技术介绍与对比

摘要：大语言模型（Large Language Models, LLMs）的部署是一项具有技术挑战性的工作。随着模型架构日益复杂，以及硬件需求不断提升，部署过程变得愈发复杂。业界已经发展出多种解决方案，使LLM的部署和扩展变得更加便捷。从适用于个人开发的轻量级本地部署工具，到面向企业级高性能生产环境的推理阅读全文

posted @ 2025-02-21 16:54 ExplorerMan 阅读(485) 评论(0) 推荐(1)

AIOps RAG 比赛获奖项目 EasyRAG 深度解读

摘要：背景介绍最近抽空参与 CCF 的 RAG 比赛，系统性对 RAG 检索中多种多样的检索优化方案进行了测试和对比，也发现了不少之前没有注意到的优化细节。从目前的实践来看，比赛确实是一个绝佳策略测试场所，很公平地对不同的优化方案进行了客观比较。实践中不时会发现直观感觉很有效的策略不生效，有些看起来平平阅读全文

posted @ 2025-02-21 11:36 ExplorerMan 阅读(308) 评论(0) 推荐(0)

Agent 智能体开发框架选型指南

摘要：转：https://mp.weixin.qq.com/s/0jB157hXY2AwIcji0jywBQ 编者按：本文通过作者的实践对比发现，框架的选择应基于项目具体需求和团队特点，而不是简单追求某个特定框架。不同框架各有优势：无框架方案实施最为简单直接，代码结构清晰，适合理解智能体原理，但随着项目阅读全文

posted @ 2025-02-21 11:19 ExplorerMan 阅读(820) 评论(0) 推荐(0)

ExplorerMan

长文本 Embedding 模型中的“迟分”策略

DistilQwen2：通义千问大模型的知识蒸馏实践

从本地部署到企业级服务：十种主流LLM推理框架的技术介绍与对比

AIOps RAG 比赛获奖项目 EasyRAG 深度解读

Agent 智能体开发框架选型指南

导航

公告