上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 234 下一页

2025年2月21日

长文本 Embedding 模型中的“迟分”策略

摘要: 大约一年前,2023 年 10 月,我们推出了全球首个支持 8K 上下文长度的开源 Embedding 模型 —— jina-embeddings-v2-base-en。自此,长文本在 Embedding 模型中的应用引发了广泛讨论和争议。 信息压缩问题:将数千字的长文本编码为单一 Embeddin 阅读全文

posted @ 2025-02-21 19:19 ExplorerMan 阅读(122) 评论(0) 推荐(0)

DistilQwen2:通义千问大模型的知识蒸馏实践

摘要: 背景在人工智能快速发展的今天,大语言模型已经成为了人工智能的研究热点。其中,通义千问(Qwen)大模型系列凭借其强大的语言理解和生成能力,吸引了开源社区越来越多的关注。随着这些模型的应用场景不断扩大,如何提高它们的运算效率,降低部署成本,成为了一项重要的课题。知识蒸馏作为一种有效的模型压缩技术,通过 阅读全文

posted @ 2025-02-21 17:49 ExplorerMan 阅读(226) 评论(0) 推荐(0)

从本地部署到企业级服务:十种主流LLM推理框架的技术介绍与对比

摘要: 大语言模型(Large Language Models, LLMs)的部署是一项具有技术挑战性的工作。随着模型架构日益复杂,以及硬件需求不断提升,部署过程变得愈发复杂。业界已经发展出多种解决方案,使LLM的部署和扩展变得更加便捷。从适用于个人开发的轻量级本地部署工具,到面向企业级高性能生产环境的推理 阅读全文

posted @ 2025-02-21 16:54 ExplorerMan 阅读(384) 评论(0) 推荐(1)

AIOps RAG 比赛获奖项目 EasyRAG 深度解读

摘要: 背景介绍 最近抽空参与 CCF 的 RAG 比赛,系统性对 RAG 检索中多种多样的检索优化方案进行了测试和对比,也发现了不少之前没有注意到的优化细节。从目前的实践来看,比赛确实是一个绝佳策略测试场所,很公平地对不同的优化方案进行了客观比较。实践中不时会发现直观感觉很有效的策略不生效,有些看起来平平 阅读全文

posted @ 2025-02-21 11:36 ExplorerMan 阅读(220) 评论(0) 推荐(0)

Agent 智能体开发框架选型指南

摘要: 转:https://mp.weixin.qq.com/s/0jB157hXY2AwIcji0jywBQ 编者按:本文通过作者的实践对比发现,框架的选择应基于项目具体需求和团队特点,而不是简单追求某个特定框架。不同框架各有优势: 无框架方案实施最为简单直接,代码结构清晰,适合理解智能体原理,但随着项目 阅读全文

posted @ 2025-02-21 11:19 ExplorerMan 阅读(744) 评论(0) 推荐(0)

2025年2月20日

2024年大模型多智能体workflow技术之Multi-Agent Debate,Acc-Debate,DebateTune,ChatEval,COEVOL,GroupDebate,CMD等

摘要: 最近看了一些关于agent debate相关的内容,觉得挺有意思的(跟我以前做的对比学习很像,可以认为是大模型推理阶段的生成式对比学习),所以就把我的理解分享出来,也欢迎大家的匹配指正。现有的debate(一种Agentic Workflow)策略分为3步,第一步就是对给定的问题生成解决方案,第二步 阅读全文

posted @ 2025-02-20 19:29 ExplorerMan 阅读(448) 评论(0) 推荐(0)

全网最全国内Agent平台深度测评:扣子、Dify、FastGPT,谁是你的Agent开发首选?

摘要: 上一篇文章我们按照时间先后顺序,梳理了国内的9个Agent开发平台,分别是Dify、FastGPT、文心智能体平台、千帆AppBuilder、智谱智能体中心、天工SkyAgents、扣子、讯飞星火智能体平台、腾讯元器。 面对繁多的Agent平台,到底该如何选择呢?那个最好用? 本篇就系统地做一个Ag 阅读全文

posted @ 2025-02-20 19:19 ExplorerMan 阅读(10170) 评论(1) 推荐(1)

RAG框架,都在这了!

摘要: RAG 很多人都听说过,或者实践过,目前最直接的应用就是构建智能问答系统。 什么是 RAG? RAG 是 Retrieval Augmented Generation 的简写,翻译过来就是检索增强生成。 从名字就可以拆分出 RAG 的三大部分,检索、增强、生成,表面意思就是: 1、去知识库检索相关的 阅读全文

posted @ 2025-02-20 17:27 ExplorerMan 阅读(3818) 评论(0) 推荐(2)

FastRAG半结构化RAG实现思路及OpenAI O1-long COT蒸馏路线思考

摘要: 本文看两个问题,一个是最近模仿openaiAI O1现有路线-long COT蒸馏路线,有些有趣的点。 另一个是还是回归到RAG上,最近同名的RAG框架很多,例如fastRAG(https://github.com/IntelLabs/fastRAG.git,朴素rag的一个模块化)和FastRAG 阅读全文

posted @ 2025-02-20 17:18 ExplorerMan 阅读(86) 评论(0) 推荐(0)

技术笔记-LLM的格式化输出和工具调用

摘要: 调用外部工具是Agent区别于LLM的最重要区别之一。为了调用外部工具,需要做的主要有两件事: 针对用户输入的要求,从工具池中选择合适的工具,当然也可以选择不调用工具。这里考察的是LLM的reasoning的能力,一般来说,越大的模型效果越好。 对于选择的工具,要传入正确的参数(包括格式和内容)。这 阅读全文

posted @ 2025-02-20 17:01 ExplorerMan 阅读(278) 评论(0) 推荐(0)

上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 234 下一页

导航