随笔分类 - 大模型开发
摘要:RAG 缓存方案专为高并发低延迟设计,分为两级拦截: 检索阶段缓存 (Retrieval Cache): 采用 L1 进程内存(精确 Hash 匹配)和 L2 向量索引(相似度匹配)。目标是吸收 70% 左右的重复或相似查询流量,将 L3 向量数据库的查询延迟从 $10-30\text{ms}$ 降
阅读全文
摘要:目录安全开发总结二、分模块核心要点速查表AI Agent 安全开发指南目录1. 输入验证与注入防护1.1 问题描述1.2 解决方案✅ 已实现的安全措施🔧 建议增强措施2. Prompt 注入防护2.1 问题描述2.2 解决方案✅ 已实现的安全措施🔧 建议实现措施3. 工具调用安全3.1 问题描述
阅读全文
摘要:目录背景和价值一、向量检索的局限性1. 语义相似 ≠ 精确匹配2. 关键词匹配能力弱3. 多条件组合查询困难二、具体问题对比场景 1:精确数值查询场景 2:多条件组合查询场景 3:专业术语/品牌名查询三、向量检索 vs ES 检索的对比四、项目中的实际案例五、为什么需要多路召回:数学原理向量检索的数
阅读全文
摘要:目录背景和价值Deerflow 源码函数分析一、函数基础信息1. 函数签名2. 依赖的核心对象二、核心逻辑拆解逐行代码逻辑分析三、关键设计细节1. 「顺序执行」的核心原则2. 「Planner」的兜底角色3. 状态驱动的路由4. 松耦合的角色设计四、潜在优化点1. 增加类型校验2. 枚举扩展的扩展性
阅读全文
摘要:目录背景和价值1. 源头分类与智能投放 (Smart Classification at Source)2. 产生量预测与内部物流优化 (Prediction & Internal Logistics)3. 源头减量与工艺优化 (Source Reduction / Prevention)4. 合规
阅读全文
摘要:目录背景和价值DeerFlow多智能体系统解析1. DeerFlow有哪些Agent,以及定义research_team-> continue_to_running_research_team 函数返回节点的判断逻辑2. Agent之间流转(流程图)及控制变量 背景和价值 DeerFlow多智能体系
阅读全文
摘要:目录背景和价值📅 智能分拣项目时间线预估阶段一:准备与数据基础 (0 - 3 个月)阶段二:核心功能原型开发 (3 - 6 个月)阶段三:优化、加速与稳定 (6 - 9 个月)阶段四:现场部署与业务交接 (9 - 12+ 个月)参考资料 背景和价值 这是一个高度依赖具体细节(如目标精度、物料复杂度
阅读全文
摘要:目录✅ 总体思路:2D 分割只能给“形状 + 轮廓”,抓取必须从 2D → 3D 映射1)从 2D 分割轮廓 → 找到有效抓取点(像素坐标)2)把像素坐标 → 转换到机械臂坐标系(世界坐标)✨ 一、步骤 1:在 2D 分割结果中生成抓取点常用算法 3 类:① 边缘中点抓取(适用于规则物体:易拉罐、瓶
阅读全文
摘要:目录背景和价值💻 智能分拣系统搭建:所需资源配置建议1. 开发平台与工具 (Software Stack)2. 人力资源配置 (Human Resources)3. 硬件资源配置 (Hardware Resources)A. 核心分拣站(单机)B. 模型训练/数据存储🎯 总结:CTO 的挑战与重
阅读全文
摘要:目录1. 优先选择 Dify 的场景2. 优先选择 LangGraph 或 LangChain 高代码开发的场景总结:核心决策依据参考资料 实际落地中,也可结合使用:例如用 Dify 快速搭建 MVP 验证需求,待业务稳定后, 将核心复杂逻辑用 LangChain 重写并集成到 Dify 中(Dif
阅读全文
摘要:目录背景和价值场景 1:使用 LLM Agent (ReAct)场景 3:RAG (检索增强生成)3. Workflow 详细步骤 (流程扭转与 ReAct 协作)参考资料 背景和价值 场景 1:使用 LLM Agent (ReAct) 用户查询: "我这个月要还多少钱?" 阶段 动作 目标/实现
阅读全文
摘要:目录数据标注 VS 数据标签化处理💡 总结与关系🎯 数据标签化的标准流程阶段一:准备与规范化 (Preparation & Specification)1. 定义项目目标2. 定义标签规范 (Label Taxonomy & Schema)3. 筛选和预处理数据阶段二:标签化执行 (Execut
阅读全文
摘要:目录数据层面的改进检索增强生成(RAG)提示工程优化强化学习与人类反馈多模型验证置信度校准事实核查层特定领域微调 在大模型开发中减少幻觉是一个核心挑战。以下是一些有效的策略: 数据层面的改进 高质量的训练数据是基础。确保训练数据的准确性、多样性和时效性,及时清理含有错误信息或矛盾内容的数据。在微调阶
阅读全文
摘要:目录背景和价值🤖 避免多Agent架构中总控Agent路由错误与回撤方案🎯 避免路由错误的策略↩️ 错误回撤与纠正方案如何让分类器输出一个置信度分数。如果置信度低于预设的阈值,做相关操作1. 🤖 基于大型语言模型(LLM)的分类器💡 实现方式:结构化输出与概率评估⚙️ 设置阈值:2. 🔢
阅读全文
摘要:目录QwQ优势(王爆 DeepSeek R1蒸馏模型组。) 模型评测。 QwQ 32B VS DeepSeek R1 从以下维度评测 问答 翻译 角色扮演 长文本编写 数学 编程 科研 逻辑推理 各方面指标略低于R1 QwQ优势(王爆 DeepSeek R1蒸馏模型组。) 幻觉不如 DeepSeek
阅读全文
摘要:目录背景和价值一、通义千问(Qwen)模型的分类体系1. Qwen(主系列) —— 通用大语言模型2. QWQ(推理专家系列) —— 专注数学与代码3. Qwen-Audio / Qwen-VL / Qwen2-VL —— 多模态系列4. Qwen-Max / Qwen-Plus / Qwen-Tu
阅读全文
摘要:目录背景和价值一、推理型智能体(绑定reasoning模型)二、基础型智能体(绑定basic模型)三、设计逻辑总结参考资料 背景和价值 以下是 deer-flow 的大模型配置如下链接 https://github.com/bytedance/deer-flow/blob/main/docs/con
阅读全文
摘要:目录概念准确率精确率召回率F1基准测试MLLU 综合知识评测HellaSwag详解:常识推理HumanEval详解:代码生成准确度评估GSM8K详解:数学推理TruthfulQA基准详解MT-Bench详解:对话能力中文基准:C-Eval和SuperCLUE测试评估的挑战:基准过拟合评估未来评测趋势
阅读全文
摘要:目录背景和价值一、功能与架构设计二、安全与合规能力三、技术支持与服务四、成本与扩展性五、适用场景总结参考资料 背景和价值 Dify 的社区版与企业版在功能完整性、技术支持、安全性和扩展性等方面存在显著差异,以下从核心维度进行对比解析: 一、功能与架构设计 社区版: 基础功能覆盖:支持 AI 工作流设
阅读全文
摘要:目录背景和价值参考资料 背景和价值 EvalScope的优势有如下几点: 内置多个业界认可的测试基准和评测指标:MMLU、CMMLU、C-Eval、GSM8K等。(附录中会介绍这些数据集的基本情况) 支持模型种类丰富,不仅仅支持常见的大语言模型的评测,还支持多模态模型、Embedding模型、Rer
阅读全文

浙公网安备 33010602011771号