随笔分类 - 大模型开发
摘要:目录1 速度2 准确性体验成本可靠性汇报演示参考资料 1 速度 多Agent窜行处理,改成并行处理 显而易见的问题,能否直接给结果,不需要深度思考,否则用户等待时间较长 RAG缓存。 使用开源的GTPCache。 其他Cache? 不同的场景使用不同参数量的大模型 2 准确性 RAG的准确率。涉及到
阅读全文
摘要:目录背景和价值一、核心功能与技术特性1. 全场景网页抓取能力2. 智能数据提取与结构化输出3. 企业级集成与扩展能力二、核心价值与应用场景1. 大模型训练数据生产2. 检索增强生成(RAG)支持3. 企业自动化流程三、技术架构与性能优势1. 混合爬虫引擎2. 安全与合规设计四、与传统爬虫工具的对比五
阅读全文
摘要:目录RAG语义缓存参考资料 价值:提升效率,减少一个LLM处理,节约成本。 为什么是RAG的语义缓存? 如果直接针对用户的query,因为不同的人的权限不同,可能缓存的结果不对。跟传统业务架构一样,缓存一般是在存储层之上。 RAG语义缓存 向量库1:存储的是入Redis缓存的问题(query) Re
阅读全文
摘要:目录背景提示词参考资料 背景 大语言模型的输出有时候会出现幻觉,比如胡说八大,出现错别字等。需要通过后验证器做二次校验。 1 规则:针对结构化的数据 2 模型,针对文本等 提示词 https://medium.com/data-science-collective/youre-using-chatg
阅读全文
摘要:目录背景参考资料 背景 Romote MCPServer 1 公司内,自己搭建。 2 外部的有:火山引擎 MCP 平台,华为云 ModelArts Studio 等 参考资料 https://mp.weixin.qq.com/s?__biz=MzIzODIzNzE0NQ==&mid=26544538
阅读全文
摘要:目录背景和价值切片策略一、基于长度的传统切片1. 固定Token数量切片2. 递归字符分割二、语义感知切片策略1. 语义相似性分块器2. 层次语义分割三、基于元数据的智能切片1. 自动标题提取2. 实体感知切分四、高级混合策略1. 动态滑动窗口2. 查询感知切分五、对比与最佳实践六、自定义扩展七、性
阅读全文
摘要:目录一、功能定位对比二、版本管理机制对比三、适用场景推荐1. 推荐使用 conda 的场景2. 推荐使用 pyenv 的场景四、性能与生态对比五、总结:如何选择?命令对比一、核心功能差异二、版本管理命令对比1. Conda2. Pyenv三、环境管理对比1. Conda(自带环境隔离)2. Pyen
阅读全文
摘要:目录背景和价值一、核心技术实现方案1. 基于规则引擎(Rule-Based System)的审查2. 基于机器学习(ML)的智能审查3. 基于知识图谱(Knowledge Graph)的语义推理大模型4. 混合技术方案(规则+ML+知识图谱)二、技术方案对比与选型建议三、关键技术挑战与解决方案四、总
阅读全文
摘要:目录背景和价值参考资料 背景和价值 如:用户问感冒药有哪些副作用? 用传递向量库是解决不了问题的。如果用向量库只能检索到 有感冒药的关键字才能查询出来。比如白加黑等各种感冒药就查询不出来。 1 传统向量数据库检索 2 从知识图谱检索出子图生成文档 或者从知识图谱检索到具体的感冒药,再从向量库存检索对
阅读全文
摘要:目录背景和价值一、协议概述二、核心架构三、通信机制1. 协议规范2. 传输层3. 生命周期管理四、安全设计六、开发规范运行模式STUDIOSSE参考资料 背景和价值 以下是对 大模型 MCP 官方协议 的核心解析,综合多篇文档信息整理: 一、协议概述 MCP(Model Context Protoc
阅读全文
摘要:目录为什么文本需要向量化关键词匹配无法满足精准搜索的需求,使用语义检索工程优化:高效检索与存储为什么要切片?切片有什么要求?文本经过BGE-M3 embeding后是什么?张量(float)*向量的维度相似度匹配的对象是向量而非原始文本?向量化的基本单位是完整文本相似度匹配的对象是向量而非原始文本召
阅读全文
摘要:目录背景BGE-M3 介绍一、核心功能二、技术亮点三、应用场景四、与其他模型的对比五、使用建议参考资料 背景 向量数据库召回的准确度受2方面影响 1 切片方式 2 embeding算法 BGE-M3 介绍 BGE-M3 是北京智源人工智能研究院(BAAI)开发的多功能文本嵌入模型,其核心功能是通过多
阅读全文
摘要:目录背景和价值一、合合信息TextIn MCP Server(首推方案)二、配套工具生态三、服务获取方式参考资料 背景和价值 根据2025年最新的技术动态,推荐以下支持图片OCR解析的MCP Server解决方案: 一、合合信息TextIn MCP Server(首推方案) 核心能力: 多格式高精度
阅读全文
摘要:Spring AI Alibaba JAVA Deep Research 字节跳动开源了一款项目 https://mp.weixin.qq.com/s/ejE6bfR_lFQutPy-u_pzmQ Python
阅读全文
摘要:目录背景参考资料 背景 我是一个销售智能体, 用户输入某个产品,打错字了,比如 香奈儿口红,输成 香赖儿口红 1 使用用户的输入去向量库查询,取top3,如果都一样,那么就取向量库的数据作为输入 2 如果向量库top3返回的结果不一样,就取top3 公共的字符串,去ES做模糊查询。 如果ES模糊的结
阅读全文
摘要:目录 图RAG https://github.com/liweiphys/layra/blob/main/README_zh.md#-为什么选择-layra
阅读全文
摘要:背景 销售助手,或者叫智能报价助手,用户是销售人员,给客户推荐合适的产品。 销售的产品五花八门,有体检套餐,排污检测项目,等等。销售人员希望智能体足够灵活,能够智能给与推荐适合销售的产品。 思路:销售人员往智能体输入的东西是五花八门,是变化的。Agent就像一个多行业娴熟的销售人员,他能根据他的经验
阅读全文
摘要:目录背景固定chunk_size,上下文重叠(5%-10%)语义切片文本切片与嵌入生成流程关键参数说明完整 DEMO 示例相关实践建议参考资料 背景 固定chunk_size,上下文重叠(5%-10%) text_splitter = SentenceSplitter( chunk_size=400
阅读全文

浙公网安备 33010602011771号