摘要: 阅读全文
posted @ 2026-04-24 13:59 六小扛把子 阅读(5) 评论(0) 推荐(0)
摘要: 如果将大模型本身比作为桀骜不驯的野马, 那Harness就是一块优秀的马鞍。 Agent = 模型 + Harness 围绕着模型搭建的规则,工具,流程,检查机制都是Harness的范畴 (除了大模型,其他的都是Harness) Harness五大设计 1.上下文架构,了解项目背景和规则 用法:AG 阅读全文
posted @ 2026-04-16 14:59 六小扛把子 阅读(14) 评论(0) 推荐(0)
摘要: RAG—检索增强生成 先从外部知识库中检索(Retrieval) 出和用户问题相关的资料 把检索到的资料作为增强(Augmented) 上下文,和用户的问题一起给到大模型 大模型基于这些真实的资料来生成(Generation) 回答 让大模型基于真实、可更新的知识来回答问题的技术方案。它和微调、Pr 阅读全文
posted @ 2026-04-15 22:08 六小扛把子 阅读(10) 评论(0) 推荐(0)
摘要: 流量指标 系统日活 系统支持最大qps 节点cpu使用率 内存占用率 接口平均响应时间 接口错误率 机器配置 性能瓶颈分析 1.代理层 出现问题:响应大量502、504 造成原因:连接数超过最大限制 解决方案: 代理层做限流,熔断 2.应用层 出现问题:接口响应慢甚至超时;cpu打满,内存打满;系统 阅读全文
posted @ 2026-04-13 10:06 六小扛把子 阅读(4) 评论(0) 推荐(0)
摘要: Claude Code核心流程 一句话: 循环不停地调工具——读文件、改代码、跑终端命令——每次工具跑完,把结果塞回对话历史,Claude 再看结果决定下一步干什么。 就这么一直转,转到任务完成,或者触发终止条件为止。 Claude Code一些设计细节 1.系统级提示词构建 (非用户输入的提示词) 阅读全文
posted @ 2026-04-02 11:29 六小扛把子 阅读(5) 评论(0) 推荐(0)
摘要: 大模型应用设计就是将 LLM 作为核心大脑,通过 RAG 获取知识,通过 Tools 执行动作,由 Agent 进行自主决策,并用 Workflow 编排复杂流程。 Agent如何处理用户一次请求 1. 请求接收与解析 功能:接收用户输入(文本、语音、文件等),进行格式标准化 操作: 如果是语音,转 阅读全文
posted @ 2026-03-27 11:25 六小扛把子 阅读(4) 评论(0) 推荐(0)
摘要: 什么是LLM? Large Langurage Model 大语言模型,一问一答的形式 什么是Agent? 以LLM大模型为大脑,负责执行动作的智能体 可以规划任务,使用工具,记忆能力,循环思考 1.规划任务 由LLM将复杂任务拆解多个步骤执行。 拆解后需考虑步骤间的依赖关系和动态调整——若某步失败 阅读全文
posted @ 2026-03-10 10:37 六小扛把子 阅读(9) 评论(0) 推荐(0)
摘要: DDD—领域驱动模型 将代码深度与业务绑定 1.简单概括 传统开发:对着需求文档写代码,数据库怎么设计代码怎么写,业务逻辑分散在controller,service,util,实体类只用作数据的载体(贫血模型) DDD:拉着业务画领域模型,业务规则被封装在领域实体的内部,业务怎么变,实体的代码怎么调 阅读全文
posted @ 2025-04-10 09:48 六小扛把子 阅读(55) 评论(0) 推荐(0)
摘要: 事务的基本特性 A原子性:一系列操作为一个原子,都成功或都撤销 I隔离性:不同操作之间读写数据相互独立,不会彼此影响 D持久性:成功提交的数据都会被持久化,不会丢失 C一致性:一致性为最终目的,所有事物处理最终的数据状态保持一致 内部一致性:单数据源有确定并发事务的读写顺序 外部一致性:多个不同数据 阅读全文
posted @ 2024-06-20 16:10 六小扛把子 阅读(49) 评论(0) 推荐(0)
摘要: 一.RPC源头与演进 1.进程之间通信方式 管道 Pipe : 两个进程之间传递少量字符流,字节流 ps -ef | grep java 信号 Signal:信号用于通知目标进程 kill -9 pid 信号量 Semaphore:两个进程之间的同步机制 wait() notify() 消息队列 M 阅读全文
posted @ 2024-05-16 16:23 六小扛把子 阅读(33) 评论(0) 推荐(0)