会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
pDJJq
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
···
14
下一页
2025年7月9日
如何分析一个Agent系统
摘要: 如何分析一个Agent系统 我们可以认为Agent系统的最核心: (WHAT) Prompt, 要解决什么问题 (HOW) Tools/MCP, 用什么样的方式解决问题 (WHO) 工作流/Multi-Agent, 谁来解决问题 在此之外, 还有一些次核心的问题: Agent框架: 别他妈的用lan
阅读全文
posted @ 2025-07-09 17:17 pDJJq
阅读(32)
评论(0)
推荐(0)
2025年7月8日
程序员的AI工作流 v3
摘要: 程序员的AI工作流 v3 快一年过去了, 本文的前两篇: v1 v2已经显得有些过时了, 本文介绍在2025年中, 我的工作流 什么是编程效率 我始终认为编程效率这件事情的前提是: 准确 准确意味着: 你知道自己要完成什么 离完成还差什么 在2025年, 我们谈论编程效率时, 你必须提及AI. AI
阅读全文
posted @ 2025-07-08 23:44 pDJJq
阅读(352)
评论(0)
推荐(0)
S3 分片上传、ETag 与 CORS 深度解析
摘要: S3 分片上传、ETag 与 CORS 深度解析
阅读全文
posted @ 2025-07-08 18:26 pDJJq
阅读(130)
评论(0)
推荐(0)
LoRA是什么?
摘要: LoRA是什么? LoRA技术全景指南:从核心原理到前沿应用 摘要 LoRA (Low-Rank Adaptation) 是一种参数高效微调(Parameter-Efficient Fine-tuning, PEFT)技术,旨在以极低的计算和存储成本,对大型预训练模型(如LLM和文生图模型)进行特定
阅读全文
posted @ 2025-07-08 13:40 pDJJq
阅读(365)
评论(0)
推荐(0)
2025年7月7日
Trae-Agent源码剖析
摘要: Trae-Agent源码剖析 架构 ┌─────────────────────────────────────────┐ │ CLI Interface │ ├─────────────────────────────────────────┤ │ Agent Layer │ ├─────────
阅读全文
posted @ 2025-07-07 12:03 pDJJq
阅读(269)
评论(0)
推荐(0)
2025年6月30日
现代身份认证协议(By Gemini)
摘要: 身份认证协议(By Gemini) 第一部分:数字身份技术概览 在当今高度互联的数字世界中,安全地验证用户身份(认证)并确定其访问权限(授权)已成为所有数字系统的核心挑战 1。随着应用程序架构从传统的单体式、本地部署系统演变为分布式的、基于Web、移动和API驱动的服务,身份验证技术也经历了深刻的演
阅读全文
posted @ 2025-06-30 17:04 pDJJq
阅读(324)
评论(0)
推荐(0)
2025年6月17日
过程式AI与声明式AI(with Claude)
摘要: 本文探讨了过程式AI与声明式AI在产品设计和工程实现中的不同应用: 1. 产品层面: - 传统软件采用命令式交互(用户需逐步操作) - AI原生产品应追求声明式交互(用户只需表达意图) - 优秀AI产品特征:意图驱动、结果导向、自然表达 - 需平衡简洁与控制,保持"默认简单,可选复杂" 2. 工具层面: - 专业工具(如Blender)需要保留过程控制 - AI工具不应完全消解工具属性,原因包括: * 精确定制需求 * 创造过程的探索性 * 专业知识传承 * 责任可解释性 * 当前AI的局限性 3. 工程实现: - 必须保持过程透明 - 核心要求:精确性、可验证性、可复现性 - 过程式方法更适合工程场景 结论:产品设计应向声明式发展提升易用性,但工程实现和专业工具仍需保留过程式控制以确保质量和可靠性。
阅读全文
posted @ 2025-06-17 13:26 pDJJq
阅读(278)
评论(0)
推荐(0)
0-1之后呢?
摘要: 本文系统阐述了从0到1验证产品后,如何构建健壮可扩展系统的关键要点。核心内容包括:1)高可用与可扩展性方案(负载均衡、无状态服务、数据库分库分表、缓存及消息队列);2)可观测性体系建设(集中化日志、指标监控告警、分布式追踪);3)安全防护措施(数据加密、防注入攻击、权限管理);4)自动化工程实践(CI/CD流水线、基础设施即代码)。全文旨在帮助开发者实现从初创验证期到规模化运营的系统架构升级,强调通过技术手段保障系统稳定性、安全性和可维护性。
阅读全文
posted @ 2025-06-17 01:06 pDJJq
阅读(268)
评论(0)
推荐(0)
现代网站的安全防护体系(by Gemini DeepResearch)
摘要: 现代网站的安全防护体系(by Gemini DeepResearch) 在当今的数字化环境中,网络攻击的工具化和商品化趋势日益显著,攻击手段正从传统的网络层向更复杂的应用层和业务逻辑层转移。任何依赖于在线服务的组织都面临着持续且不断演变的威胁,这些威胁不仅影响服务的可用性,更直接威胁到数据资产、商业
阅读全文
posted @ 2025-06-17 00:58 pDJJq
阅读(108)
评论(0)
推荐(0)
2025年6月7日
Embedding与Rerank
摘要: 这篇文章探讨了Embedding与Rerank在RAG系统中的关键作用: 1. **Embedding**(语义召回阶段) - 功能:将文本转化为稠密向量,实现语义相似度搜索 - 特点:速度快、覆盖广(高召回率),支持毫秒级海量检索 - 流程:先离线建立向量索引,再在线查询匹配Top-K结果 2. **Rerank**(精排阶段) - 功能:对初筛结果进行精准重排序 - 特点:计算慢但精度高(高准确率),采用交叉编码分析query-document关系 - 价值:过滤噪声文档,提升LLM输入质量 3. **参数区别** - TopK:控制召回阶段的候选量(较大值,如50) - TopN:决定最终输入LLM的文档数(较小值,如3) 4. **评估标准** - 通过MTEB等基准测试衡量模型能力 - 关键指标:检索准确率(Hit Rate)、排序质量(NDCG) - 开源模型(如Qwen/BGE)已接近商业模型性能 文章通过对比分析,阐明了两个技术环节的协同关系:Embedding确保"不遗漏",Rerank实现"精准投喂"。
阅读全文
posted @ 2025-06-07 01:18 pDJJq
阅读(615)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
···
14
下一页
公告