2026年5月23日

AI写的代码上了生产,炸了算谁的?

摘要: AI写的代码上了生产,炸了算谁的? 上周三晚上11点,我手机震了。运维群弹了条消息:"支付回调接口502,影响范围:全量用户。" 我打开Grafana,错误率从0.3%飙到47%。翻了下最近的提交记录——3小时前,一个AI Agent自动提的PR,review没拦住,合进了main分支。 改动很小: 阅读全文

posted @ 2026-05-23 09:00 明.Sir 阅读(3) 评论(0) 推荐(0)

2026年5月22日

Vibecoding写了3天代码,上线1小时就炸了——5个血泪教训

摘要: Vibecoding写了3天代码,上线1小时就炸了——5个血泪教训 上周三下午,我用Claude Code vibecoding了一个内部工具——需求管理看板,类似简化版Linear。3天时间,从零到能跑的全栈应用,React前端+FastAPI后端+PostgreSQL。本地demo效果炸裂,同事 阅读全文

posted @ 2026-05-22 09:01 明.Sir 阅读(4) 评论(0) 推荐(0)

2026年5月21日

Claude Code 干了我三天的活,Codex 半小时翻车——两个AI编码CLI的真刀真枪对比

摘要: Claude Code 干了我三天的活,Codex 半小时翻车——两个AI编码CLI的真刀真枪对比 上周五下午四点,产品经理甩过来一个需求:把旧项目的Express路由全部迁移到FastAPI,37个接口,带参数校验和Swagger文档。我看了眼代码仓库,800多个文件,光路由定义就散落在14个文件 阅读全文

posted @ 2026-05-21 09:01 明.Sir 阅读(11) 评论(0) 推荐(0)

2026年5月20日

Code Agent不听话?一个文件让它乖乖按你的规矩来

摘要: Code Agent不听话?一个文件让它乖乖按你的规矩来 上周五下午4点,我让Claude Code给一个Python项目加个用户导出功能。它5分钟写完了,跑起来也没毛病。但我一看代码——全裸的except: pass,密钥直接硬编码在config.py里,日志一行没写。 我花20分钟把这些毛病改完 阅读全文

posted @ 2026-05-20 09:00 明.Sir 阅读(11) 评论(0) 推荐(0)

2026年5月19日

别让你的Agent API裸奔——FastAPI鉴权+沙箱隔离实战

摘要: 别让你的Agent API裸奔——FastAPI鉴权+沙箱隔离实战 上周五晚上11点,我正在改一个Agent的Tool调用逻辑,突然收到告警:有个外部IP在疯狂调我们的Agent接口,每次请求都在尝试注入system prompt。一看日志,好家伙,10分钟内打了800多次请求,全是curl直接裸调 阅读全文

posted @ 2026-05-19 09:00 明.Sir 阅读(8) 评论(0) 推荐(0)

2026年5月18日

加了type hints之后,我从线上捞回来3个真实Bug

摘要: 加了type hints之后,我从线上捞回来3个真实Bug 上周五下午4点半,我正在收拾东西准备下班,监控告警响了。用户反馈订单金额算错了,某些订单的折扣金额变成了负数。 翻了半天代码,定位到一个函数: def calc_discount(price, rate, vip_level): base 阅读全文

posted @ 2026-05-18 09:01 明.Sir 阅读(4) 评论(0) 推荐(0)

2026年5月17日

Vibe Coding 三天后,我把项目重写了一遍

摘要: Vibe Coding 三天后,我把项目重写了一遍 上周四下午,我打开 Cursor,跟自己说:今天不写代码,只"说话"。 起因很简单。团队在做一个内部数据看板,需求不复杂——从 PostgreSQL 拉数据,跑几个聚合查询,前端用 ECharts 展示。按正常节奏,前后端加起来大概5天。但我看到有 阅读全文

posted @ 2026-05-17 09:00 明.Sir 阅读(12) 评论(0) 推荐(0)

2026年5月16日

一次 Druid 连接池引发的 OOM:从报警到根因,2 小时排查全过程

摘要: 一次 Druid 连接池引发的 OOM:从报警到根因,2 小时排查全过程 上周三凌晨 1:47,手机震动把我震醒。Grafana 告警:某 Java 服务堆内存占用 98%,GC 频率飙到每分钟 40+ 次。 打开日志一看,java.lang.OutOfMemoryError: Java heap 阅读全文

posted @ 2026-05-16 09:00 明.Sir 阅读(19) 评论(0) 推荐(0)

2026年5月15日

记一次Agent请求超时翻车:FastAPI异步任务救了我一命

摘要: 记一次Agent请求超时翻车:FastAPI异步任务救了我一命 上周三晚上10点,我盯着监控面板,P99延迟飙到47秒。 原因很简单——我们的AI Agent服务跑在FastAPI上,一个用户发了个复杂指令,Claude Code在后台跑了35秒才出结果。这35秒里,前端那个请求就一直卡着,连接池被 阅读全文

posted @ 2026-05-15 09:00 明.Sir 阅读(6) 评论(0) 推荐(0)

2026年5月14日

Agent的上下文不是你的:一个AI框架开发者的内存管理血泪史

摘要: Agent的上下文不是你的:一个AI框架开发者的内存管理血泪史 上周五下午5点,我们的Agent在处理一个长对话时突然"失忆"了。用户问它"刚才那个方案改好了吗",它回了一句"请问您指的是哪个方案?"。排查了半小时,发现不是模型的问题,是上下文窗口溢出后,早期的对话被静默截断了。 这个bug让我重新 阅读全文

posted @ 2026-05-14 09:00 明.Sir 阅读(18) 评论(0) 推荐(0)

2026年5月13日

用Python 30行代码搞定博客园自动发帖,再也不用手动复制粘贴了

摘要: 用Python 30行代码搞定博客园自动发帖,再也不用手动复制粘贴了 上周五下班前,老板丢了一句:"咱们技术博客得保持日更,你负责。" 我当时想,不就是复制粘贴嘛,能有多难? 结果第二天我就被打脸了——登录博客园、切Markdown模式、粘贴内容、调格式、预览、发布、复制链接发群里……一套操作下来, 阅读全文

posted @ 2026-05-13 14:04 明.Sir 阅读(11) 评论(0) 推荐(0)

2026年5月12日

为什么你的代码总出 bug?六个铁律让我不再熬夜修线上故障

摘要: 为什么你的代码总出 bug?六个铁律让我不再熬夜修线上故障 凌晨两点,手机震了一下。告警群里冒出一条消息:「用户接口 500 错误,影响 23% 请求」。我打开日志,看到一行 AttributeError: 'NoneType' object has no attribute 'get'。 这个字段 阅读全文

posted @ 2026-05-12 09:01 明.Sir 阅读(6) 评论(0) 推荐(0)

2026年5月11日

你的FastAPI接口又收到了"垃圾数据"?试试这套Pydantic校验方案

摘要: 你的FastAPI接口又收到了"垃圾数据"?试试这套Pydantic校验方案 你有没有遇到过这种情况:前端接口调了半天没问题,一到线上环境,数据库里突然冒出一堆格式诡异的数据?手机号存成了"哈哈哈哈",邮箱字段塞了个日期,年龄写成了负数。你回头查日志,发现后端根本没校验,直接把脏数据塞进了数据库。 阅读全文

posted @ 2026-05-11 09:00 明.Sir 阅读(4) 评论(0) 推荐(0)

2026年5月10日

多Agent通信模式实战:从"消息风暴"到有序协作的蜕变

摘要: 多Agent通信模式实战:从"消息风暴"到有序协作的蜕变 本文由虾厂AI技术部出品 | 公众号:虾皮技术社 关注我们,获取更多AI工程化实战经验 当你的第3个Agent上线后 凌晨两点,我盯着屏幕上的日志流,消息像瀑布一样倾泻而下。三个Agent同时在线,A发了一条消息,B接住后回复,C看到了也要回 阅读全文

posted @ 2026-05-10 09:00 明.Sir 阅读(6) 评论(0) 推荐(0)

2026年5月9日

Celery异步任务队列实战:让Flask不再卡死

摘要: Celery异步任务队列实战:让Flask不再卡死 痛点场景 上周线上出了一次事故:用户上传一个50MB的CSV文件,后端要做数据清洗+入库。结果?页面转菊花转了30秒,最后Nginx直接返回504超时。更惨的是,这个请求占住了整个Gunicorn worker,其他用户的正常请求全被堵住了。 这就 阅读全文

posted @ 2026-05-09 09:00 明.Sir 阅读(5) 评论(0) 推荐(0)

2026年5月8日

Linux服务器磁盘空间排查与清理实战

摘要: Linux服务器磁盘空间排查与清理实战 凌晨3点,手机震了一下。 [PROD-web-01] 磁盘使用率 95%,阈值 85% 不是测试环境,是生产机。 披上外套打开电脑,ssh 上去第一件事—— 第一步:df 看全局 $ df -h Filesystem Size Used Avail Use% 阅读全文

posted @ 2026-05-08 09:00 明.Sir 阅读(9) 评论(0) 推荐(0)

2026年5月7日

当一个写满自动化测试的系统,反而因为测试本身出了 Bug

摘要: 当一个写满自动化测试的系统,反而因为测试本身出了 Bug 周五下午四点半,电话来了 "老王,生产环境崩了,用户上传的多模态 Agent 任务全部返回空结果。" 我打开 Dashboard,一眼就看到了——CI/CD 流水线上所有的绿色 ✅ 整整齐齐地挂着,523 个测试用例全部通过。问题是,那些绿灯 阅读全文

posted @ 2026-05-07 09:54 明.Sir 阅读(11) 评论(0) 推荐(0)

2026年5月6日

多Agent系统踩坑实录:我们是怎么让一群AI"虾兵蟹将"协同干活的

摘要: 多Agent系统踩坑实录:我们是怎么让一群AI"虾兵蟹将"协同干活的 上周三凌晨两点,阿总(我们的CEO Bot)发现了一个Bug——准确说,是用户反馈了一个问题,系统自检没查出来。 正常流程嘛,排查、定位、修复、测试、部署,一个人干少说得半天。但我们这套多Agent系统干了件很刺激的事:阿总直接调 阅读全文

posted @ 2026-05-06 09:00 明.Sir 阅读(13) 评论(0) 推荐(0)

2026年5月5日

Python项目安全扫描避坑指南:从pip-audit到bandit,上线前少跑三趟安全组

摘要: Python项目安全扫描避坑指南:从pip-audit到bandit,上线前少跑三趟安全组 上周三下午四点,我盯着安全组发来的第三封"整改通知",脑子里只有一个念头:早知道这样,我就该在提测之前把依赖扫一遍。 事情是这样的。我们的Python后端项目要上线,安全评审环节被打了三次回来。第一次是因为一 阅读全文

posted @ 2026-05-05 09:00 明.Sir 阅读(14) 评论(0) 推荐(0)

2026年5月4日

多Bot协作项目的Docker容器化部署实战——从开发到上线踩过的坑

摘要: 多Bot协作项目的Docker容器化部署实战——从开发到上线踩过的坑 凌晨三点,我被钉钉消息炸醒。 CEO Bot的监控告警显示:整个多Bot协作系统的消息响应延迟从200ms飙升到12秒。运维Bot自己也挂了——因为它也在同一个容器里,被连带一起干掉了。 我坐起来打开电脑,盯着那堆互相依赖、互相埋 阅读全文

posted @ 2026-05-04 09:01 明.Sir 阅读(9) 评论(0) 推荐(0)

导航