摘要: 公司业务跑在三个地方:阿里云、腾讯云、自建机房。网络不通,数据同步靠人肉,运维要崩溃了。这篇分享我把三朵云打通的完整过程。 一、背景:多云的痛 我们公司的架构演变: 最早:全在阿里云 后来:核心业务迁到自建机房(省成本) 再后来:灾备放腾讯云(鸡蛋不放一个篮子) 结果就是: 阿里云ECS(北京) ↓ 阅读全文
posted @ 2025-12-03 16:03 花宝宝 阅读(48) 评论(0) 推荐(0)
摘要: 改一行代码,要启动8个服务才能调试?本地电脑16G内存,开到第5个服务就开始卡了。这篇分享我是怎么解决微服务本地开发调试问题的。 一、微服务开发的痛 1.1 场景还原 假设你在开发订单服务,依赖关系是这样的: 订单服务 → 用户服务 → 用户数据库 ↓ 商品服务 → 商品数据库 ↓ 支付服务 → 支 阅读全文
posted @ 2025-12-03 14:44 花宝宝 阅读(58) 评论(0) 推荐(0)
摘要: 以前每次上线都是:打包→上传→部署→测试,一套流程下来半小时。现在代码一推,自动构建、自动测试、自动部署,喝杯咖啡的功夫就上线了。 一、为什么要搞CI/CD? 先说说我们之前的"人肉部署"流程: 开发写完代码,提交Git 运维拉代码到本地 mvn clean package 打包 scp上传到服务器 阅读全文
posted @ 2025-12-03 12:48 花宝宝 阅读(64) 评论(0) 推荐(0)
摘要: 以前查日志:SSH登录服务器,grep、tail、awk轮番上阵,10台服务器查一圈下来半小时过去了。现在:打开Kibana,输入关键词,所有服务器的日志一秒出结果。 一、为什么需要ELK? 先说说我们之前的"原始"日志管理: # 服务器1 ssh root@192.168.1.10 tail -f 阅读全文
posted @ 2025-12-03 09:33 花宝宝 阅读(355) 评论(1) 推荐(1)
摘要: 手动SSH登录100台服务器改配置?我试过,改到第30台的时候已经不知道哪些改过了。这篇文章分享我用Ansible实现批量管理的完整过程。 背景:运维的噩梦 去年公司扩张,服务器从10台涨到100+台。以前的运维方式: # 登录服务器1 ssh root@192.168.1.1 vim /etc/n 阅读全文
posted @ 2025-12-03 09:26 花宝宝 阅读(47) 评论(0) 推荐(0)