摘要: 1. LLMOps 工程师(最契合方向) 这是目前AI行业最缺的岗位之一。传统运维关注的是服务稳定性,而LLMOps关注的是模型生命周期管理。 你的优势: 你懂如何部署、扩容、监控,现在加上你懂RAG和智能体,你完全能够处理大模型的服务治理。 进阶路径: 深度掌握: vLLM, Text Gener 阅读全文
posted @ 2026-03-20 15:38 lavida2000 阅读(2) 评论(0) 推荐(0)
摘要: 一、 核心研发类(Building the AI) 这是AI行业的技术核心,负责从算法到系统的落地。 算法工程师 (Algorithm Engineer) 细分方向: NLP(自然语言处理)、CV(计算机视觉)、推荐系统、语音识别(ASR/TTS)、强化学习。 核心工作: 改进模型架构、模型训练、微 阅读全文
posted @ 2026-03-20 15:25 lavida2000 阅读(12) 评论(0) 推荐(0)
摘要: wget http://dl.minio.org.cn/client/mc/release/linux-amd64/mc mc alias set <别名> <MinIO服务器URL> <ACCESS_KEY> <SECRET_KEY> 配mc 连接 minio的地址 mc ls minio-ser 阅读全文
posted @ 2026-03-16 11:18 lavida2000 阅读(2) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2026-03-16 10:25 lavida2000 阅读(3) 评论(0) 推荐(0)
摘要: “召回(Recall/召回阶段)”指从海量内容库中快速找出一批可能相关的候选集合,交给后续的排序/重排模型再精细挑选。 重排: 召回 是初选阶段,重全而不重精 阅读全文
posted @ 2026-03-11 13:48 lavida2000 阅读(1) 评论(0) 推荐(0)
摘要: 1, devops 工具,平台 : 加快开发,部署,测试 进度 2, 部署, 监控,日志,APM : 业务落地,保障生产 3, 容量规划,安全措施,环境评估,高可用,备份 : 清除风险 4, 阅读全文
posted @ 2026-03-05 11:31 lavida2000 阅读(2) 评论(0) 推荐(0)
摘要: [Service]Type=notifyWorkingDirectory=/var/lib/etcdExecStart=/opt/kube/bin/etcd \ --name=etcd-192.168.2.159 \ --cert-file=/etc/kubernetes/ssl/etcd.pem 阅读全文
posted @ 2026-02-04 09:38 lavida2000 阅读(2) 评论(0) 推荐(0)
摘要: https://smithery.ai/ 大模型本身无法和外界工具直接进行通信, 定义一个外部函数作为中介,一边传递大模型的请求,一边调用外部工具 1,把外部工具转换成mcp-server的工具 MCP-Server集成了js/python开发的程序、服务; 阅读全文
posted @ 2026-01-27 10:26 lavida2000 阅读(2) 评论(0) 推荐(0)
摘要: ArgoRollouts的控制器 理解为取代 deployment的控制器 Blue-Green 适合 有状态应用 Canary 适合 无状态应用 阅读全文
posted @ 2026-01-23 09:41 lavida2000 阅读(3) 评论(0) 推荐(0)
摘要: 要在 Kubernetes 上对一个 **7×24 在线**系统做**灰度发布**,核心是把“新版本流量占比、发布节奏、回滚手段”全部自动化并可观测化;但你当前问题缺少可引用的上下文细节(例如是否使用 Service Mesh/Ingress、是否允许多版本并存、是否有统一网关、SLO/指标体系等) 阅读全文
posted @ 2026-01-21 14:06 lavida2000 阅读(18) 评论(0) 推荐(0)