会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
有态度马甲-- 精益码农
只做原创,专注于架构,开源,微服务,分布式等领域的技术研究和分享。 知其然更知其所以然,不做眼高手低的【高手】
博客园
首页
新随笔
联系
管理
2026年1月23日
还有比ollama更傻瓜式的大模型本地部署方式吗 ?
摘要: LLM的狂风已经吹了几年, 所有人都耳濡目染的会飚上几句行话/名词。切好你自己有台4070的机器,恰好你有时间倒腾, 那就让我们回顾一遍名词,验证狂风吹过的技术车辙。 恰好最近有台4070(12g显存)机器,于是尝试使用ollama部署大模型。 RTX 4070 擅长训练中小型模型;凭借其 184
阅读全文
posted @ 2026-01-23 09:08 码甲哥不卷
阅读(486)
评论(1)
推荐(1)
2026年1月22日
🔎我不允许谁还分不清这三种watch机制的区别
摘要: 今天快速介绍目前市场面常见的三个watch机制的实现。 1.chunked transfer encoding k8s控制面几个组件,核心枢纽是apiserver, 除etcd之外,其他组件都通过restful进行http通信。 上文提到的informer机制是controller的标准范式, 目的
阅读全文
posted @ 2026-01-22 09:28 码甲哥不卷
阅读(144)
评论(0)
推荐(0)
2026年1月8日
云原生AI算力平台的架构解读
摘要: 给近半年做的云原生AI算力平台做一个回顾, 思考和实践参考了云溪大会上的分享:为大模型工程提效,基于阿里云 ACK 的云原生 AI 工程化实践,全文很长,我这边做一个牵引和解读。 1. 云计算迎来“智算”时代 云计算是一种通过互联网的方式按需提供计算资源(如服务器、存储、数据库、网络、软件等)的服务
阅读全文
posted @ 2026-01-08 18:41 码甲哥不卷
阅读(156)
评论(0)
推荐(0)
2025年12月23日
🚀糟糕,我实现的k8s informer好像是依托答辩
摘要: 💡 糟糕,k8s informer我好像拉一坨大的 近段时间在做云原生AI算力平台,之前提到使用k8s informer机制管控多渠道提交的训练任务。 上面第4点: informer会监听通过cli和网页portal提交的job, 回显到portal平台,并在job发生状态变更时通知用户。 1.
阅读全文
posted @ 2025-12-23 17:12 码甲哥不卷
阅读(162)
评论(0)
推荐(0)
2025年12月15日
🎉在k8s调度的花园里面挖呀挖
摘要: 上文使用koordinator演示gang-scheduling和binpack调度, 已经生效。 4个2卡Pod龟缩在一个节点,另外一个2卡Pod被挤到另外一个节点(每节点上虚拟gpu:8卡)。 此时我们再尝试申请8卡作业,pod会Pending状态。但一旦节点有资源,pod就会自动进入Runni
阅读全文
posted @ 2025-12-15 10:29 码甲哥不卷
阅读(185)
评论(0)
推荐(0)
2025年12月6日
🎉卷不过AI算法, AI工程化或许是一个出路
摘要: AI时代。算法和算力和数据是三大关键要素,用算法基于算力训练数据、产生AI大模型, 模型在推理的时候会迸发智能。 35+的传统程序员或许已经卷不赢 初出象牙塔的萌新码农,或许将这三者结合,形成工程化会是现阶段大龄码农的某条出路。 有关AI工程化,我最近在做一个企业级项目【云原生AI算力平台】, 基于
阅读全文
posted @ 2025-12-06 10:08 码甲哥不卷
阅读(215)
评论(0)
推荐(0)
2025年11月20日
我是新来的,我需要知道这些吗?网关上的限流器
摘要: 1. nginx原生限流能力 ngx_http_limit_req_module 提供的请求限流能力必须基于某个预定义的key,eg: client Ip, request_uri, host_name, 这个限流器是基于漏桶算法。 limit_req_zone $binary_remote_add
阅读全文
posted @ 2025-11-20 22:08 码甲哥不卷
阅读(168)
评论(0)
推荐(0)
2025年11月19日
新来的外包,在大群分享了它的限流算法的实现
摘要: 1. 令牌桶按用户维度限流 前文golang/x/time/rate演示了基于整体请求速率的令牌桶限流; 那基于用户id、ip、apikey请求速率的限流(更贴近生产的需求), 阁下又该如何应对? 那这个问题就从全局速率变成了按照用户维度(group by userid)来做限流,那么 早先的全局的
阅读全文
posted @ 2025-11-19 22:08 码甲哥不卷
阅读(488)
评论(0)
推荐(0)
2025年11月3日
新来的外包,限流算法用的这么6
摘要: CloudFlare介绍限速的文章, 讲述了限速的使用场景和运作方式。 最难的是构建一个既高效又匹配需求的算法。 1.流行的限速器 ① 固定窗口限速 Fixed Window Counter 跟踪固定时间间隔(如 1 分钟)内的请求数量,一旦达到上限,就会拒绝该窗口中的后续所有请求。 UserCas
阅读全文
posted @ 2025-11-03 16:32 码甲哥不卷
阅读(409)
评论(1)
推荐(0)
2025年10月26日
面试总被追问k8s调度器工作原理, 收藏 == 学废
摘要: kube-scheduler负责将k8s pod调度到worker节点上。 当你部署pod时,在manifest文件pod规格上会指定cpu、memory、亲和性affinity、污点taints、优先级、持久盘等。 调度器的主要工作是识别create request然后选择满足要求的最佳节点。 分
阅读全文
posted @ 2025-10-26 12:13 码甲哥不卷
阅读(207)
评论(0)
推荐(1)
下一页
公告