会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
有态度马甲-- 精益码农
只做原创,专注于架构,开源,微服务,分布式等领域的技术研究和分享。 知其然更知其所以然,不做眼高手低的【高手】
博客园
首页
新随笔
联系
管理
2026年4月16日
GLM模型这么火,咱们用vllm也咧一个呗!
摘要: 上文《higress这个中登才是AI时代的心头好》提到用vll production-stack 部署LLM, 今天我们补交作业, 记录使用vllm production-stack 部署llm。 1. k8s调度gpu 集群管理员,需要在worker节点上安装设备驱动,并运行对应的设备插件。 为了
阅读全文
posted @ 2026-04-16 18:01 神仙别打架
阅读(218)
评论(0)
推荐(0)
2026年4月1日
同样都是九年义务教育,他知道的AI算力科普好像比我多耶
摘要: 1. 算力单位 P= Peta 完整单词: Petaflops Peta: 10^15 千万亿 flops: floating-point operations per second 每秒浮点运算次数 算力单位从小到大: K= Kilo 千 M = Mega(百万) G = Giga(十亿) T =
阅读全文
posted @ 2026-04-01 17:48 神仙别打架
阅读(294)
评论(0)
推荐(1)
2026年3月25日
higress 这个中登才是AI时代的心头好
摘要: 2026年3月底, ingress-nginx这个老登就会举办退役仪式,k8s社区强烈推荐运维迁移到其他云原生网关。 2026年3月初, 虾系玩物claw已经被AI市场宠的不像样。 最近我们在探索用一套AI网关同时提供 云原生API和 AI token服务,于是我们开始从ingres-nginx迁移
阅读全文
posted @ 2026-03-25 09:11 神仙别打架
阅读(257)
评论(0)
推荐(0)
2026年3月19日
MetalLB才是给Ingress这个老登做负重前行的那个男人
摘要: 前文ingress这个老6, 记录了我对于ingress-nginx的默认部署方式的认知: 在集群内产生nginx服务,与集群内服务互访,利用nginx 走7层转发; 产生的nginx服务对外以nodeport形式暴露。 但是读者也发现了这种默认的ingress-nginx并没有解决: 节点负载均衡
阅读全文
posted @ 2026-03-19 13:39 神仙别打架
阅读(142)
评论(0)
推荐(1)
2026年2月28日
超性感的轻量级openclaw平替,我给nanobot打call
摘要: 春节期间,qwen3.5和openclaw火到爆, 咱们让子弹飞了一阵子,目前收到的信息是 ① 大龙虾配置极其复杂,非科班生很容易失败 ② 大龙虾很费token。 香港大学开源的nanobot 作为大龙虾的平替, 我试用下来,门槛相对较低,资源占用很少,功能完备, github上26k star。
阅读全文
posted @ 2026-02-28 22:00 神仙别打架
阅读(1167)
评论(0)
推荐(2)
2026年1月29日
我不允许谁还不清楚function call在AI-Agent领域中打手的地位
摘要: 前文提要:还有比ollama更傻瓜式的大模型本地部署方式吗 ? 1.function calling 底层工作原理 大模型重塑了我们与软件应用的交互方式, 其中最重要的特性就是 function calling 。 一种利用结构化输入/输出在LLM和编程应用之间建立桥梁的方式。 不管是当前火热的AI
阅读全文
posted @ 2026-01-29 13:47 神仙别打架
阅读(558)
评论(0)
推荐(2)
2026年1月23日
还有比ollama更傻瓜式的大模型本地部署方式吗 ?
摘要: LLM的狂风已经吹了几年, 所有人都耳濡目染的会飚上几句行话/名词。切好你自己有台4070的机器,恰好你有时间倒腾, 那就让我们回顾一遍名词,验证狂风吹过的技术车辙。 恰好最近有台4070(12g显存)机器,于是尝试使用ollama部署大模型。 RTX 4070 擅长训练中小型模型;凭借其 184
阅读全文
posted @ 2026-01-23 09:08 神仙别打架
阅读(1134)
评论(1)
推荐(1)
2026年1月22日
🔎我不允许谁还分不清这三种watch机制的区别
摘要: 今天快速介绍目前市场面常见的三个watch机制的实现。 1.chunked transfer encoding k8s控制面几个组件,核心枢纽是apiserver, 除etcd之外,其他组件都通过restful进行http通信。 上文提到的informer机制是controller的标准范式, 目的
阅读全文
posted @ 2026-01-22 09:28 神仙别打架
阅读(492)
评论(0)
推荐(0)
2026年1月8日
云原生AI算力平台的架构解读
摘要: 给近半年做的云原生AI算力平台做一个回顾, 思考和实践参考了云溪大会上的分享:为大模型工程提效,基于阿里云 ACK 的云原生 AI 工程化实践,全文很长,我这边做一个牵引和解读。 1. 云计算迎来“智算”时代 云计算是一种通过互联网的方式按需提供计算资源(如服务器、存储、数据库、网络、软件等)的服务
阅读全文
posted @ 2026-01-08 18:41 神仙别打架
阅读(649)
评论(0)
推荐(0)
2025年12月23日
🚀糟糕,我实现的k8s informer好像是依托答辩
摘要: 💡 糟糕,k8s informer我好像拉一坨大的 近段时间在做云原生AI算力平台,之前提到使用k8s informer机制管控多渠道提交的训练任务。 上面第4点: informer会监听通过cli和网页portal提交的job, 回显到portal平台,并在job发生状态变更时通知用户。 1.
阅读全文
posted @ 2025-12-23 17:12 神仙别打架
阅读(740)
评论(0)
推荐(0)
下一页
公告