摘要: Ray 和 vLLM 介绍 如果需要把一个大模型用多卡 / 多机跑起来,追求推理性能:直接用 vLLM 自身的 MPI 多机部署。 如果需要管理多个模型服务、动态扩缩容、统一调度多机资源、构建复杂分布式推理系统:需要用 Ray 封装 vLLM,借助 Ray 的分布式能力提升系统的灵活性和可扩展性。 阅读全文
posted @ 2026-01-30 17:56 wangssd 阅读(15) 评论(0) 推荐(0)
摘要: Skills 标志着AI应用从对话交互向任务执行的关键跃迁。 Agent Skills旨在解决通用AI只懂道理却不会干活的核心痛点 传统大模型虽能生成代码或文本,但缺乏对特定组织框架、业务流程和品牌规范的深层理解。 Agent Skills 把特定领域的操作指南、工具脚本、参考资料打包成文件夹,让大 阅读全文
posted @ 2026-01-30 09:44 wangssd 阅读(19) 评论(0) 推荐(0)
摘要: “级间空调”通常指的是应用于行级空调或列间空调这种贴近热源的精确制冷方式。它们位于服务器机柜排之间(行间)或紧靠机柜侧面(列间),与传统的房间级空调相对。 1. 送风温度 定义:指空调机组将处理后的冷空气吹出时的温度。这是你为IT设备提供的“进口”空气温度。 测量点:通常在空调出风口的百叶窗或风帽处 阅读全文
posted @ 2026-01-23 10:51 wangssd 阅读(9) 评论(0) 推荐(0)
摘要: 位置编码(Positional Encoding, PE)是Transformer架构能够理解序列顺序的关键组件, Transformer 的核心组件 ——自注意力机制(Self-Attention) 是置换不变性(Permutation Invariant)的,即它本身不感知输入序列中 token 阅读全文
posted @ 2026-01-15 16:42 wangssd 阅读(95) 评论(0) 推荐(0)
摘要: AutoGen、Dify、coze、langChain、langGraph选型 LangChain / LangGraph: AI应用的“底层开发框架”。为开发者提供模块化组件和设计模式,需要较强的编程能力,灵活性极高。 AutoGen: 专注于“多智能体对话”的框架,通过对话驱动多智能体间的协作。 阅读全文
posted @ 2026-01-14 16:15 wangssd 阅读(29) 评论(0) 推荐(0)
摘要: 报错信息: (llamaFactory) root@autodl-container-d19d40bcb0-1bd39636:~/autodl-tmp/project/LlamaFactory-0.9.1/src# llamafactory-cli webui /root/autodl-tmp/co 阅读全文
posted @ 2026-01-06 17:40 wangssd 阅读(19) 评论(0) 推荐(0)
摘要: 强化学习(Reinforcement Learning, RL)和粒子群算法(Particle Swarm Optimization, PSO)是两类不同范式的智能优化方法。 1)动态序贯问题:环境一直在变,每一步的决策会影响下一步的环境,需要连续调整策略,追求长期整体最优。→ 用强化学习 2)静态 阅读全文
posted @ 2026-01-04 14:54 wangssd 阅读(11) 评论(0) 推荐(0)
摘要: 粒子群优化(Particle Swarm Optimization, PSO)是一种基于群体智能的随机优化算法,模拟鸟群、鱼群的群体觅食行为,通过个体间的信息共享和协作在解空间中寻找最优解。 在自然界中,鸟群觅食会表现出两个核心特征: 社会信息共享: 单只鸟不知道食物(最优解)在哪里,但会关注附近哪 阅读全文
posted @ 2025-12-31 14:20 wangssd 阅读(174) 评论(0) 推荐(0)
摘要: 收益 每股收益(EPS)是公司 “赚” 了多少钱,每股分红是公司决定 “给” 你多少钱。 核心区别 概念全称含义归属权 每股收益 Earnings Per Share (EPS) 公司的利润。即公司每一股股票背后代表的净利润。 属于公司(虽然理论上属于股东,但公司可以决定怎么花)。 每股分红 Div 阅读全文
posted @ 2025-12-30 09:56 wangssd 阅读(117) 评论(0) 推荐(0)
摘要: DeepSpeed 聚焦于大模型高效训练(同时支持推理优化),通过分布式技术突破训练的显存、算力瓶颈; vLLM 专注于大模型高吞吐、低延迟推理,核心解决推理阶段的显存利用率和请求处理效率问题。 一、DeepSpeed 底层原理 DeepSpeed 是微软推出的分布式训练 / 推理框架,核心目标是让 阅读全文
posted @ 2025-12-29 14:46 wangssd 阅读(80) 评论(0) 推荐(0)