wangssd

2026年4月3日

摘要： MPC（模型预测控制）和强化学习（RL）都用于求解序列决策问题，但它们的核心理念、依赖条件和应用场景有本质区别。简单直观的比喻： MPC 像一位精于计算的工程师：基于已知的物理模型，在线快速计算未来几步的最优路径。每一步都重新规划。强化学习像一位从经验中成长的棋手：通过与环境的反复试错（阅读全文

posted @ 2026-04-03 15:18 wangssd 阅读(42) 评论(0) 推荐(0)

RTO，即实时优化 (Real-Time Optimization)

摘要： RTO，即实时优化 (Real-Time Optimization)，可以理解为大型工业装置的“AI驾驶系统”或“全局总参谋”。它的核心任务，是在装置连续运行的过程中，自动地、持续地寻找并维持那个能让经济效益最大化的“目标设定点”。 RTO的核心思想：为装置装上“智慧大脑” RTO并不是取代MPC，阅读全文

posted @ 2026-04-03 14:52 wangssd 阅读(52) 评论(0) 推荐(0)

PID（proportion integration differentiation）控制算法

摘要： PID控制算法其实就是指比例，积分，微分控制。PID控制只关心输入输出，而不关心系统的内部特性。 P:比例控制，代表现在，对当下的状态做出控制 I:积分控制，代表过去，依据过去的状态做出控制 D:微分控制，代表未来，根据未来的趋势做出控制当得到系统的输出后，将输出与输入的误差经过比例，积分，微分3 阅读全文

posted @ 2026-04-03 14:25 wangssd 阅读(34) 评论(0) 推荐(0)

MPC（模型预测控制 Model Predictive Control）

摘要： MPC思想 MPC 不是独立算法，是「优化框架」；每一步在线求解，本质就是在跑 LP / QP / NLP 数学优化问题线性 + 无二次代价 → MPC 内嵌 LP（线性规划）线性 + 平方误差代价（工业最常用）→ MPC 内嵌 QP（二次规划）非线性模型 / 非线性约束 → MPC 内嵌 N 阅读全文

posted @ 2026-04-03 13:39 wangssd 阅读(241) 评论(0) 推荐(0)

2026年3月13日

电力市场、调度、出清模型：线性化模型(LP,线性规划/MILP,混合整数规划)

摘要： LP：线性规划变量全是连续实数，解决 “发多少” 的问题。 MILP：混合整数线性规划既有连续变量，又有整数 / 0-1 变量，能同时解决 “开不开” 和 “发多少”。电力现货能算出来、能用上线性规划的核心原因，是把电力市场、调度、出清“强行线性化” 了，所以才能用 LP / MILP。 LP和M 阅读全文

posted @ 2026-03-13 14:45 wangssd 阅读(52) 评论(0) 推荐(0)

电力交易市场中的日前/日内/实时交易

摘要： 1. 日前市场 Day-ahead Market 时间：提前一天（一般前一天中午～下午）做什么：申报第二天每 15 分钟 / 每小时的发电量、用电量、价格电网提前做次日全网电力平衡计划特点：交易量最大价格相对稳定是主力市场，决定第二天大致发多少、用多少角色：电厂、大用户、售电公司主要在这阅读全文

posted @ 2026-03-13 10:21 wangssd 阅读(196) 评论(0) 推荐(0)

2026年2月26日

A2A 协议和mcp协议的区别

摘要： MCP（Model Context Protocol）：代理连接工具 / API / 数据源的协议（“代理用工具”）A2A。 A2A：代理与代理之间协作、任务委派的协议（“代理找代理”）A2A。 A2A 协议的核心规则通信基于 JSON-RPC 2.0（JSON-RPC 2.0 的远程过程调用（R 阅读全文

posted @ 2026-02-26 10:00 wangssd 阅读(40) 评论(0) 推荐(0)

2026年2月4日

RAG 检索算法 Hybrid search(混合检索)

摘要： Hybrid Search（混合检索）是将关键词检索（如 BM25）与向量语义检索进行结合的召回策略。工具：elasticsearch、Milvus 关键词检索和向量检索的优缺点关键词检索（稀疏检索）：基于词频 / 逆文档频率（如 BM25、TF-IDF），擅长精确匹配（实体、代码、术语、缩写阅读全文

posted @ 2026-02-04 10:45 wangssd 阅读(442) 评论(0) 推荐(0)

2026年1月30日

vllm 多机多卡部署大模型 (Ray + vLLM )

摘要： Ray 和 vLLM 介绍如果需要把一个大模型用多卡 / 多机跑起来，追求推理性能：直接用 vLLM 自身的 MPI 多机部署。如果需要管理多个模型服务、动态扩缩容、统一调度多机资源、构建复杂分布式推理系统：需要用 Ray 封装 vLLM，借助 Ray 的分布式能力提升系统的灵活性和可扩展性。阅读全文

posted @ 2026-01-30 17:56 wangssd 阅读(1530) 评论(0) 推荐(0)

Agent Skills详解

摘要： Skills 标志着AI应用从对话交互向任务执行的关键跃迁。 Agent Skills旨在解决通用AI只懂道理却不会干活的核心痛点传统大模型虽能生成代码或文本，但缺乏对特定组织框架、业务流程和品牌规范的深层理解。 Agent Skills 把特定领域的操作指南、工具脚本、参考资料打包成文件夹，让大阅读全文

posted @ 2026-01-30 09:44 wangssd 阅读(452) 评论(0) 推荐(0)

公告