摘要: 补充:https://github.com/datawhalechina/hello-agents/tree/main 项目的文档解读 感谢datawhale官方提供的开源资料 图中展示了一种带有反思机制的智能体架构。智能体从环境中接收观察并记录为轨迹(短期记忆),Actor 基于当前轨迹与经验记忆 阅读全文
posted @ 2026-04-14 18:43 AAA建材王师傅 阅读(18) 评论(0) 推荐(0)
摘要: PyTorch 文档明确说 DETAIL 会返回一个 wrapper process group,不只是多打日志。 当前 torch==2.9.0;而 v2.9.0 和 v2.9.1 的 ProcessGroupWrapper.cpp 里都没有 reduce_scatter_tensor_coale 阅读全文
posted @ 2026-04-09 16:21 AAA建材王师傅 阅读(10) 评论(0) 推荐(0)
摘要: Recall: 最简单的回归模型是输入变量的线性组合: \[y(\mathbf{x}, \mathbf{w}) = w_0 + w_1 x_1 + \cdots + w_D x_D \]其中: \(\mathbf{x} = (x_1, \cdots, x_D)^\top\) 是输入向量; \(\ma 阅读全文
posted @ 2025-06-21 02:53 AAA建材王师傅 阅读(49) 评论(0) 推荐(0)
摘要: 视频链接:How I Understand Flow Matching My kids love Play-Doh. Last time, they made a Play-Doh version of their stuffy. It's pretty amazing that we can cr 阅读全文
posted @ 2025-06-20 18:19 AAA建材王师傅 阅读(80) 评论(0) 推荐(0)
摘要: 什么叫不确定性 不确定性可以分为两种: 认知不确定性(epistemic uncertainty),也称系统不确定性(systematic uncertainty)。 这种不确定性源自有限的数据集大小。随着观测数据的增多,例如更多良性和恶性皮肤病变图像样本,系统可以更好地预测新样本的类别。 然而,即 阅读全文
posted @ 2025-06-17 14:51 AAA建材王师傅 阅读(141) 评论(0) 推荐(0)
摘要: Note:本文是在DataWhale的活动期间撰写,推荐关注相关公众号共同学习。 通过应用引入相关概念 1.医疗诊断场景 训练集:被标注为恶性或良性的病变图像集,标注依据为对病变活检后得到的真实分类。 训练集用处:确定深度神经网络中2500万个可调参数(权重)的取值。 训练目标:训练好的神经网络可以 阅读全文
posted @ 2025-06-15 11:26 AAA建材王师傅 阅读(70) 评论(0) 推荐(0)
摘要: Step 1:构造钟形函数 我们想要构造一个: 对称; 在中心点 \(\mu\) 处最大; 越远离中心,函数值越小; 可积分为 1。 我们猜测使用如下函数形式: \[f(x) = A \cdot \exp\left(-B(x - \mu)^2\right) \]其中 \(B > 0\),控制函数宽度 阅读全文
posted @ 2025-06-11 11:21 AAA建材王师傅 阅读(93) 评论(0) 推荐(0)
摘要: Kubernetes + 容器化部署 vLLM官方docker镜像: vllm/vllm-openai 这是官方提供的 Docker 镜像,可以用来快速部署 vLLM 服务,便于容器化管理。 实战: helm chart 部署 本地集群: 使用 Helm 安装和配置 vLLM 在本地 Kuberne 阅读全文
posted @ 2025-04-12 23:20 AAA建材王师傅 阅读(734) 评论(0) 推荐(0)
摘要: https://zhuanlan.zhihu.com/p/689976933 uv是开发ruff的公司 Astral 前一段时间发布的高性能Python工具,用途是安装python包,以及解析包版本之间的依赖。它的最大特点是快,相比现有的的工具都能够快一大截。 阅读全文
posted @ 2025-04-12 17:51 AAA建材王师傅 阅读(34) 评论(0) 推荐(0)
摘要: Deepseek系列博客目录 Model 核心 Date DeepSeekLLM 探究LLM Scalling Law 2024.01 DeepSeekMath 提出GRPO 2024.04 DeepSeek-V2 DeepSeekMoE, Multi-Head Latent Attention ( 阅读全文
posted @ 2025-03-14 18:56 AAA建材王师傅 阅读(126) 评论(0) 推荐(0)