摘要:
1.方案描述 推理多任务模型时,可能会有不同任务分支 部署不同帧率的需求,例如 BEV 动态任务 20 帧,静态任务 10 帧这种情况。 最简单的方式是编译两个模型,分开推理: 模型 1:backbone+neck+ 动态 head 模型 2:backbone+neck+ 静态 head 此时,重复 阅读全文
posted @ 2025-10-31 20:58
地平线智能驾驶开发者
阅读(1)
评论(0)
推荐(0)
摘要:
一、基础介绍 什么是 mul 与 reduce_sum? mul 通常指元素级乘法(Element-wise Multiplication),它将两个形状相同的张量中对应位置的元素相乘,返回一个与原张量形状相同的新张量。 reduce_sum 是一种规约操作(Reduction Operation) 阅读全文
posted @ 2025-10-31 18:36
地平线智能驾驶开发者
阅读(1)
评论(0)
推荐(0)
摘要:
在模型结构优化与部署量化过程中,开发者往往会遇到一个关键任务:基于历史 Badcase 数据验证模型精度变化,确保模型修改不会引入明显性能退化。 这类验证常见于感知、预测、行为识别等任务,尤其在客户交付或精度回归过程中十分关键。 但实际场景中,Badcase 的来源和管理非常复杂: 数据常常分 阅读全文
posted @ 2025-10-24 22:14
地平线智能驾驶开发者
阅读(7)
评论(0)
推荐(0)
摘要:
一、VLA 简介 1.1 VLA 定义 VLA (Vision Language Action)是一种多模态机器学习模型,结合了视觉、语言和动作三种能力,旨在实现从感知输入直接映射到控制动作的完整闭环能力。VLA 强调一体化多模态端到端架构,非感知规控的模块化方案。 下图是常见端到端的框架,是 RT 阅读全文
posted @ 2025-10-23 21:37
地平线智能驾驶开发者
阅读(41)
评论(0)
推荐(0)
摘要:
一、前言 在征程 6 工具链的量化精度调优实践中,当 Matmul/Conv 算子的两个输入皆为量化敏感算子时,PTQ 与 QAT 各自面临着难以克服的棘手困境。 在 PTQ 流程里,为了实现双 int16 输入的支持,工作人员不得不借助脚本将原本结构单一的 Matmul/Conv 算子拆解为 2 阅读全文
posted @ 2025-10-18 20:55
地平线智能驾驶开发者
阅读(16)
评论(0)
推荐(0)
摘要:
一、前言 在模型开发与应用领域,精准的性能分析和优化是提升效率的核心。地平线通过 征程 6 算法工具链 OE3.2.0 版本,对 hbm_perf 接口进行了重大升级,新增了 内存**占用信息** 和 硬件占用 Timeline 两大功能 。这些强化功能使开发者能够清晰掌握模型运行时的资源消耗和硬件 阅读全文
posted @ 2025-10-18 16:30
地平线智能驾驶开发者
阅读(13)
评论(0)
推荐(0)
摘要:
在了解 VLM 之前,先复习下 LLM。 一、LLM(Large Language Model) 大语言模型(LLM,Large Language Model)名字虽然带有语言二字,但其实并不局限于语言类场景。LLM 更多是一种统计建模的通用技术,它们主要通过自回归 Transformer 来模拟 阅读全文
posted @ 2025-10-17 12:06
地平线智能驾驶开发者
阅读(41)
评论(0)
推荐(0)
摘要:
一、前言 大模型(参数规模通常数十亿至万亿级)在处理复杂任务时面临三大核心问题: 显式关联的局限性:传统 Multi-head Attention 依赖输入数据的显式特征(如文本中的词向量、图像中的像素特征)计算注意力,难以捕捉深层语义(如 “同义词替换”“上下文隐喻”)或抽象结构(如 “逻辑推理链 阅读全文
posted @ 2025-10-15 22:24
地平线智能驾驶开发者
阅读(46)
评论(0)
推荐(0)
摘要:
一、BPU trace 理论基础 在学习 BPU trace 前,希望大家对 UCP trace 已经有简单的了解,详情可见工具链用户手册《统一计算平台(UCP)-UCP 性能分析工具-UCP Trace 使用说明》章节。 1.1 BPU Trace 配置文件模板 在 system 模式下抓取 BP 阅读全文
posted @ 2025-10-15 21:48
地平线智能驾驶开发者
阅读(17)
评论(0)
推荐(0)
浙公网安备 33010602011771号