会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
有点锋芒
博客园
首页
新随笔
联系
订阅
管理
2025年11月12日
VLA1:思想萌芽期 (2022年以前) - “基础奠定”,《Gato: A Generalist Agent》(DeepMind, 2022)
摘要: 1. ViT(Vision Transformer) 中图像的序列化 \[z_0 = [x_{class}; x^1_pE; x^2_pE;\cdots; x^N_pE] + E_{pos}, E ∈ R^{(P 2 ·C)×D} , E_{pos} ∈ R^{(N +1)×D} \]2. toke
阅读全文
posted @ 2025-11-12 10:11 ldfm
阅读(6)
评论(0)
推荐(0)
2025年3月5日
100 TensorRT Puglin开发
摘要: 1. 核心原理 定义计算逻辑:告诉 GPU 如何执行这个特殊层的计算。 集成到 TensorRT:让 TensorRT 在推理时调用你的计算逻辑。 2. 开发步骤 1. 创建一个插件类,继承TensorRT的 IPluginV2 接口,实现关键函数 #include <NvInfer.h> clas
阅读全文
posted @ 2025-03-05 11:45 ldfm
阅读(80)
评论(0)
推荐(0)
2025年3月4日
05 感知 3D目标检测 模型导出和部署(基础知识)
摘要: 1. 模型导出基础介绍 torch.onnx.export中需要的模型实际上是一个torch.jit.ScriptModule。而要把普通 PyTorch 模型转一个这样的 TorchScript 模型,有跟踪(trace)和记录(script)两种导出计算图的方法。如果给torch.onnx.ex
阅读全文
posted @ 2025-03-04 09:38 ldfm
阅读(73)
评论(0)
推荐(0)
2025年2月28日
感知: 3D目标检测 Sparse BEV 补1
摘要: 1. DETR3D 2021(DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D Queries) Ref 1. https://zhuanlan.zhihu.com/p/430198800 Coarse-to-Fine的形
阅读全文
posted @ 2025-02-28 16:54 ldfm
阅读(289)
评论(0)
推荐(0)
2025年2月27日
00 数据结构
摘要: 1. 数组 2. 链表 3. 栈 4. 队列 5. 树 红黑树(自平衡二叉树) 增删改查时间复杂度 O(log n) 二叉搜索树(BST):左子节点 < 父节点 < 右子节点。 问题:若插入顺序不当(如从小到大插入),BST 会退化为链表,查找效率从 O(log n) 降为 O(n)。 平衡二叉树(
阅读全文
posted @ 2025-02-27 09:46 ldfm
阅读(26)
评论(0)
推荐(0)
2025年2月26日
04 感知:3D目标检测 注意力机制
摘要: 1. DETR 2020(DEtection TRansformer)End-to-End Object Detection with Transformers Best Ref: 理解DETR 可以将DETR视为一个从图像序列到一个集合序列的转换过程。该集合实际上就是一个可学习的位置编码(文章中也
阅读全文
posted @ 2025-02-26 19:03 ldfm
阅读(153)
评论(0)
推荐(0)
【多视图几何】1. 概论
摘要: 1. 欧式空间 和 射影空间 欧式空间可以由射影空间导出。 例:2D射影空间可以表示具有无穷远的平面,表示范围包含2d欧式空间;3d 同理。 欧式空间 -> 射影空间 将坐标转换为齐次(homogeneous)坐标 (升维,齐次坐标表示一类性质相同坐标簇) 在二维欧式平面添加无穷远线(三维欧式空间添
阅读全文
posted @ 2025-02-26 19:01 ldfm
阅读(17)
评论(0)
推荐(0)
03 感知:目标检测 Dense BEV feature
摘要: 1. LSS 2020(First Depth Distribution) 核心:VoxelPooling (视锥点云特征 -> BEV特征) 将 frastum 投影到ego vehicle 坐标系,形成 geometry,借助此geometry,将feature放到 bev feature ''
阅读全文
posted @ 2025-02-26 16:54 ldfm
阅读(129)
评论(0)
推荐(0)
01 感知:目标检测
摘要: 1. BEV感知 BEV Camera view transformation 2d -> 3d via depth estimation 3d -> 2d (originates in 3d space) pure network based (implicitly) BEV Lidar voxe
阅读全文
posted @ 2025-02-26 16:54 ldfm
阅读(43)
评论(0)
推荐(0)
2024年11月26日
01 python项目从根目录导入出现ModuleNotFoundError问题
摘要: 关键:使用 sys.path.append('path/to/project')不解决问题 原因:上面方法一般在path列表的末尾添加路径,还是找不到 解决:使用 sys.path.insert(0, 'path/to/project')
阅读全文
posted @ 2024-11-26 10:21 ldfm
阅读(72)
评论(0)
推荐(0)
下一页
公告