2025年9月14日

摘要: VLA 全称 Vision Language Action(视觉语言动作模型), 广泛用于自动驾驶, 机器人控制等; OpenVLA 是斯坦福开源的 VLA 模型, 由视觉语言模型 Prismatic 演化而来, 最新版本是 OpenVLA-OFT; OpenVLA 对标 Google 的 RT2X 阅读全文
posted @ 2025-09-14 12:03 聆听风琴的巴赫 阅读(117) 评论(0) 推荐(0)

2025年6月15日

摘要: 今天对照论文讲讲 Mobile ALOHA 的代码: https://arxiv.org/pdf/2304.13705 训练 第一步是采样演示数据 机械臂手腕摄像头(2个), 顶部摄像头(1个); 当前关节位置(joints): 14维向量, 2个机械臂每个关节的值; 动作序列 action seq 阅读全文
posted @ 2025-06-15 16:50 聆听风琴的巴赫 阅读(201) 评论(0) 推荐(0)

2025年3月7日

摘要: 今天简单聊聊 mobile aloha CVAE 和 Transformer 神经网络的构建; 代码主要在 detr_vae.py 里的 build 函数(detr表示DEtection TRansformer); build 函数主要创建下面的几个神经网络: backbones 神经网络 用来处理 阅读全文
posted @ 2025-03-07 22:04 聆听风琴的巴赫 阅读(240) 评论(0) 推荐(0)

2024年11月30日

摘要: 简单讲讲 mobile aloha 代码 训练阶段的encoder 图片来源于 mobile aloha 论文; 训练和推理的核心的代码是这两个文件: detr/models/detr_vae.py detr/models/transformer.py 参见论文(https://arxiv.org/ 阅读全文
posted @ 2024-11-30 10:27 聆听风琴的巴赫 阅读(211) 评论(2) 推荐(0)

2024年6月23日

摘要: Mobile Aloha模拟环境有两部分代码: 1. https://github.com/tonyzhaozh/act 里面有ACT论文的链接 2. https://github.com/MarkFzp/act-plus-plus 这个是我们要介绍的代码 ACT算法全称是 Action Chunk 阅读全文
posted @ 2024-06-23 14:13 聆听风琴的巴赫 阅读(628) 评论(4) 推荐(1)

2023年1月25日

摘要: 怎样用AI打飞机 自监督学习 如上所示, 一个Agent(机器人)和一个Enviroment(环境)交互, 通过Obeservation(观察), 执行Action(行动), 获得Reward(奖励); 对比一下人脸识别的过程: 人脸样本打标签, 损失函数训练神经网络, 神经网络将人脸变为高维度上的 阅读全文
posted @ 2023-01-25 12:03 聆听风琴的巴赫 阅读(804) 评论(0) 推荐(0)

2021年12月2日

摘要: 前几天在极客帮学了一个课程, 应班主任的要求, 做一个笔记; 课程的主要内容是Google开源的机器学习平台 TensorFlow 和人脸识别模型 FaceNet, 这里重点介绍一下人脸识别; 1. 环境搭建: 课程的代码运行在 TensorFlow 1.12 版本上的, 下面是 TensorFlo 阅读全文
posted @ 2021-12-02 20:50 聆听风琴的巴赫 阅读(962) 评论(0) 推荐(0)

2021年7月31日

摘要: 2010年, 美国的云计算公司 Rackspace 想重写他们的云平台代码, 并打算开源他们的技术和代码; 与此同时, NASA(美国航空航天局)下属的 Anso Lab 实验室发布了他们的 Beta 版的云计算平台代码; Rackspace 想和 NASA 共同成立一个开源的云计算平台项目; 20 阅读全文
posted @ 2021-07-31 12:16 聆听风琴的巴赫 阅读(330) 评论(0) 推荐(0)

2019年12月21日

摘要: 这一章主要涉及TiDB如下的源码: 1. 扫表算子怎样转换为扫索引算子; 2. 怎样把Selection算子的过滤条件化简, 转为区间扫描; 假设我们有一个表: t1( id int primary key not null auto_increment, a int, b int, c varch 阅读全文
posted @ 2019-12-21 17:50 聆听风琴的巴赫 阅读(1950) 评论(0) 推荐(0)

2019年11月24日

摘要: 我们看看 TiDB 一段代码的实现 左外连接(Left Out Join)的消除; select 的优化一般是这样的过程: 在逻辑执行计划的优化阶段, 会有很多关系代数的规则, 需要将逻辑执行计划(LogicalPlan)树应用到各个规则中, 尝试进行优化改写; 我们看看其中的一条优化规则: out 阅读全文
posted @ 2019-11-24 17:03 聆听风琴的巴赫 阅读(2097) 评论(0) 推荐(0)

导航