聆听风琴的巴赫

OpenVLA - 将大语言模型 Llama 应用到机器人

摘要： VLA 全称 Vision Language Action(视觉语言动作模型), 广泛用于自动驾驶, 机器人控制等; OpenVLA 是斯坦福开源的 VLA 模型, 由视觉语言模型 Prismatic 演化而来, 最新版本是 OpenVLA-OFT; OpenVLA 对标 Google 的 RT2X 阅读全文

posted @ 2025-09-14 12:03 聆听风琴的巴赫阅读(251) 评论(0) 推荐(0)

对照论文讲讲 Mobile ALOHA 代码

摘要：今天对照论文讲讲 Mobile ALOHA 的代码: https://arxiv.org/pdf/2304.13705 训练第一步是采样演示数据机械臂手腕摄像头(2个), 顶部摄像头(1个); 当前关节位置(joints): 14维向量, 2个机械臂每个关节的值; 动作序列 action seq 阅读全文

posted @ 2025-06-15 16:50 聆听风琴的巴赫阅读(228) 评论(0) 推荐(0)

简单讲讲 mobile aloha 训练阶段的代码-CVAE和Transformer神经网络 (一)

摘要：今天简单聊聊 mobile aloha CVAE 和 Transformer 神经网络的构建; 代码主要在 detr_vae.py 里的 build 函数(detr表示DEtection TRansformer); build 函数主要创建下面的几个神经网络: backbones 神经网络用来处理阅读全文

posted @ 2025-03-07 22:04 聆听风琴的巴赫阅读(266) 评论(0) 推荐(0)

简单讲讲 mobile aloha 代码---训练阶段的encoder

摘要：简单讲讲 mobile aloha 代码训练阶段的encoder 图片来源于 mobile aloha 论文; 训练和推理的核心的代码是这两个文件: detr/models/detr_vae.py detr/models/transformer.py 参见论文(https://arxiv.org/ 阅读全文

posted @ 2024-11-30 10:27 聆听风琴的巴赫阅读(231) 评论(2) 推荐(0)

简单讲一下Mobile Aloha模拟环境代码

摘要： Mobile Aloha模拟环境有两部分代码: 1. https://github.com/tonyzhaozh/act 里面有ACT论文的链接 2. https://github.com/MarkFzp/act-plus-plus 这个是我们要介绍的代码 ACT算法全称是 Action Chunk 阅读全文

posted @ 2024-06-23 14:13 聆听风琴的巴赫阅读(701) 评论(4) 推荐(1)

怎样用AI打飞机 (上)

摘要：怎样用AI打飞机自监督学习如上所示, 一个Agent(机器人)和一个Enviroment(环境)交互, 通过Obeservation(观察), 执行Action(行动), 获得Reward(奖励); 对比一下人脸识别的过程: 人脸样本打标签, 损失函数训练神经网络, 神经网络将人脸变为高维度上的阅读全文

posted @ 2023-01-25 12:03 聆听风琴的巴赫阅读(871) 评论(0) 推荐(0)

用 Google 的 FaceNet 做人脸识别---极客帮课程笔记

摘要：前几天在极客帮学了一个课程, 应班主任的要求, 做一个笔记; 课程的主要内容是Google开源的机器学习平台 TensorFlow 和人脸识别模型 FaceNet, 这里重点介绍一下人脸识别; 1. 环境搭建: 课程的代码运行在 TensorFlow 1.12 版本上的, 下面是 TensorFlo 阅读全文

posted @ 2021-12-02 20:50 聆听风琴的巴赫阅读(989) 评论(0) 推荐(0)

Google栽树, 后人乘凉---OpenStack滚动升级漫谈(OpenStack rolling upgrade)

摘要： 2010年, 美国的云计算公司 Rackspace 想重写他们的云平台代码, 并打算开源他们的技术和代码; 与此同时, NASA(美国航空航天局)下属的 Anso Lab 实验室发布了他们的 Beta 版的云计算平台代码; Rackspace 想和 NASA 共同成立一个开源的云计算平台项目; 20 阅读全文

posted @ 2021-07-31 12:16 聆听风琴的巴赫阅读(348) 评论(0) 推荐(0)

肤浅的聊聊 TiDB 扫表算子, 扫索引算子, 合取范式(CNF), 析取范式(DNF), skyline pruning

摘要：这一章主要涉及TiDB如下的源码: 1. 扫表算子怎样转换为扫索引算子; 2. 怎样把Selection算子的过滤条件化简, 转为区间扫描; 假设我们有一个表: t1( id int primary key not null auto_increment, a int, b int, c varch 阅读全文

posted @ 2019-12-21 17:50 聆听风琴的巴赫阅读(1967) 评论(0) 推荐(0)

简单聊聊TiDB中sql优化的一个规则---左连接消除(Left Out Join Elimination)

摘要：我们看看 TiDB 一段代码的实现左外连接(Left Out Join)的消除; select 的优化一般是这样的过程: 在逻辑执行计划的优化阶段, 会有很多关系代数的规则, 需要将逻辑执行计划(LogicalPlan)树应用到各个规则中, 尝试进行优化改写; 我们看看其中的一条优化规则: out 阅读全文

posted @ 2019-11-24 17:03 聆听风琴的巴赫阅读(2122) 评论(0) 推荐(0)

聆听风琴的巴赫

导航

公告