jack-chen666 - 博客园

2025年10月27日

摘要：目录一、总体架构二、各组件详细说明四、训练数据格式五、模型变体对比七、推理代码示例 OpenVLA: An Open-Source Vision-Language-Action Model https://arxiv.org/abs/2406.09246 https://openvla.github 阅读全文

posted @ 2025-10-27 15:04 jack-chen666 阅读(13) 评论(0) 推荐(0)

2025年10月24日

整体理解pai0-具身智能-PyTorch einsum 完全教程-11

摘要：目录1. 基础概念2. 基础语法Level 1: 向量点积Level 2: 矩阵乘法Level 3: 批次矩阵乘法（Transformer中常用）4. PI0 代码中的实际例子例子1: QKV 投影 (gemma.py:183)例子2: 注意力计算 (gemma.py:217)例子3: 注意力输出阅读全文

posted @ 2025-10-24 17:24 jack-chen666 阅读(10) 评论(0) 推荐(0)

2025年10月9日

整体理解pai0-具身智能-01

摘要：目录总框架pai0PaliGemma: A versatile 3B VLM for transferTransFusion 模型介绍（多模态统一模型）VLM (Vision-Language Model) 架构总框架 π0——用于通用机器人控制的VLA模型：一套框架控制7种机械臂(基于PaliG 阅读全文

posted @ 2025-10-09 20:30 jack-chen666 阅读(25) 评论(0) 推荐(0)

2025年9月28日

LRM reward signal 论文两篇

摘要： RLBFF: BINARY FLEXIBLE FEEDBACK TO BRIDGE BETWEEN HUMAN FEEDBACK & VERIFIABLE REWARDS Language Models that Think, Chat Better 阅读全文

posted @ 2025-09-28 14:21 jack-chen666 阅读(15) 评论(0) 推荐(0)

2025年9月20日

最小生成树MST-07

摘要：目录概念Kruskal算法（克鲁斯卡尔算法）Prim算法（普里姆算法）比较MST应用场景MST与最短距离MST与 TSP 参考链接 https://cloud.tencent.com/developer/article/1480529 概念最小生成树MST 应该叫最小总间距树 Mininum S 阅读全文

posted @ 2025-09-20 16:45 jack-chen666 阅读(26) 评论(0) 推荐(0)

2025年9月19日

多站点的TSP问题求解-06

摘要： https://mit-realm.github.io/CMDTSP/ https://github.com/Brelliothe/CMDTSP paper：A Hierarchical Framework for Solving the Constrained Multiple Depot Tra 阅读全文

posted @ 2025-09-19 16:22 jack-chen666 阅读(10) 评论(0) 推荐(0)

PointNetwork-求解TSP-05

摘要： https://github.com/ccjjxx99/PointerNetworks-pytorch-tsp https://arxiv.org/pdf/1506.03134 阅读全文

posted @ 2025-09-19 16:20 jack-chen666 阅读(4) 评论(0) 推荐(0)

2025年9月16日

算法-TSP启发式算法-04

摘要：旅行商问题 (Traveling Salesperson Problem, TSP)，是计算机科学和运筹学领域一个非常经典且著名的组合优化问题。简单来说，它的核心任务是：给定一系列城市和每对城市之间的距离，找到一条最短的哈密顿回路，使得旅行商从一个城市出发，经过所有其他城市恰好一次，最后返回到起点阅读全文

posted @ 2025-09-16 17:50 jack-chen666 阅读(37) 评论(0) 推荐(0)

2025年9月15日

LLaVA- Improved Baselines with Visual Instruction Tuning

摘要：原始LLaVA论文：标题： "Visual Instruction Tuning" arXiv链接： https://arxiv.org/abs/2304.08485 会议： NeurIPS 2023 LLaVA-1.5 论文：标题： "Improved Baselines with Visua 阅读全文

posted @ 2025-09-15 16:47 jack-chen666 阅读(17) 评论(0) 推荐(0)

TokenFlow: Unified Image Tokenizer for Multimodal Understanding and Generation

摘要： https://github.com/ByteVisionLab/TokenFlow https://arxiv.org/abs/2412.03069 阅读全文

posted @ 2025-09-15 09:52 jack-chen666 阅读(10) 评论(0) 推荐(0)

红豆生南国是很遥远的事情

种豆南山下 github

公告

红豆生南国 是很遥远的事情

种豆南山下 github

公告

红豆生南国是很遥远的事情