上一页 1 2 3 4 5 6 7 ··· 19 下一页
摘要: 目录Helix: A Vision-Language-Action Model for Generalist Humanoid ControlTL;DRMethodMotivationSystem 2 (S2,慢系统)System 1 (S1, 快系统)DataExperiment效果可视化总结与思 阅读全文
posted @ 2025-08-11 21:38 fariver 阅读(122) 评论(0) 推荐(0)
摘要: 目录RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic ControlTL;DRMethod模型Action表示Co-Fine-TuneReal-Time Inference如何实现连续运动控制训练数据Exper 阅读全文
posted @ 2025-08-09 14:33 fariver 阅读(56) 评论(0) 推荐(0)
摘要: 目录π0: A Vision-Language-Action Flow Model for General Robot ControlTL;DRMethodPaliGemma VLM基座模型VLA多模态的对齐机制与Transfusion的联系Flow Matching生成如何在本文所介绍的VLA模型 阅读全文
posted @ 2025-08-08 21:46 fariver 阅读(213) 评论(0) 推荐(0)
摘要: 目录UNLEASHING LARGE-SCALE VIDEO GENERATIVE PRE-TRAINING FOR VISUAL ROBOT MANIPULATIONTL;DRMethodPretrainRobot Data FinetuningExperiment总结与思考相关链接 UNLEAS 阅读全文
posted @ 2025-08-07 21:48 fariver 阅读(17) 评论(0) 推荐(0)
摘要: 目录OpenVLA: An Open-Source Vision-Language-Action ModelTL;DRMethodaction表示Training DataImplementationInfrastructureExperiment效果可视化总结与思考相关链接Related work 阅读全文
posted @ 2025-08-07 20:18 fariver 阅读(161) 评论(0) 推荐(0)
摘要: 目录Qwen3 Technical ReportTL;DRArchitectureMethodPre-trainingPost-trainingLong-CoT Cold StartThinking Mode FusionStage2的Reasoning RL 与 Stage4的General RL 阅读全文
posted @ 2025-08-02 13:58 fariver 阅读(66) 评论(0) 推荐(0)
摘要: 目录KIMI K2: OPEN AGENTIC INTELLIGENCETL;DRMethodQK-Clip在Transformer Attention中,什么是attention logits爆炸问题?QKClip为什么能解决attention logits爆炸的问题?AlgorithmPre-t 阅读全文
posted @ 2025-08-01 21:53 fariver 阅读(340) 评论(0) 推荐(0)
摘要: 目录Stable Video Diffusion: Scaling Latent Video Diffusion Models to Large DatasetsTL; DR;DataStage I: Image PretrainingStage II: Curating a Video Pretr 阅读全文
posted @ 2025-07-28 22:24 fariver 阅读(100) 评论(0) 推荐(0)
摘要: 目录Flamingo: a Visual Language Model for Few-Shot LearningTL;DRMethodVisual processing and Perceiver ResamplerGATED XATTN-DENSE layersMixture of Vision 阅读全文
posted @ 2025-07-26 15:41 fariver 阅读(79) 评论(0) 推荐(0)
摘要: 引爆推理革命:从PPO到GRPO,强化学习如何重塑大语言模型 引言:当强化学习遇上大型语言模型 近年来,大型语言模型(LLM)以前所未有的速度席卷了人工智能领域。然而,预训练的LLM虽然知识渊博,但其输出往往难以完全符合人类的价值观和特定任务的需求。 为了解决这一“对齐”难题,一种新的技术范式——基 阅读全文
posted @ 2025-07-22 21:44 fariver 阅读(408) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 ··· 19 下一页