06 2025 档案

摘要:目录核心思想与类比关键区别对比表详细解释PPODPOKTO如何选择样本数据集格式 核心思想与类比 KTO (Kahneman-Tversky Optimization)。这是一个较新的算法,其命名源于诺贝尔经济学奖得主丹尼尔·卡尼曼和阿莫斯·特沃斯基的前景理论。在LLM对齐的语境下,大家讨论的基本上 阅读全文
posted @ 2025-06-30 10:35 jack-chen666 阅读(1104) 评论(0) 推荐(0)
摘要:目录LlamaFactory PPO 训练:拥抱自定义奖励函数,告别LLM-as-a-Judge实战演练 LlamaFactory PPO 训练:拥抱自定义奖励函数,告别LLM-as-a-Judge 在利用 LlamaFactory 进行近端策略优化(PPO)训练时,您完全可以摆脱对大型语言模型(L 阅读全文
posted @ 2025-06-24 09:59 jack-chen666 阅读(857) 评论(1) 推荐(0)
摘要:关于 vLLM "--chat-template" 参数的非常常见且重要的问题。简单来说,这个参数决定了 vLLM 如何将多轮对话(系统、用户、助手消息)格式化成一个单一的字符串,以便模型能够正确理解。 首选:不设置,让 vLLM 自动加载。 对于大多数发布在 Hugging Face Hub 上的 阅读全文
posted @ 2025-06-24 09:44 jack-chen666 阅读(1373) 评论(0) 推荐(0)
摘要:第一步:强化学习到底是什么? (The Big Picture) 想象一下你正在训练一只小狗。这个过程和强化学习非常相似: 智能体 (Agent):你的小狗。在RL中,这就是我们试图训练的模型或算法。 环境 (Environment):你所在的房间或公园。在RL中,这是智能体所处的外部世界。 状态 阅读全文
posted @ 2025-06-23 09:16 jack-chen666 阅读(74) 评论(0) 推荐(0)
摘要:目录param.data.copy_ 这个用法在 PyTorch 中的含义和功能。常见使用场景: param.data.copy_ 这个用法在 PyTorch 中的含义和功能。 首先,直接回答你的问题:是的,param.data (作为一个张量) 是有 copy_ 这个方法的。 接下来,我们详细解释 阅读全文
posted @ 2025-06-22 23:48 jack-chen666 阅读(101) 评论(0) 推荐(0)
摘要:目录第一部分:位置编码技术发展简史阶段一:绝对位置编码 (Absolute Positional Encoding)阶段二:相对位置编码 (Relative Positional Encoding)阶段三:旋转位置编码 (Rotary Positional Embedding, RoPE)第二部分: 阅读全文
posted @ 2025-06-19 21:10 jack-chen666 阅读(1542) 评论(0) 推荐(0)
摘要:目录代码一、MoE 核心思想:为什么要用“混合专家”?二、代码逐层深度解读三、总结与设计思考 代码 class Qwen3MoeSparseMoeBlock(nn.Module): def __init__(self, config): super().__init__() self.num_exp 阅读全文
posted @ 2025-06-19 20:50 jack-chen666 阅读(737) 评论(0) 推荐(0)
摘要:目录代码 先说结论: 模型不再需要为 lm_head 单独学习一个巨大的权重矩阵,而是直接“重用”embedding 的权重。 一、核心思想:模型的“输入”与“输出”为何要关联? 要理解权重绑定,我们首先要理解语言模型的两个关键部分: 词嵌入层 (Input Embedding Layer): 作用 阅读全文
posted @ 2025-06-19 20:38 jack-chen666 阅读(800) 评论(0) 推荐(1)
摘要:目录Decoder-Only架构代码解读Qwen3Attention - 注意力模块Qwen3MLP - 前馈网络模块Qwen3DecoderLayer - 单个解码器层Qwen3Model & Qwen3ForCausalLM - 顶层封装总结 参考:https://zhuanlan.zhihu. 阅读全文
posted @ 2025-06-19 20:19 jack-chen666 阅读(4095) 评论(1) 推荐(1)
摘要:class MergedColumnParallelLinear(ColumnParallelLinear): def __init__( self, input_size: int, output_sizes: list[int], bias: bool = False, ): self.outp 阅读全文
posted @ 2025-06-19 19:43 jack-chen666 阅读(565) 评论(0) 推荐(0)
摘要:好的,完全没有问题。我们来用中文详细介绍一下大模型中 “打包模块 (Packed Modules)” 和 “权重打包 (Weight Packing)” 这项关键技术。 这项技术并不是单一的某个方法,而是一系列优化策略的统称。它的核心目标非常明确:在保证模型效果的同时,大幅提升大模型的推理性能(速度 阅读全文
posted @ 2025-06-19 17:00 jack-chen666 阅读(239) 评论(0) 推荐(0)
摘要:这段代码的核心目标是高效、安全地将预训练好的大模型权重从硬盘加载到内存(或指定的计算设备)中,并正确地赋值给 nn.Module 模型实例的各个参数。vLLM 是一个为大语言模型(LLM)推理设计的、非常高效的库,因此它的权重加载逻辑也经过了特殊优化,以处理模型并行、量化等复杂情况。 下面我们将逐行 阅读全文
posted @ 2025-06-19 16:41 jack-chen666 阅读(441) 评论(0) 推荐(0)
摘要:safetensor 权重文件的加载 详细过程 深入理解大模型 Safetensors 权重文件的加载过程 作为一名大模型算法工程师,你肯定知道权重文件对于模型的运行至关重要。传统的 PyTorch 模型权重通常保存为 .bin 或 .pth 格式,这些格式在加载时存在一些安全隐患和效率问题。而 S 阅读全文
posted @ 2025-06-19 00:10 jack-chen666 阅读(883) 评论(0) 推荐(0)
摘要:BitVLA:首个面向机器人操作的1-bit VLA模型 https://mp.weixin.qq.com/s/WBETJE1DavXKUZCu3GxDbg BridgeVLA:基于视觉 - 语言模型的输入 - 输出对齐高效 3D 操作学习(字节最新) https://mp.weixin.qq.co 阅读全文
posted @ 2025-06-15 16:54 jack-chen666 阅读(98) 评论(0) 推荐(0)
摘要:目录ros2命令RVIZ2数据可视化调试小工具RQT时光记录仪之ros2 bag仿真工具-Gazebo ros2命令 Commands: action Various action related sub-commands bag Various rosbag related sub-command 阅读全文
posted @ 2025-06-12 12:02 jack-chen666 阅读(113) 评论(0) 推荐(0)
摘要:目录1. launch工具launch 修改与添加参数 1. launch工具 一个机器人系统,往往由很多个不同功能的节点组成,启动一个机器人系统时往往需要启动多个节点,同时根据应用场景和机器人的不同,每个节点还会有不同的配置项。 如果每个节点我们都开一个新终端,敲ros2 run指令并写一堆参数, 阅读全文
posted @ 2025-06-12 11:21 jack-chen666 阅读(363) 评论(0) 推荐(0)
摘要:目录1 ROS2的参数Param2 生命周期节点 1 ROS2的参数Param 本质用服务实现的 ros2 service list 启动乌龟模拟器 ros2 run turtlesim turtlesim_node 用于操作节点参数的servive /turtlesim/describe_para 阅读全文
posted @ 2025-06-12 10:52 jack-chen666 阅读(81) 评论(0) 推荐(0)
摘要:目录1.通信机制对比 1.通信机制对比 Topic 一种轻量级的通信方式,用于实现发布-订阅模式,即一个节点发布数据,另一个节点订阅数据。 一种单向的通信方式,发布者发布数据后,无法获知数据是否被订阅者成功接收。 数据类型可以是ROS中定义的任意消息类型。 常见的使用话题实现的场景包括传感器数据的传 阅读全文
posted @ 2025-06-11 09:13 jack-chen666 阅读(272) 评论(0) 推荐(0)
摘要:目录ROS2中的action通信控制机器人移动到点创建example_action_rclcpp功能包,python实现 ROS2中的action通信 ROS2中四大通信利器中话题、服务、参数这三个, 最后一个Action。 话题topic适用于节点间单向的频繁的数据传输 服务service则适用于 阅读全文
posted @ 2025-06-10 21:50 jack-chen666 阅读(211) 评论(0) 推荐(0)
摘要:目录参数的cpp实现python版 参数的cpp实现 如何接收到参数并将其应用的? ROS2的RCLCPP中参数相关的API实现对ROS2打印的日志级别控制。 ROS2将日志分为五个级别: RCLCPP_DEBUG(this->get_logger(), "我是DEBUG级别的日志,我被打印出来了! 阅读全文
posted @ 2025-06-10 19:45 jack-chen666 阅读(90) 评论(0) 推荐(0)
摘要:目录开环与闭环通信方式-Param通信 开环与闭环 开环控制 机器人按照预先设定的命令执行任务,但并不会对执行过程中的状态进行反馈和调整, 也就是机器人盲目地按照指令执行任务,不考虑实际执行情况是否符合预期。 优点简单易用,适用于一些简单的任务,如基本的运动控制或简单的搬运。 缺点是机器人无法感知执 阅读全文
posted @ 2025-06-10 17:08 jack-chen666 阅读(66) 评论(0) 推荐(0)
摘要:目录源码安装设置GRADLE_HOME将gradle添加到PATH验证配置null FastDDS的安装和体验 源码安装 apt upgrade apt install python3-colcon-common-extensions zip openjdk-8-jdk -y pip3 instal 阅读全文
posted @ 2025-06-10 17:08 jack-chen666 阅读(102) 评论(0) 推荐(0)
摘要:目录类型扩展(套娃)第一层套娃第二层套娃第三层套娃 原始数据类型与包装类型 在接口文件中定义通信过程中所使用的数据类型和数据名称 可用的数据类型和数据名称有哪些? 数据名称就是一个字符串,没啥好说的,符合编程语言变量的命名规则就行 数据类型有哪些? 原始的数据类型只有九类(每一个都可以在后面加上[] 阅读全文
posted @ 2025-06-10 15:30 jack-chen666 阅读(105) 评论(0) 推荐(0)
摘要:目录1.接口2. 接口 开发继续丰富 机器人 以及 控制 相关逻辑4. 测试py实现 1.接口 接口其实是一种规范 std_msgs/msg/String std_msgs/msg/UInt32 ROS2中定义了一个统一的接口叫做sensor_msgs/msg/LaserScan 每个雷达的厂家都会 阅读全文
posted @ 2025-06-10 11:34 jack-chen666 阅读(203) 评论(0) 推荐(0)
摘要:目录1.服务2. 服务的cpp实现3.服务端4. 客户端python版 1.服务 Client-Server Request-Response 话题Pub/Sub是没有返回的,适用于单向或大量的数据传递。 服务是双向的,客户端发送请求,服务端响应请求。 同一个服务(名称相同)有且只能有一个节点来提供 阅读全文
posted @ 2025-06-10 09:25 jack-chen666 阅读(72) 评论(0) 推荐(0)
摘要:目录RCLCPP实现topic操作发布者的创建消息的interface编写订阅者效果4.python版效果 RCLCPP实现topic操作 RCLCPP为Node类提供了丰富的API接口,其中就包括创建话题发布者和创建话题订阅者。 控制节点+被控节点 控制节点创建一个话题发布者,发布控制命令(com 阅读全文
posted @ 2025-06-09 20:35 jack-chen666 阅读(141) 评论(0) 推荐(0)
摘要:目录1.订阅发布模型2.消息3. rqt_graph4. ros2 topic 1.订阅发布模型 ✅ 1 对 1 单一发布者 → 单一订阅者 ✅ 1 对 N 一发布,多订阅 ✅ N 对 1 多发布,单订阅 ✅ N 对 N 多发布,多订阅 2.消息 为了方便发送者和接收者进行数据的交换,ROS2帮我们 阅读全文
posted @ 2025-06-09 17:27 jack-chen666 阅读(126) 评论(0) 推荐(0)
摘要:目录1.构建系统与构建工具2.ROS2节点发现与多机通信3. 通信4.通信中间件ZMQ 1.构建系统与构建工具 构建系统:只针对一个单独的包进行构建,例如:CMake、Python setuptools、ament_cmake、catkin 构建工具:根据功能包的依赖关系 完成一系列功能包的构建,例 阅读全文
posted @ 2025-06-09 16:58 jack-chen666 阅读(208) 评论(0) 推荐(0)
摘要:目录1. cpp版本2. python版本 导航框架Nav2、 机械臂运动控制框架Moveit 1. cpp版本 cd chapt2_ws/src/example_cpp/src vi node_03.cpp #include "rclcpp/rclcpp.hpp" /* 创建一个类节点,名字叫做N 阅读全文
posted @ 2025-06-09 15:47 jack-chen666 阅读(30) 评论(0) 推荐(0)
摘要:目录1. rclcpp2. rclpy 1. rclcpp mkdir -p chapt2_ws/src/ && cd chapt2_ws/src ros2 pkg create example_cpp --build-type ament_cmake --dependencies rclcpp e 阅读全文
posted @ 2025-06-09 10:30 jack-chen666 阅读(63) 评论(0) 推荐(0)
摘要:目录ros2 基本命令2. 功能包.3. colcon ros2 基本命令 ros2 run <package_name> <executable_name> ros2 run turtlesim turtlesim_node ros2 node list ros2 node info <node_ 阅读全文
posted @ 2025-06-09 10:03 jack-chen666 阅读(53) 评论(0) 推荐(0)
摘要:目录1. 使用g++编译ROS2节点g++来编译first_node节点2. make命令编译4. 使用CMakeLists.txt编译5. CMake 依赖查找流程 1. 使用g++编译ROS2节点 动态链接库 gcc/g++ 链接库的编译与链接_surgewong的博客-CSDN博客_g++ 使 阅读全文
posted @ 2025-06-07 18:14 jack-chen666 阅读(158) 评论(0) 推荐(0)
摘要:目录1. 参考 1. 参考 https://zhuanlan.zhihu.com/p/639234090 ROS2前世今生 ROS与ROS2对比 动手安装ROS2 ROS2初体验 ROS2系统架构 中间件DDS架构 背景描述 通读一下 有个大致的了解即可 本篇的目的是实现 ROS2的安装 容器化一键 阅读全文
posted @ 2025-06-07 17:32 jack-chen666 阅读(62) 评论(0) 推荐(0)