Loading

摘要: 论文标题:VitaBench: Benchmarking LLM Agents with Versatile Interactive Tasks in Real-world Applications 作者:Meituan LongCat Team(美团 LongCat 团队) 机构:美团、复旦大学 阅读全文
posted @ 2026-03-15 19:58 啊哈哈哈哈312 阅读(8) 评论(0) 推荐(0)
摘要: 论文:WebVoyager: Building an End-to-End Web Agent with Large Multimodal Models 作者:Hongliang He, Wenlin Yao, Kaixin Ma, Wenhao Yu, Yong Dai, Hongming Zha 阅读全文
posted @ 2026-03-15 18:15 啊哈哈哈哈312 阅读(8) 评论(0) 推荐(0)
摘要: 论文:AReaL: A Large-Scale Asynchronous Reinforcement Learning System for Language Reasoning 作者:Wei Fu 等(清华大学 IIIS、蚂蚁集团、香港科技大学) 发表于 NeurIPS 2025 | arXiv: 阅读全文
posted @ 2026-03-15 16:40 啊哈哈哈哈312 阅读(53) 评论(0) 推荐(0)
摘要: 背景 LLM文本模型存在SimpleQA和Chinese SimpleQA检验幻觉问题,但MLLM在此类benchmark中有缺失,因此作者提出了Simple VQA。 数据集特点 数据集基本信息: 该数据集旨在评估模型的两个特性: 视觉理解能力:指模型能否准确识别出图像中被提问的主体 真实世界知识 阅读全文
posted @ 2026-03-08 20:34 啊哈哈哈哈312 阅读(14) 评论(0) 推荐(0)
摘要: 1. 概述 关于基于COT的Prompt构造有很多的研究,例如:CoT (Wei et al., 2022), Automate-CoT (Shum et al., 2023), Auto-CoT (Zhang et al., 2023), Iter-CoT (Sun et al., 2023), 阅读全文
posted @ 2024-11-27 16:18 啊哈哈哈哈312 阅读(151) 评论(0) 推荐(0)
摘要: 1. 概述 基于给定的Prompt,大语言模型生成的Reponse可能不是最好的(这一点我认为当前的LLM大部分都是Decoder架构,基于已生成的结果产生下一个Token,一旦之前生成结果出错,也不容易及时改正。)。 本文为原始的生成添加了额外的反思重写步骤,过程如下: 对于给定的\(Input\ 阅读全文
posted @ 2024-11-15 17:09 啊哈哈哈哈312 阅读(507) 评论(0) 推荐(0)
摘要: 1. 概述 LLM的SFT数据合成工作不可避免的可以划分为多个阶段: 指令合成 响应合成 数据筛选。 本篇文章采用了传统LLM的训练过程(SFT+DPO)进行数据合成。 在领域专有模型(DeepSeekMath7B-RL,Qwen2-Math-7BInstruct)的基础上, 指令合成:通过QFT( 阅读全文
posted @ 2024-11-01 19:52 啊哈哈哈哈312 阅读(431) 评论(0) 推荐(0)
摘要: redis可以通过SLAVEOF命令去复制(同步)另一台服务器,例如: 当前有两台redis服务器其信息为: hostname ip port redis_1 127.0.0.1 6379 redis_2 127.0.0.1 12345 如果redis_2想要同步redis_1的内容,可以在redi 阅读全文
posted @ 2023-12-26 18:01 啊哈哈哈哈312 阅读(29) 评论(0) 推荐(0)
摘要: Raft Leader Election 背景介绍 Raft是一种用于管理Log的分布式一致性算法,在了解Raft之前首先需要了解为什么需要Log? 对于不同的系统,无论是中间件疑惑是其余的系统,我们如果想要求其满足CAP协议中的一致性,需要尽量保证多节点的数据是相同的,也就是所谓的“共识”。下文中 阅读全文
posted @ 2023-09-18 15:01 啊哈哈哈哈312 阅读(122) 评论(0) 推荐(0)
摘要: 提要:本系列文章主要参考`MIT 6.828课程`以及两本书籍`《深入理解Linux内核》` `《深入Linux内核架构》`对Linux内核内容进行总结。 内存管理的实现覆盖了多个领域: 1. 内存中的物理内存页的管理 2. 分配大块内存的伙伴系统 3. 分配较小内存的slab、slub、slob分 阅读全文
posted @ 2023-09-03 23:47 啊哈哈哈哈312 阅读(1075) 评论(0) 推荐(1)