啊哈哈哈哈312

2026年3月15日

VitaBench: Benchmarking LLM Agents with Versatile Interactive Tasks in Real-world Applications

摘要：论文标题：VitaBench: Benchmarking LLM Agents with Versatile Interactive Tasks in Real-world Applications 作者：Meituan LongCat Team（美团 LongCat 团队）机构：美团、复旦大学阅读全文

posted @ 2026-03-15 19:58 啊哈哈哈哈312 阅读(68) 评论(0) 推荐(0)

WebVoyager：基于大型多模态模型构建端到端 Web 智能体

摘要：论文：WebVoyager: Building an End-to-End Web Agent with Large Multimodal Models 作者：Hongliang He, Wenlin Yao, Kaixin Ma, Wenhao Yu, Yong Dai, Hongming Zha 阅读全文

posted @ 2026-03-15 18:15 啊哈哈哈哈312 阅读(80) 评论(0) 推荐(0)

AReaL: A Large-Scale Asynchronous Reinforcement Learning System for Language Reasoning

摘要：论文：AReaL: A Large-Scale Asynchronous Reinforcement Learning System for Language Reasoning 作者：Wei Fu 等（清华大学 IIIS、蚂蚁集团、香港科技大学）发表于 NeurIPS 2025 | arXiv: 阅读全文

posted @ 2026-03-15 16:40 啊哈哈哈哈312 阅读(112) 评论(0) 推荐(0)

2026年3月8日

SimpleVQA: Multimodal Factuality Evaluation for Multimodal Large Language Models

摘要：背景 LLM文本模型存在SimpleQA和Chinese SimpleQA检验幻觉问题，但MLLM在此类benchmark中有缺失，因此作者提出了Simple VQA。数据集特点数据集基本信息：该数据集旨在评估模型的两个特性：视觉理解能力：指模型能否准确识别出图像中被提问的主体真实世界知识阅读全文

posted @ 2026-03-08 20:34 啊哈哈哈哈312 阅读(75) 评论(0) 推荐(0)

2024年11月27日

LLMs Learn Task Heuristics from Demonstrations: A Heuristic-Driven Prompting Strategy for Document-Level Event Argument Extraction

摘要： 1. 概述关于基于COT的Prompt构造有很多的研究，例如：CoT (Wei et al., 2022), Automate-CoT (Shum et al., 2023), Auto-CoT (Zhang et al., 2023), Iter-CoT (Sun et al., 2023), 阅读全文

posted @ 2024-11-27 16:18 啊哈哈哈哈312 阅读(159) 评论(0) 推荐(0)

2024年11月15日

SELF-REFINE: Iterative Refinement with Self-Feedback

摘要： 1. 概述基于给定的Prompt，大语言模型生成的Reponse可能不是最好的（这一点我认为当前的LLM大部分都是Decoder架构，基于已生成的结果产生下一个Token，一旦之前生成结果出错，也不容易及时改正。）。本文为原始的生成添加了额外的反思重写步骤，过程如下：对于给定的\(Input\ 阅读全文

posted @ 2024-11-15 17:09 啊哈哈哈哈312 阅读(665) 评论(0) 推荐(0)

2024年11月1日

Unleashing Reasoning Capability of LLMs via Scalable Question Synthesis from Scratch

摘要： 1. 概述 LLM的SFT数据合成工作不可避免的可以划分为多个阶段：指令合成响应合成数据筛选。本篇文章采用了传统LLM的训练过程（SFT+DPO）进行数据合成。在领域专有模型（DeepSeekMath7B-RL，Qwen2-Math-7BInstruct）的基础上，指令合成：通过QFT（阅读全文

posted @ 2024-11-01 19:52 啊哈哈哈哈312 阅读(465) 评论(0) 推荐(0)

2023年12月26日

Redis设计与实现-15.复制

摘要： redis可以通过SLAVEOF命令去复制（同步）另一台服务器，例如：当前有两台redis服务器其信息为： hostname ip port redis_1 127.0.0.1 6379 redis_2 127.0.0.1 12345 如果redis_2想要同步redis_1的内容，可以在redi 阅读全文

posted @ 2023-12-26 18:01 啊哈哈哈哈312 阅读(31) 评论(0) 推荐(0)

2023年9月18日

分布式一致性算法——Raft

摘要： Raft Leader Election 背景介绍 Raft是一种用于管理Log的分布式一致性算法，在了解Raft之前首先需要了解为什么需要Log? 对于不同的系统，无论是中间件疑惑是其余的系统，我们如果想要求其满足CAP协议中的一致性，需要尽量保证多节点的数据是相同的，也就是所谓的“共识”。下文中阅读全文

posted @ 2023-09-18 15:01 啊哈哈哈哈312 阅读(132) 评论(0) 推荐(0)

2023年9月3日

深入理解Linux内核——内存管理（4）——伙伴系统（1）

摘要：提要：本系列文章主要参考`MIT 6.828课程`以及两本书籍`《深入理解Linux内核》` `《深入Linux内核架构》`对Linux内核内容进行总结。内存管理的实现覆盖了多个领域： 1. 内存中的物理内存页的管理 2. 分配大块内存的伙伴系统 3. 分配较小内存的slab、slub、slob分阅读全文

posted @ 2023-09-03 23:47 啊哈哈哈哈312 阅读(1217) 评论(0) 推荐(1)

Loading

yanlishao

公告