摘要: HP-Edit: A Human-Preference Post-Training Framework for Image Editing 论文信息: arXiv:2604.19406 | CVPR 2026 | 华为诺亚方舟实验室 & 哈工大 & 南开大学 核心一句话: 用少量人工偏好标注训练 V 阅读全文
posted @ 2026-05-24 23:46 kiyoxi 阅读(2) 评论(0) 推荐(0)
摘要: EditThinker: Unlocking Iterative Reasoning for Any Image Editor 主要思想: 提出多轮编辑: 第一轮:输入原图、编辑指令,edit模型得到输出图;MLLM根据输入图、指令、输出图判断指令一致性,输出指令一致性反思、refine之后的指令、 阅读全文
posted @ 2026-05-22 22:30 kiyoxi 阅读(2) 评论(0) 推荐(0)
摘要: Claw-Eval: Towards Trustworthy Evaluation of Autonomous Agents — 深度分析报告 论文地址: https://arxiv.org/abs/2604.06132 项目主页: https://claw-eval.github.io arXiv 阅读全文
posted @ 2026-05-20 23:37 kiyoxi 阅读(10) 评论(0) 推荐(0)
摘要: 目录论文总结:RewardHarness: Self-Evolving Agentic Post-Training作者与机构核心问题核心思想方法架构整体流程1. Skills & Tools 库2. Orchestrator(编排器)3. Sub-Agent(子代理)4. 自进化循环实验结果主实验: 阅读全文
posted @ 2026-05-19 00:16 kiyoxi 阅读(9) 评论(0) 推荐(0)
摘要: win11进入wsl2安装的ubuntu wsl -d Ubuntu # 进入sudo sudo -i Claude code win11 安装过程 安装 # win 11 power shell # 配置代理 $env:HTTP_PROXY="http://127.0.0.1:7890" $env 阅读全文
posted @ 2026-05-15 00:08 kiyoxi 阅读(6) 评论(0) 推荐(0)