随笔分类 -  AIGC技术

摘要:目录一、 从“场景”维度来看:确定性 vs 灵活性1. 什么时候该用 Workflow(代码/状态机)追问?2. 什么时候该用 SFT(大模型)追问?二、 从“技术架构”维度来看:ReAct vs 意图+Workflow1. 架构 A:ReAct 绑定一大堆 Tools(通用型 Agent)2. 架 阅读全文
posted @ 2026-04-06 11:28 向着朝阳 阅读(11) 评论(0) 推荐(0)
摘要:目录为什么“分开归一化”这么关键?PAPO 训练怎么实现(通俗版)第 1 步:对同一个题目,生成一组回答第 2 步:给每个回答打“结果分”(ORM)第 3 步:给回答打“过程分”(PRM)第 4 步:关键改造——“分开归一化”4.1 结果优势 (A_out)伪代码这段代码的关键点(你记这3句就够)如 阅读全文
posted @ 2026-03-31 08:39 向着朝阳 阅读(9) 评论(0) 推荐(0)
摘要:目录1) Sampling Steps(步数)2) CFG Scale(提示词遵循度)3) Sampler(采样器)+ Scheduler4) Seed(随机种子)5) Size(分辨率)6) Batch size / Batch count7) Hires.fix(高清修复)8) Denoisin 阅读全文
posted @ 2026-03-30 21:43 向着朝阳 阅读(23) 评论(0) 推荐(0)
摘要:目录一句话先记住它到底在做什么(原理直觉)在不同模式下怎么理解1) img2img(整图改造)2) inpaint(局部重绘)最实用的区间建议(直接抄)和 Steps 的关系(你也会遇到)常见误区给你一个可执行的小实验(最快理解) 非常好的问题。这个参数确实是 img2img / inpaint 里 阅读全文
posted @ 2026-03-30 21:41 向着朝阳 阅读(21) 评论(0) 推荐(0)
摘要:目录1) 基本结构(最实用)2) 一个可直接用的模板正向模板负向模板3) 示例(写实人像)正向负向4) 示例(二次元)正向负向5) 提示词实战规则(重点)6) 常见问题 好问题。A1111(或同类 WebUI)里提示词写法可以用一个固定模板,先稳,再慢慢玩花样。 1) 基本结构(最实用) 正向 Pr 阅读全文
posted @ 2026-03-30 21:30 向着朝阳 阅读(12) 评论(0) 推荐(0)
摘要:目录学习路径(建议 6 阶段)阶段 1:先跑通(1周)阶段 2:核心原理(1周)阶段 3:可控生成(1-2周)阶段 4:代码化与工程化(1-2周)阶段 5:训练与定制(2周)阶段 6:产品化 MVP(1-2周)你是 Agent 工程师的特别建议最短闭环(你现在就可以做) 非常好,这个问题问得对。 你 阅读全文
posted @ 2026-03-29 17:46 向着朝阳 阅读(38) 评论(0) 推荐(0)
摘要:目录一、模型层(真正“生成图片”的核心)1.1 开源模型(可私有化部署)1.1.1 Stable Diffusion 系列(SD1.5 / SDXL / SD3.x)1.1.2 FLUX.1(BFL)1.1.3 其他开源主流(补充)1.2 闭源模型(API/平台服务)1.2.1 Midjourney 阅读全文
posted @ 2026-03-29 14:52 向着朝阳 阅读(18) 评论(0) 推荐(0)
摘要:目录一、学习路线总览二、分阶段详细计划阶段 1:先跑通一张图目标你要学什么用什么技术方案 A:零代码体验(推荐先用这个)方案 B:代码方式硬件要求阶段产出阶段 2:学会控制风格(LoRA)目标你要学什么用什么技术下载 LoRA加载 LoRA实践任务阶段产出阶段 3:学会控制构图(ControlNet 阅读全文
posted @ 2026-03-27 08:46 向着朝阳 阅读(18) 评论(0) 推荐(0)
摘要:目录一、智能穿搭要解决哪几个核心问题1. 理解用户长什么样2. 理解服装是什么样的3. 把衣服"穿"到用户身上4. 推荐什么搭配好看二、涉及的核心技术栈模块 1:人体解析(Human Parsing)干什么为什么需要常用技术模块 2:人体姿态估计(Pose Estimation)干什么为什么需要常用 阅读全文
posted @ 2026-03-27 08:36 向着朝阳 阅读(43) 评论(0) 推荐(0)
摘要:目录一、先说结论核心原则二、为什么这是个大问题?灾难 1:并发两个 graph run灾难 2:状态污染灾难 3:工具浪费三、最推荐的总体架构四、会话调度器要做什么?1. 当前是否有运行中的 graph2. 消息缓冲区3. 当前轮次状态4. 中断策略五、你需要定义 3 种新消息处理策略策略 A:Ap 阅读全文
posted @ 2026-03-25 08:15 向着朝阳 阅读(36) 评论(0) 推荐(0)
摘要:目录一、最受关注的 GUI Agent 产品/能力1. OpenAI Operator是什么能力特点为什么火适合场景2. Anthropic 的 Computer Use是什么能力特点为什么火适合场景3. Microsoft / Windows Copilot 类电脑操作方向是什么特点为什么值得关注 阅读全文
posted @ 2026-03-24 08:45 向着朝阳 阅读(38) 评论(0) 推荐(0)
摘要:目录一、先说结论:Playwright 搭建 UI 自动化的标准步骤二、Playwright 适合什么三、推荐语言四、Python 版:从 0 搭建1. 安装安装 Playwright安装浏览器驱动2. 创建最简单的脚本五、真正做 UI 自动化测试,建议配合 pytest六、推荐直接用 Playwr 阅读全文
posted @ 2026-03-24 08:44 向着朝阳 阅读(117) 评论(0) 推荐(0)
摘要:目录一、最受关注的 GUI Agent 产品/能力1. OpenAI Operator是什么能力特点为什么火适合场景2. Anthropic 的 Computer Use是什么能力特点为什么火适合场景3. Microsoft / Windows Copilot 类电脑操作方向是什么特点为什么值得关注 阅读全文
posted @ 2026-03-23 08:41 向着朝阳 阅读(33) 评论(0) 推荐(0)
摘要:目录一、原文中文翻译二、通俗易懂版解释1. 他们在解决什么问题?2. 为什么奖励函数难做?3. 他们提出的 OS-Themis 是什么?OS-Themis 怎么改进?第一步:把整个操作过程拆成几个关键里程碑第二步:多智能体分别检查这些证据第三步:做复核4. 这套方法为什么更厉害?5. OGRBenc 阅读全文
posted @ 2026-03-23 08:34 向着朝阳 阅读(73) 评论(0) 推荐(0)
摘要:目录三个场景的本质区别场景一:金融资讯 → 搜索引擎 API场景二:闲鱼 → 搜索引擎搞不定场景三:电商热品 → 混合方案我的综合推荐方案如果预算有限(纯免费方案)如果可以投入一点费用 你的需求范围比纯股票资讯大很多,涉及 三个很不一样的场景,不能只靠一个搜索引擎搞定。我帮你分类分析: 三个场景的本 阅读全文
posted @ 2026-03-22 21:16 向着朝阳 阅读(56) 评论(0) 推荐(0)
摘要:目录1. 整体实现流水线(生产可用)Step A:识别这是“兼容/搭配”意图(Router)Step B:抽取结构化槽位(Slot Filling)Step C:Graph 检索(多跳推理)Step D:候选排序与业务过滤Step E:生成回答(LLM)2. 图谱(KG)怎么建:节点、关系、关键字段 阅读全文
posted @ 2026-03-22 08:14 向着朝阳 阅读(10) 评论(0) 推荐(0)
摘要:目录先澄清+核心对比:Library Graph(拼写纠正)& NebulaGraph vs Neo4j一、先澄清:“Library Graph” & NebulaGraph 基础1. “Library Graph”(图库)的含义2. NebulaGraph 核心定位二、NebulaGraph vs 阅读全文
posted @ 2026-03-15 10:34 向着朝阳 阅读(132) 评论(0) 推荐(0)
摘要:目录LightRAG vs GraphRAG:深度对比与选型指南一、核心架构与设计理念对比二、性能与成本对比(关键差异)1. 检索效率与延迟2. 资源消耗与成本3. 推理能力三、核心优势与局限性LightRAG 核心优势LightRAG 局限性GraphRAG 核心优势GraphRAG 局限性四、适 阅读全文
posted @ 2026-03-15 10:33 向着朝阳 阅读(196) 评论(0) 推荐(0)
摘要:目录一、 三种 RAG 技术的对比与使用场景1. 传统检索(如 BM25、Elasticsearch)2. 标准 RAG(向量召回 Vector Retrieval)3. GraphRAG(知识图谱 RAG)二、 不同技术之间是否可以搭配使用?(绝对可以,且必须搭配)搭配方案 1:向量检索 + 关键 阅读全文
posted @ 2026-03-13 08:43 向着朝阳 阅读(118) 评论(0) 推荐(0)
摘要:目录执行生成GraphRAG embeding模型和生成模型1. embedding_models(向量/嵌入模型)2. completion_models(补全/生成模型)3. 一句话对照 安装 # GraphRAG - Microsoft 图检索增强生成 # Python 3.10–3.12 g 阅读全文
posted @ 2026-03-12 08:13 向着朝阳 阅读(27) 评论(0) 推荐(0)