AIGC技术 - 随笔分类 - 向着朝阳

问题确实追问是SFT vs workflow

摘要：目录一、从“场景”维度来看：确定性 vs 灵活性1. 什么时候该用 Workflow（代码/状态机）追问？2. 什么时候该用 SFT（大模型）追问？二、从“技术架构”维度来看：ReAct vs 意图+Workflow1. 架构 A：ReAct 绑定一大堆 Tools（通用型 Agent）2. 架阅读全文

posted @ 2026-04-06 11:28 向着朝阳阅读(11) 评论(0) 推荐(0)

强化学习训练PAPO方法

摘要：目录为什么“分开归一化”这么关键？PAPO 训练怎么实现（通俗版）第 1 步：对同一个题目，生成一组回答第 2 步：给每个回答打“结果分”（ORM）第 3 步：给回答打“过程分”（PRM）第 4 步：关键改造——“分开归一化”4.1 结果优势 (A_out)伪代码这段代码的关键点（你记这3句就够）如阅读全文

posted @ 2026-03-31 08:39 向着朝阳阅读(9) 评论(0) 推荐(0)

WebUI -主要参数配置

摘要：目录1) Sampling Steps（步数）2) CFG Scale（提示词遵循度）3) Sampler（采样器）+ Scheduler4) Seed（随机种子）5) Size（分辨率）6) Batch size / Batch count7) Hires.fix（高清修复）8) Denoisin 阅读全文

posted @ 2026-03-30 21:43 向着朝阳阅读(23) 评论(0) 推荐(0)

Denoising strength（在 img2img / inpaint 很关键）

摘要：目录一句话先记住它到底在做什么（原理直觉）在不同模式下怎么理解1) img2img（整图改造）2) inpaint（局部重绘）最实用的区间建议（直接抄）和 Steps 的关系（你也会遇到）常见误区给你一个可执行的小实验（最快理解）非常好的问题。这个参数确实是 img2img / inpaint 里阅读全文

posted @ 2026-03-30 21:41 向着朝阳阅读(21) 评论(0) 推荐(0)

WebUI 提示词如何编写

摘要：目录1) 基本结构（最实用）2) 一个可直接用的模板正向模板负向模板3) 示例（写实人像）正向负向4) 示例（二次元）正向负向5) 提示词实战规则（重点）6) 常见问题好问题。A1111（或同类 WebUI）里提示词写法可以用一个固定模板，先稳，再慢慢玩花样。 1) 基本结构（最实用）正向 Pr 阅读全文

posted @ 2026-03-30 21:30 向着朝阳阅读(12) 评论(0) 推荐(0)

Diffusion学习路径

摘要：目录学习路径（建议 6 阶段）阶段 1：先跑通（1周）阶段 2：核心原理（1周）阶段 3：可控生成（1-2周）阶段 4：代码化与工程化（1-2周）阶段 5：训练与定制（2周）阶段 6：产品化 MVP（1-2周）你是 Agent 工程师的特别建议最短闭环（你现在就可以做）非常好，这个问题问得对。你阅读全文

posted @ 2026-03-29 17:46 向着朝阳阅读(38) 评论(0) 推荐(0)

Difussion 家族

摘要：目录一、模型层（真正“生成图片”的核心）1.1 开源模型（可私有化部署）1.1.1 Stable Diffusion 系列（SD1.5 / SDXL / SD3.x）1.1.2 FLUX.1（BFL）1.1.3 其他开源主流（补充）1.2 闭源模型（API/平台服务）1.2.1 Midjourney 阅读全文

posted @ 2026-03-29 14:52 向着朝阳阅读(18) 评论(0) 推荐(0)

文生图学习步骤

摘要：目录一、学习路线总览二、分阶段详细计划阶段 1：先跑通一张图目标你要学什么用什么技术方案 A：零代码体验（推荐先用这个）方案 B：代码方式硬件要求阶段产出阶段 2：学会控制风格（LoRA）目标你要学什么用什么技术下载 LoRA加载 LoRA实践任务阶段产出阶段 3：学会控制构图（ControlNet 阅读全文

posted @ 2026-03-27 08:46 向着朝阳阅读(18) 评论(0) 推荐(0)

智能穿搭-技术实现

摘要：目录一、智能穿搭要解决哪几个核心问题1. 理解用户长什么样2. 理解服装是什么样的3. 把衣服"穿"到用户身上4. 推荐什么搭配好看二、涉及的核心技术栈模块 1：人体解析（Human Parsing）干什么为什么需要常用技术模块 2：人体姿态估计（Pose Estimation）干什么为什么需要常用阅读全文

posted @ 2026-03-27 08:36 向着朝阳阅读(43) 评论(0) 推荐(0)

Agent 用户连续输入解决

摘要：目录一、先说结论核心原则二、为什么这是个大问题？灾难 1：并发两个 graph run灾难 2：状态污染灾难 3：工具浪费三、最推荐的总体架构四、会话调度器要做什么？1. 当前是否有运行中的 graph2. 消息缓冲区3. 当前轮次状态4. 中断策略五、你需要定义 3 种新消息处理策略策略 A：Ap 阅读全文

posted @ 2026-03-25 08:15 向着朝阳阅读(36) 评论(0) 推荐(0)

GUI Agent 产品

摘要：目录一、最受关注的 GUI Agent 产品/能力1. OpenAI Operator是什么能力特点为什么火适合场景2. Anthropic 的 Computer Use是什么能力特点为什么火适合场景3. Microsoft / Windows Copilot 类电脑操作方向是什么特点为什么值得关注阅读全文

posted @ 2026-03-24 08:45 向着朝阳阅读(38) 评论(0) 推荐(0)

Playwright UI自动化测试

摘要：目录一、先说结论：Playwright 搭建 UI 自动化的标准步骤二、Playwright 适合什么三、推荐语言四、Python 版：从 0 搭建1. 安装安装 Playwright安装浏览器驱动2. 创建最简单的脚本五、真正做 UI 自动化测试，建议配合 pytest六、推荐直接用 Playwr 阅读全文

posted @ 2026-03-24 08:44 向着朝阳阅读(117) 评论(0) 推荐(0)

GUI-Agent方向

摘要：目录一、最受关注的 GUI Agent 产品/能力1. OpenAI Operator是什么能力特点为什么火适合场景2. Anthropic 的 Computer Use是什么能力特点为什么火适合场景3. Microsoft / Windows Copilot 类电脑操作方向是什么特点为什么值得关注阅读全文

posted @ 2026-03-23 08:41 向着朝阳阅读(33) 评论(0) 推荐(0)

强化学习 OS-Themis-对GUI AGENT

摘要：目录一、原文中文翻译二、通俗易懂版解释1. 他们在解决什么问题？2. 为什么奖励函数难做？3. 他们提出的 OS-Themis 是什么？OS-Themis 怎么改进？第一步：把整个操作过程拆成几个关键里程碑第二步：多智能体分别检查这些证据第三步：做复核4. 这套方法为什么更厉害？5. OGRBenc 阅读全文

posted @ 2026-03-23 08:34 向着朝阳阅读(73) 评论(0) 推荐(0)

opencraw不同场景-搜索引擎接入

摘要：目录三个场景的本质区别场景一：金融资讯 → 搜索引擎 API场景二：闲鱼 → 搜索引擎搞不定场景三：电商热品 → 混合方案我的综合推荐方案如果预算有限（纯免费方案）如果可以投入一点费用你的需求范围比纯股票资讯大很多，涉及三个很不一样的场景，不能只靠一个搜索引擎搞定。我帮你分类分析：三个场景的本阅读全文

posted @ 2026-03-22 21:16 向着朝阳阅读(56) 评论(0) 推荐(0)

图搜索在电商实现

摘要：目录1. 整体实现流水线（生产可用）Step A：识别这是“兼容/搭配”意图（Router）Step B：抽取结构化槽位（Slot Filling）Step C：Graph 检索（多跳推理）Step D：候选排序与业务过滤Step E：生成回答（LLM）2. 图谱（KG）怎么建：节点、关系、关键字段阅读全文

posted @ 2026-03-22 08:14 向着朝阳阅读(10) 评论(0) 推荐(0)

Neo4j vs NebulaGraph

摘要：目录先澄清+核心对比：Library Graph（拼写纠正）& NebulaGraph vs Neo4j一、先澄清：“Library Graph” & NebulaGraph 基础1. “Library Graph”（图库）的含义2. NebulaGraph 核心定位二、NebulaGraph vs 阅读全文

posted @ 2026-03-15 10:34 向着朝阳阅读(132) 评论(0) 推荐(0)

LightRAG VS GraphRAG

摘要：目录LightRAG vs GraphRAG：深度对比与选型指南一、核心架构与设计理念对比二、性能与成本对比（关键差异）1. 检索效率与延迟2. 资源消耗与成本3. 推理能力三、核心优势与局限性LightRAG 核心优势LightRAG 局限性GraphRAG 核心优势GraphRAG 局限性四、适阅读全文

posted @ 2026-03-15 10:33 向着朝阳阅读(196) 评论(0) 推荐(0)

RAG几种技术组合向量检索 GraphRAG PageIndex ES

摘要：目录一、三种 RAG 技术的对比与使用场景1. 传统检索（如 BM25、Elasticsearch）2. 标准 RAG（向量召回 Vector Retrieval）3. GraphRAG（知识图谱 RAG）二、不同技术之间是否可以搭配使用？（绝对可以，且必须搭配）搭配方案 1：向量检索 + 关键阅读全文

posted @ 2026-03-13 08:43 向着朝阳阅读(118) 评论(0) 推荐(0)

GraphRAG

摘要：目录执行生成GraphRAG embeding模型和生成模型1. embedding_models（向量/嵌入模型）2. completion_models（补全/生成模型）3. 一句话对照安装 # GraphRAG - Microsoft 图检索增强生成 # Python 3.10–3.12 g 阅读全文

posted @ 2026-03-12 08:13 向着朝阳阅读(27) 评论(0) 推荐(0)

aibi1

随笔分类 - AIGC技术

公告