从命令行到桌面自动化：AI辅助创作的黄金方案

你没有在让AI写长篇小说时，发现它总忘掉前面精心埋下的伏笔？

更糟的是，为了让AI记住那几十万字的复杂设定，每次都得花掉巨额Token，账单让人肉疼。我在这条路上摸索了很久，从命令行敲指令，到最终封装成一个自动化桌面软件，底层架构的每一次选择，都直接决定了作品质量是封神还是扑街。

今天咱们就来聊聊，CLI 和 SDK 到底怎么选，以及让AI真正“长记性”的终极方案：RAG 和上下文缓存，到底谁才是长篇创作的救星。

日常和AI打交道无非两种姿势。

第一种是终端里敲命令行，就像你对面坐着一个真人助理，你问一句他答一句，所见即所得。这玩意儿擅长解决眼前的小麻烦：修个Bug、润色一段干瘪的文字、卡文时抛个灵感。优点是省钱，因为每次只瞄一眼你光标附近的几行字，Token消耗很低。但它的致命伤是记性太差。写到第108章时，想让它兼顾前10章的伏笔，你得手动把几千字背景资料复制粘贴给它，极其痛苦。

另一种是写死自动化流程的程序，它像一个没有感情的工厂，你预设好规则，它就在后台批量运作：拉取大纲、生成五章草稿、自动挑逻辑毛病，一气呵成。但问题来了，为了保证内容不跑偏，每次执行都得把几十万字的世界观、全卷大纲一股脑儿喂进去，单次任务消耗几万甚至十几万Token，烧钱如流水。所以说，CLI是把手术刀，适合精雕细琢；SDK程序是战略指挥中心，适合大批量生产，但必须解决“记背景代价太高”这个核心矛盾。

为了解决记忆成本问题，业界折腾出两套方案。

第一套叫RAG，检索增强生成，它把几十万字的设定切成几千个小碎片存进数据库，写喝酒剧情时就去搜带“酒”和人物名字的碎片喂给AI。这招省钱，直接砍掉七八成成本，但对小说创作却是一场灾难——极容易导致人设崩塌。因为碎片化让AI丧失了上帝视角。比如第20章埋的伏笔是“这杯酒里有毒”，AI没搜到那片碎片，就会写出两人举杯交心、称兄道弟的弱智剧情，伏笔直接废掉。

第二套叫上下文缓存（Context Caching），比如 Gemini 的 Cache 机制，它不切碎任何数据，直接把几万字的核心设定、大纲和人物面板原封不动存放在官方服务器内存里。结果呢？绝对100%保真！AI拥有全局视角，绝不吃设定，草蛇灰线接得严丝合缝。而且缓存的读取价格便宜，大概是原来的四分之一，既保住了质量又降了成本。所以结论很明确：企业查规章信息用RAG最好；但搞长篇小说或剧本杀引擎，上下文缓存就是唯一的黄金方案。

光有好记性还不够，得让AI干活更稳更准。

我们平时瞎聊时灵光一现的提示词，不能直接写进程序，要把它变成高度结构化的技能，我们叫SKILL。它是一个封装好的“打工人”，有明确的身份指令，比如你是个网文老编辑；预留了变量槽位，让程序自动填入当前章节内容；并强制要求AI按JSON格式输出，不许废话。而SOP就是流水线的图纸，负责编排SKILL的执行顺序：先让“大纲提炼SKILL”干活，拿着结果再交给“正文生成SKILL”撰写书稿。

一个成熟的SKILL，本质上就是经过提纯、参数化、结构化封装的Prompt。它包含角色基座，确立Agent的身份边界与专业倾向；指令，用明确的动作动词规定目标；变量注入点，像{{core_setting}}在运行时动态填入上下文；输出契约，严格限制格式，比如强制输出特定结构的JSON；还有超参数，绑定好Temperature等模型参数。这样打个比喻，AI写作软件就像一座工厂，SKILL是加工点，SOP是流水线车床。

文学创作需要不停试错，一上来就用程序锁死流程绝对会卡壳，也影响效率。最丝滑的工程架构分三步走。

第一步，手动探索。先不写代码，直接用 agy CLI 命令行，用大白话试探AI技能，反复微调，直到试出一段特别好用、怎么写都不会OOC的提示词，这就提炼出了一个SKILL。

第二步，资产剥离。把试成功的SKILL写成一个JSON或Markdown配置文件存在电脑里，从此你的创作手法就从脑子里的灵感变成了可随时调用的数据资产。

第三步，程序固化。在你的跨平台桌面软件上加个按钮，一点按钮，后台程序，比如用Rust写的服务，就去读那个配置文件，把小说上下文塞进去，然后唤起本地CLI 自动化执行。

这套方案的无敌之处在于极致解耦。以后你顿悟出新的伏笔埋设手法，只要去改改那个文本配置文件就行了，完全不需要重新编译和打包桌面软件。你的软件永远跟得上你不断进化的创作理论。

2026年06月09日

posted @ 2026-06-11 11:34 金石碼农阅读(0) 评论(0) 收藏举报

刷新页面返回顶部

从命令行到桌面自动化：AI辅助创作的黄金方案

公告