生成式AI——基础概念(一)

1、上下文窗口——发送给LLM的提示词和LLM的回复的完整历史记录就是上下文窗口。

       *实际上,你发送的每个新提示都包含你之前的的所有提示和模型的答复,LLM使用此完整历史记录作为上下文来创建下一个答案。

  *每个LLM都有一个最大上下文窗口大小,按模型和版本更改。如果对话超过上下文窗口大小,LLM会删除最旧的部分,并在答案中忽略它们

  *较长的上下文窗口意味着模型必须处理更多数据,可能会降低处理速度同时增加运算成本

  *上下文窗口大小使用标记,而不是单词

2、令牌/标记(Token)——LLM可以处理文本的最小部分

  *令牌可以是整个单词、部分字词或单个字符(具体取决于语言和标记器)

  *LLM根据提交的提示中令牌数量及生成回答所含的令牌数量来计费

  *不同LLM令牌价格有所不同,比如每100万个令牌的价格为20RMB

3、标记器(Tokenizer)——将文本分解为令牌/标记处理组件

  *标记器是人类语言和LLM之间的“翻译官”

  *标记器将人类语言转换成LLM可以理解处理的由数字构成的序列

4、序列(Sequence)——可以是由一个向量或多个向量组成的列表

  *比如:[标记1, 标记2, 标记3]

5、向量 (Vector)—— 指的是表示单个数据的一组数字(数组)

  *如标记1 对应的向量是 [0.1, 0.5, -0.9, ...]

6、标记化——人类语言转换为大预言模型“语言”过程

  当我们把一句话输入给模型时,转化过程是这样的:
  文本序列: "I love EFun"
  标记序列 (Token Sequence): 模型先把它切成 ID 序列,比如 [101, 255, 999]。这时候它还只是数字 ID 的序列。
  向量序列 (Vector Sequence): 模型通过“嵌入层”查找,把每个 ID 变成一个高维向量。
  101 ("I") 变成了向量 A
  255 ("love") 变成了向量 B
  999 ("EFun") 变成了向量 C
  此时,模型真正处理的输入是一个向量序列:[向量A, 向量B, 向量C]。

7、系统提示(System Prompt)——应用于每个聊天的规则

  *系统提示定义了LLM是谁,以及如何回话等

  *系统提示是LLM交互的基石,可以把它想象成计算机的操作系统或一个角色的剧本。它在对话开始前就被设定好,为LLM的行为划定了一个稳定的框架。

  *如系统提示对LLM做以下设定:      

    • 角色设定:定义模型的身份,例如“你是一个专业的Python程序员”或“你是一位友善的客服助手”。
    • 风格与语气:规定模型的表达方式,比如“回答要简洁、专业”或“使用幽默风趣的语言”。
    • 行为约束:设定安全与伦理边界,例如“禁止生成有害或偏见内容”。
    • 格式规范:指定输出的格式,如“始终使用Markdown格式”或“仅输出JSON”。

8、用户提示(User Prompt)——发送到LLM的内容,以及LLM回复的内容

  *用户提示告诉LLM要做什么

  *用户提示是用户在与LLM交互时输入的具体指令或问题。它相当于在操作系统上运行的应用程序,执行具体的任务。

  *如用户提示做以下内容:    

    • 下达任务:直接告诉模型需要完成的工作,例如“将下面这段话翻译成英文”或“帮我写一封请假邮件”。
    • 提供信息:为模型提供完成任务所需的上下文或具体数据。
    • 即时追问:在对话中根据模型的回答进行追问或调整方向,例如“能给我一个更便宜的方案吗?”。

9、系统提示和用户提示比较

特性系统提示 (System Prompt)用户提示 (User Prompt)
定义者 开发者或应用管理员 终端用户
作用范围 全局性,影响整个会话的行为准则 局部性,仅针对当前单次请求
持久性 稳定持久,在会话中保持不变 临时动态,随用户输入而变化
核心功能 设定角色、风格、规则和安全边界 提出具体问题、下达任务指令
可见性 通常对终端用户隐藏 用户直接可见并可编辑

    系统提示和用户提示通常是协同工作的。系统提示搭建舞台,用户提示上演剧目。

    系统提示:你是一个乐于助人的旅行规划助手。你的回答应该结构清晰,并优先推荐性价比高的选项。
    用户提示:我计划下个月去云南玩5天,预算5000元,请帮我规划一个行程。
  在这个例子中,系统提示确保了模型始终以“旅行规划助手”的身份,用“结构清晰、注重性价比”的风格来回答。而用户提示则提供了这次规划所需的具体信息(目的地、时长、预算)。

 

posted @ 2026-04-08 11:09  echo-efun  阅读(14)  评论(0)    收藏  举报