摘要: 大模型的架构主要可分为编码器(Encoder)、解码器(Decoder)、编码器 - 解码器(Encoder-Decoder) 三大类,不同架构适用于不同的任务场景。 一、 编码器架构(Encoder-only) 核心思想:基于双向注意力机制,能够完整捕捉输入序列的上下文信息,擅长理解类任务。 核心 阅读全文
posted @ 2025-12-26 13:30 wangssd 阅读(13) 评论(0) 推荐(0)
摘要: 1. 风景视频类型(无需对口型) 1. 文本输入模块 职责:接收用户的原始文本(支持纯文本、带情绪标注的文本,比如[欢快]今天天气很好),做基础校验(非空、长度限制)。 设计要点:支持文本分段(比如按句号 / 逗号拆分,匹配视频镜头节奏)、保留文本的情绪 / 语速标注。 2. 文本处理与拆分模块 职 阅读全文
posted @ 2025-12-26 11:00 wangssd 阅读(7) 评论(0) 推荐(0)