2025 年 12月 26 日随笔档案 - wangssd

2025年12月26日

编码器(Encoder) / 解码器(Decoder) / 编码器-解码器(Encoder-Decoder)架构

摘要：大模型的架构主要可分为编码器（Encoder）、解码器（Decoder）、编码器 - 解码器（Encoder-Decoder）三大类，不同架构适用于不同的任务场景。一、编码器架构（Encoder-only）核心思想：基于双向注意力机制，能够完整捕捉输入序列的上下文信息，擅长理解类任务。核心阅读全文

posted @ 2025-12-26 13:30 wangssd 阅读(13) 评论(0) 推荐(0)

llm 视频/语音对齐（风景视频/虚拟主播）

摘要： 1. 风景视频类型（无需对口型） 1. 文本输入模块职责：接收用户的原始文本（支持纯文本、带情绪标注的文本，比如[欢快]今天天气很好），做基础校验（非空、长度限制）。设计要点：支持文本分段（比如按句号 / 逗号拆分，匹配视频镜头节奏）、保留文本的情绪 / 语速标注。 2. 文本处理与拆分模块职阅读全文

posted @ 2025-12-26 11:00 wangssd 阅读(7) 评论(0) 推荐(0)

wangssd

公告