Loading

摘要: 1. 系统架构概览 1.1 核心组件 视频预处理模块:负责视频解码、帧提取和预处理 视觉语言模型(VL Model):分析视频帧内容 向量数据库:存储分析结果和语义向量 自然语言处理模块:处理用户查询 检索与生成模块:基于RAG架构返回相关内容 1.2 数据流向 视频输入 → 帧提取 → VL模型分 阅读全文
posted @ 2025-08-26 16:46 老卫同学 阅读(79) 评论(0) 推荐(0)