LLM - 随笔分类 - ZacksTang

vLLM框架：LLM推理的高效机制

摘要：vLLM框架：大语言模型推理的高效机制 vLLM 是由加州大学伯克利分校团队开发的高性能大模型推理框架，通过创新的显存管理和调度策略，解决了传统推理框架在部署大模型时面临的显存利用率低、吞吐量不足、并发处理效率低等问题。vLLM的核心优势在于其独特的PagedAttention显存管理机制和连续批处阅读全文

posted @ 2025-08-13 22:26 ZacksTang 阅读(3296) 评论(0) 推荐(0)

Strands Agents（一）Strands Agents 介绍

摘要：Strands Agent AWS 最新开源的 Strands Agents SDK 是一款采用模型驱动架构的 AI 代理开发框架，旨在通过极简开发方式，帮助开发者快速构建和部署 AI 代理。它将代理的核心要素——模型、工具和提示词抽象化，开发者只需几行代码，即可构建从简单任务到复杂多代理协作的多样阅读全文

posted @ 2025-06-03 21:01 ZacksTang 阅读(1260) 评论(0) 推荐(0)

Wan2.1 t2v模型Lora Fine-Tune

摘要：Wan2.1 t2v模型Lora Fine-Tune 1. Wan2.1模型 Wan2.1是由阿里巴巴开源的AI视频生成大模型，具备强大的视觉生成能力，支持文本到视频（T2V）和图像到视频（I2V）任务。该模型基于前沿的Diffusion Transformer架构，结合了因果3D变分自编码器（VA 阅读全文

posted @ 2025-05-05 21:56 ZacksTang 阅读(2729) 评论(0) 推荐(1)

视觉多模态理解模型基础

摘要：1. 视觉多模态简介视觉多模态一般涵盖2个要点：视觉表征以及视觉与自然语言的对齐（Visual Language Alignment）或融合。 1.1. 视觉表征视觉表征是指：将图像信息转化为深度学习模型可以处理的特征向量或向量序列的过程。具体来说，它包含以下2点：合理建模视觉输入特征：这阅读全文

posted @ 2024-11-28 22:58 ZacksTang 阅读(2301) 评论(0) 推荐(0)

ZacksTang

随笔分类 - LLM

公告