摘要: 论文:《ReAct: Synergizing Reasoning and Acting in Language Models》 链接:https://arxiv.org/pdf/2210.03629 背景: 经过适当提示的大型语言模型(LLMs)已经展现出进行推理步骤以推导出算术、常识和符号推理任务 阅读全文
posted @ 2025-12-17 13:53 wangssd 阅读(11) 评论(0) 推荐(0)
摘要: 模型:https://www.modelscope.cn/models/Qwen/Qwen3-VL-8B-Instruct 1. 多模态理解 图像理解:识别物体、场景、文字(OCR) 多图推理:支持多张图像输入进行综合推理 文档解析:表格、图表、公式识别 细粒度理解:支持区域级别的视觉定位(通过文本 阅读全文
posted @ 2025-12-16 15:16 wangssd 阅读(6) 评论(0) 推荐(0)
摘要: MLflow 是一个功能强大的ML生命周期管理平台,主要用于 ML/DL/LLM 实验管理、模型跟踪、模型部署等。 1. 核心概念 实验(Experiment):MLflow 的基本组织单位,用于将相关的运行组织在一起。每个实验包含多次运行,通常对应一个特定的 ML 项目 运行(Run):单次执行代 阅读全文
posted @ 2025-12-08 15:45 wangssd 阅读(9) 评论(0) 推荐(0)
摘要: 多步预测主要分为两种策略:递归预测、序列到序列预测(Seq2Seq) 递归预测(Recursive Forecasting) 使用单步预测模型,将预测值作为下一步的输入 适合短期预测,误差会逐渐累积 序列到序列预测(Seq2Seq) 编码器-解码器架构 最常用的多步预测方法 阅读全文
posted @ 2025-12-05 14:08 wangssd 阅读(14) 评论(0) 推荐(0)
摘要: 亚马逊研究团队于2024年提出的一种时间序列预测基础模型Chronos,代表了时间序列领域向大模型范式的重要转变。 模型的核心思想是将时间序列预测重塑为一个条件生成建模或语言建模任务。 应用于Zero-shot (零时序预测(Zero-shot Time Series Forecasting) 指的 阅读全文
posted @ 2025-12-04 16:50 wangssd 阅读(120) 评论(0) 推荐(0)
摘要: DeepSpeed 是底层训练加速库,用于进行分布式训练 LLaMA Factory 是高层一站式训练框架 DeepSpeed 定位:微软开发的深度学习优化库,核心目标是极大化训练和推理的效率、规模与速度。 核心特性: ZeRO 优化器:其标志性技术,通过跨GPU智能分割模型状态(参数、梯度、优化器 阅读全文
posted @ 2025-12-04 09:24 wangssd 阅读(20) 评论(0) 推荐(0)
摘要: 模型经过海量数据预训练后,它拥有了广泛的知识,但其输出行为是“中性”的,它不知道人类更偏爱哪种风格的回答(例如:更有帮助、更无害、更简洁、更符合特定格式)。对齐微调 的目标就是缩小模型与人类偏好之间的差距。 对齐微调:利用人类偏好信号来指导模型的优化。 1. PPO(Proximal Policy 阅读全文
posted @ 2025-12-01 10:10 wangssd 阅读(63) 评论(0) 推荐(0)
摘要: FastAPI 是一个现代、快速(高性能)的 Python Web 框架,专门用于构建 API。它结合了 Python 类型提示的强大功能和异步编程的支持。 核心特性 1. 高性能 基于 Starlette(Web 框架)和 Pydantic(数据验证) 性能可与 NodeJS 和 Go 相媲美 支 阅读全文
posted @ 2025-11-28 13:58 wangssd 阅读(8) 评论(0) 推荐(0)
摘要: 当用户通过浏览器访问一个配置了 HTTPS 的网站时,其数据交互流程可以清晰地分为两大阶段: 1. TLS 握手连接 浏览器和服务器建立一个安全的、加密的通信通道。这个过程的核心是验证服务器身份,并协商出一个只有双方知道的“会话密钥”。 2. 安全的 HTTP 数据通信。 在安全的通道建立之后,所有 阅读全文
posted @ 2025-11-27 21:26 wangssd 阅读(14) 评论(0) 推荐(0)
摘要: 异步与同步 执行流式输出 from fastapi import FastAPI import asyncio from langchain_openai import ChatOpenAI app = FastAPI() llm = ChatOpenAI(streaming=True) # 同步端 阅读全文
posted @ 2025-11-25 10:53 wangssd 阅读(12) 评论(0) 推荐(0)