会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
wangssd
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
···
32
下一页
2025年12月4日
deepspeed/llama-factory
摘要: DeepSpeed 是底层训练加速库,用于进行分布式训练 LLaMA Factory 是高层一站式训练框架 DeepSpeed 定位:微软开发的深度学习优化库,核心目标是极大化训练和推理的效率、规模与速度。 核心特性: ZeRO 优化器:其标志性技术,通过跨GPU智能分割模型状态(参数、梯度、优化器
阅读全文
posted @ 2025-12-04 09:24 wangssd
阅读(52)
评论(0)
推荐(0)
2025年12月1日
llm 中的对齐微调 DPO、KTO、PPO算法
摘要: 模型经过海量数据预训练后,它拥有了广泛的知识,但其输出行为是“中性”的,它不知道人类更偏爱哪种风格的回答(例如:更有帮助、更无害、更简洁、更符合特定格式)。对齐微调 的目标就是缩小模型与人类偏好之间的差距。 对齐微调:利用人类偏好信号来指导模型的优化。 1. PPO(Proximal Policy
阅读全文
posted @ 2025-12-01 10:10 wangssd
阅读(88)
评论(0)
推荐(0)
2025年11月28日
fastapi python项目构建 路由设置
摘要: FastAPI 是一个现代、快速(高性能)的 Python Web 框架,专门用于构建 API。它结合了 Python 类型提示的强大功能和异步编程的支持。 核心特性 1. 高性能 基于 Starlette(Web 框架)和 Pydantic(数据验证) 性能可与 NodeJS 和 Go 相媲美 支
阅读全文
posted @ 2025-11-28 13:58 wangssd
阅读(14)
评论(0)
推荐(0)
2025年11月27日
https 在web端的交互流程
摘要: 当用户通过浏览器访问一个配置了 HTTPS 的网站时,其数据交互流程可以清晰地分为两大阶段: 1. TLS 握手连接 浏览器和服务器建立一个安全的、加密的通信通道。这个过程的核心是验证服务器身份,并协商出一个只有双方知道的“会话密钥”。 2. 安全的 HTTP 数据通信。 在安全的通道建立之后,所有
阅读全文
posted @ 2025-11-27 21:26 wangssd
阅读(51)
评论(0)
推荐(0)
2025年11月25日
llm python web框架的使用(同步/异步/进程/线程/协程)
摘要: 异步与同步 执行流式输出 from fastapi import FastAPI import asyncio from langchain_openai import ChatOpenAI app = FastAPI() llm = ChatOpenAI(streaming=True) # 同步端
阅读全文
posted @ 2025-11-25 10:53 wangssd
阅读(25)
评论(0)
推荐(0)
2025年11月24日
langgraph 核心要点
摘要: LangGraph 采用单一状态对象的设计,所有节点都读写同一个状态对象。 整个图维护统一的 State,通过类型定义来包含多个"子状态"或字段。 多模块示例: from langgraph.graph import StateGraph, END from typing import TypedD
阅读全文
posted @ 2025-11-24 17:05 wangssd
阅读(10)
评论(0)
推荐(0)
llama-factory 各参数详解
摘要: llama-factory web页面: 1. 模型与数据配置 参数/选项详细说明 模型名称或路径 - 作用:指定要微调的基座模型。可以是 Hugging Face 上的模型标识符(如 meta-llama/Llama-2-7b-chat-hf),也可以是本地模型文件夹的路径。 - 注意:需要确保
阅读全文
posted @ 2025-11-24 11:31 wangssd
阅读(537)
评论(0)
推荐(0)
2025年11月21日
llama-factory llm模型微调框架
摘要: LlamaFactory 是一个功能强大、易于使用的大语言模型微调框架。 LlamaFactory 是一个 “一站式”的大模型微调工具包。它基于 PyTorch 和 Hugging Face 生态系统构建,提供了统一的接口和丰富的优化策略,极大地简化了从准备数据到训练模型、再到评估部署的整个微调流程
阅读全文
posted @ 2025-11-21 17:13 wangssd
阅读(24)
评论(0)
推荐(0)
if __name__ == "__main__"作用
摘要: 判断当前脚本是直接被运行,还是被作为模块导入到其他脚本中。 工作原理 __name__ 是Python的一个内置变量 当脚本直接被运行时,__name__ 的值为 "__main__" 当脚本被导入为模块时,__name__ 的值为模块名(文件名) # my_script.py def hello(
阅读全文
posted @ 2025-11-21 10:58 wangssd
阅读(16)
评论(0)
推荐(0)
2025年11月19日
pytorch .to(device)用法和原理
摘要: PyTorch中,.to(device) 是一个非常重要的方法,用于将张量、模型等对象移动到指定的设备(如CPU或GPU)。 import torch import torch.nn as nn # 检查可用设备 device = torch.device('cuda' if torch.cuda.
阅读全文
posted @ 2025-11-19 17:55 wangssd
阅读(122)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
···
32
下一页
公告