• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
在努力搬砖的jellyfish
博客园    首页    新随笔    联系   管理    订阅  订阅
2025年8月7日
【模型压缩系列-1】一篇文章带你全面了解模型量化(Model Quantization)——全局篇
摘要: 【模型压缩系列-1】一篇文章带你全面了解模型量化(Model Quantization)——全局篇 本文通过五个方面系统介绍了大模型量化技术:首先阐述量化的基本概念,以低比特(INT8/4/2/1)取代 FP32 的压缩与加速原理;其次按时间维度区分 PTQ、QAT 与 QAF 三种策略,明确何时量化;随后按对象维度梳理权重、激活、梯度、KV-Cache 及偏置的量化差异;再从粒度维度比较 per-tensor、per-channel、per-group、per-token 的精度与开销权衡;最后结合位宽与对象给出 W8A16、W4A8、KV4 等典型组合,完整呈现量化在模型大小、推理速度与部署场景中的综合优化路径。 阅读全文
posted @ 2025-08-07 15:25 汤佘 阅读(905) 评论(0) 推荐(1)
2025年7月24日
【纯新手友好版】教你使用OpenSSH进行服务器访问或管理---安装
摘要: 一、SSH客户端配置 如果你需要通过SSH远程访问服务器,需要生成密钥对,然后将公钥配置到服务器,具体如下: Step1:检查是否安装了 OpenSSH Client(客户端) 以管理员身份运行powershell(Win+X → 终端管理员) ## 检查SSH客户端是否安装 Get-Windows 阅读全文
posted @ 2025-07-24 09:43 汤佘 阅读(198) 评论(0) 推荐(0)
2025年3月31日
【Data Preprocessing】Python使用正则表达式入门速查-Regular Expression Quick View
摘要: regular expression This article is intended to introduce the RE package in Python. The main funciton of RE module is sub:Replace matched items. match: 阅读全文
posted @ 2025-03-31 13:47 汤佘 阅读(9) 评论(0) 推荐(0)
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3