摘要:
作业 基础作业: 进阶作业(可选做) 将第四节课训练自我认知小助手模型使用 LMDeploy 量化部署到 OpenXLab 平台。 将quant_output上传到平台中 对internlm-chat-7b模型进行量化,并同时使用KV Cache量化,使用量化后的模型完成API服务的部署,分别对比模 阅读全文
posted @ 2024-01-19 19:43
艾特玖
阅读(47)
评论(0)
推荐(0)
摘要:
环境配置 创建新的conda环境lmdeploy 服务部署 这一部分主要涉及本地推理和部署。我们先看一张图。 我们把从架构上把整个服务流程分成下面几个模块。 模型推理/服务。主要提供模型本身的推理,一般来说可以和具体业务解耦,专注模型推理本身性能的优化。可以以模块、API等多种方式提供。 Clien 阅读全文
posted @ 2024-01-19 19:41
艾特玖
阅读(362)
评论(0)
推荐(0)

浙公网安备 33010602011771号