ACS算力快速搭建生成式会话应用
ACS算力快速搭建生成式会话应用
|
|
|
阿里云容器计算服务ACS(Container Compute Service)以Kubernetes为使用界面,采用Serverless形态提供弹性的算力资源,使您轻松高效运行容器应用。本文将指导您如何通过ACS控制台及ACS集群证书在ACS集群中快速部署并公开一个容器化生成式AI会话应用,并监控应用的运行情况。 本教程所使用两个开源项目,分别是RWKV-Runner和ChatGPT-Next-Web。RWKV-Runner是一个0.1b的大模型并提供RESTful API对外提供在线推理服务,ChatGPT-Next-Web是会话应用的WebUI。RWKV-Runner与ChatGPT-Next-Web形成前后端分离架构的生成式AI会话应用,通过容器镜像部署到ACS集群中。完成本教程后,您将创建生成式AI会话应用。 |
|
|
|
|
|
本实验1个小时预计产生费用14.15元。如果您调整了资源规格、使用时长,或执行了本方案以外的操作,可能导致费用发生变化,请以控制台显示的实际价格和最终账单为准。 进入实操前,请确保阿里云账号满足以下条件: |
|
|
|
|
|
|
|
|
|
|
|
在创建集群页面,根据如下说明配置参数,未提及的参数保持默认即可,单击确认配置。 |
|
|
|
|
|
|
|
|
|
|
使用ACS控制台部署RWKV-Runner本步骤指导您如何在新创建的ACS集群中使用通用型实例快速部署一个无状态应用(Deployment)RWKV-Runner,并将该应用RESTful API在集群内公开。关于创建Deployment的详细参数描述,请参见创建无状态工作负载Deployment。
|
|
|
|
|
|
|
|
|
在容器配置页面,配置容器的相关信息,单击下一步。 |
|
|
|
|
|
创建服务对话框,配置以下信息,单击确定,以通过该服务集群内发布rwkv-runner的RESTful API。 |
|
|
|
|
|
|
|
使用ACS集群证书部署并公开ChatGPT-Next-Web本步骤指导您如何使用ACS集群证书在新创建的ACS集群中使用通用型实例快速部署一个无状态应用(Deployment)ChatGPT-Next-Web,并将该应用公网公开。关于创建Deployment的详细参数描述,请参见创建无状态工作负载Deployment。
|
|
|
|
|
|
|
|
|
在创建页面,示例模板选择自定义,复制如下代码并粘贴至模板区域中,单击创建。
|
|
|
|
|
|
|
|
|
|
|
使用ACS集群证书创建应用初始任务本步骤指导您如何使用ACS集群证书在新创建的ACS集群中使用BestEffort 算力质量的实例快速创建一个任务(Job),用于RWKV-Runner应用大模型的初始化。关于创建Job的详细参数描述,请参见创建任务工作负载Job。
|
|
|
|
|
|
在创建页面,示例模板选择自定义,复制如下代码并粘贴至模板区域中,单击创建。
|
|
|
|
|
测试应用本步骤指导您如何通过服务(Service)来访问新部署的容器化应用。
|
|
|
|
|
清理资源使用ACS集群所产生的费用包括以下两部分:
完成实验后,请参考以下场景处理集群。
|
|









































浙公网安备 33010602011771号