共绩算力弹性部署详细教程 - 实践

文末有福利~
弹性部署核心优势解析
弹性部署作为当下云计算领域的热门技术,正以其独特的优势改变着传统的资源分配模式。它最显著的特点就是资源动态分配,能够根据实际需求实时调整计算资源,避免了资源浪费,例如业务低谷时自动缩减至1节点,高峰期扩展至10节点。按需选择GPU型号和节点数量的功能,让用户可以精准匹配自身业务需求,既满足了高性能计算的要求,又有效控制了成本,比如推理任务选4090单卡,训练任务切换至8卡A100。而敏捷扩展能力更是为应对业务高峰期提供了有力保障,确保系统在高负载情况下依然能够稳定运行,从1节点扩展至5节点仅需30秒。
前期准备工作
在开始弹性部署之前,有一个重要的前提条件需要完成,那就是在共绩算力的官方控制台进行注册和登录。你可以通过访问https://console.suanli.cn来搞定这一步骤。只有完成注册登录,你才能顺利进入后续的部署流程。
两种弹性部署途径详解
共绩算力提供了两种弹性部署技巧,分别是利用预制的镜像快速发布任务和使用用户自定义打包的镜像发任务。这两种方法各有特点,适用于不同的场景。
途径一:用预制镜像发任务
这种方法操控简便,适合快速部署常规任务,无需用户自行构建复杂的镜像环境。
第一步:新增部署任务
首先,你得进入“新增部署任务”界面。行直接通过访问https://console.suanli.cn/serverless/create来进入该界面。

第二步:填写任务信息
这一步是整个部署过程的核心,需要仔细配置各项参数。
选择资源
根据你的实际需求筛选GPU资源,筛选条件包括所在区域、显存要求、CPU核心数、内存大小等。在选择GPU型号时,推荐选择不限区域,这样可以享受全国闲置算力资源,随取随用。对于GPU型号的推荐调整,如果你只是想快速结束部署进行测试,建议直接勾选“4090(1卡)”和“1个节点”。

定义服务配置信息
接下来,按照需求选择预制好的镜像。共绩算力给出了丰富的预制镜像,你行通过文档链接快速了解容器化部署对应服务的步骤。这里大家以选择SD-3.5-Large comfyUI为例进行说明。

选择完成后,点击【部署服务】按钮,即可发布任务。

第三步:查看运行状态
发布任务后,框架会自动跳转至任务详情界面,此时你需要等待节点分配。

当节点分配完成后,点击【公开访问】中的任一链接,你就可以正常访问该服务了。

资料补充
共绩算力的产品中,所有型号单卡均提供24GB以上显存,远超服务部署启动的要求,你无需担心显存不足的困难。在性价比与灵活性方面,1卡配置每小时仅需1.68元,按秒计费(0.000446元/秒),非常适合短期测试或常规任务。而且1卡版本库存充足,无需等待,能够快速部署。如果未来需要进行分布式训练或处理高并发任务,你还可以随时切换到2卡/4卡的配置。
对于大多数用户来说,如果只是运行文档镜像中的常规任务(如模型推理、数据处理),单卡性能完全足够。镜像仓库默认适配主流GPU型号(如4090),无需额外调试。所以,在无特殊需求的情况下,直接勾选“4090(1卡)”和“1个节点”,就能快速完成部署,成本可控,资源立即可用。当然,如果你要求训练大模型(如LLM、多模态),再考虑2卡/4卡设置。
方法二:使用用户自定义打包的镜像发任务
这种手段灵活性更高,适合有特殊需求,需要自定义镜像环境的用户。它与利用预制镜像发布任务的步骤基本相同,唯一的区别在于“定义服务配置信息”这一步。
定义服务配置信息
在这一步,你得选择服务设置中的“我的镜像”选项。然后在“镜像URL”字段中填写完整的镜像地址及标签。共绩算力支持两种方式的镜像地址:
通过第一种是第三方公共镜像库(如Docker Hub、阿里云镜像库等),你许可直接使用公开镜像地址。例如,以SD-3.5-Large comfyUI为例,镜像地址能够是crpi-r5vaz7ed9e06uteg.cn-shanghai.personal.cr.aliyuncs.com/lightcloud/sd-webui:1.8,端口号根据实际情况填写,如7860。

第二种是共绩算力提供的私有镜像库,不过需要你预先上传镜像。若需运用内部私有镜像仓库,请参考镜像仓库完成镜像推送后,刷新界面并选择内部仓库地址。例如,私有镜像地址库可以是harbor.suanleme.cn/huang5876/jupyter_tf2_18:v1.0,其版本信息为python3.12+tensorflow-gpu2.18.1。

,jupyter建议只用一个节点,不然可能导致异常。就是完成镜像URL填写后,进行端口配置。以JupyterLab为例,端口号填写8888。应该注意的

完成上面的配置后,点击“部署服务”按钮发布任务即可。
弹性部署相关名词解释
为了帮忙你更好地理解弹性部署的相关概念,这里对一些关键名词进行详细解释。
GPU型号
GPU型号能够类比为不同规格的“工程机械车”。1卡/2卡/4卡/8卡代表单台机器搭载的GPU数量,类似一辆卡车能装1台或8台发动机,动力逐级增强。显存24GB相当于车辆的“货仓容量”,决定了一次性能处理多少数据(如大型模型参数)。内存64GB和CPU核心数16如同驾驶室的空间和司机数量,影响多任务并行处理效率。库存数表示当前可用的“车辆库存”,库存越多,部署越快。
一般来说,1卡适用于常规任务(模型推理、数据处理),多卡则适用于分布式训练、高并发计算(如大语言模型训练)。
显存要求(至少16GB)
显存要求就像要求“绘图桌”的最小尺寸,必须足够大才能铺开复杂的设计图纸(如大型神经网络参数)。简而言之,显存是GPU用于临时存储计算资料的空间,16GB是运行中等规模AI模型(如Stable Diffusion)的最低要求。而共绩算力提供的4090 GPU拥有24GB显存,远超基准,能够确保任务流畅运行。
节点扩展操作指南
在结束初始部署后,如果你需要根据业务需求进行节点扩展,可以按照以下步骤处理:
①通过"部署管理"页面进入目标任务详情页
②点击"扩展配备"按钮展开节点设置面板
③拖动滑块或输入数字调整节点数量(范围1-20)
④点击"应用更改"完成扩展
⑤通过"节点状态"区域验证扩展结果
平台要求至少选择1个节点,最多可选20个节点。建议你先启动1个节点进行验证,待运行稳定后,再横向扩展至所需规模。这样可以确保扩展过程的平稳进行,避免因配置不当导致的问题。
自定义镜像满足特殊需求,都能让你充分体验到弹性部署带来的高效与便捷。希望这份教程能够帮助你顺利完成弹性部署任务,为你的业务发展提供有力的计算支持。就是通过以上详细的教程,相信你已经对共绩算力的弹性部署有了全面的了解。无论是使用预制镜像快速部署,还
我的专属邀请码:https://console.suanli.cn/auth/login?invite_code=TEbTkpIGkz
使用该邀请码注册,能够立即获得新手无门槛50元 + 10元代金券!
浙公网安备 33010602011771号