模型部署工程师与模型训练工程师各应该掌握的技术

现在算法行业有这样几类从业者:
训练阶段:
- 提升算法精度的,工作职责就是紧跟最新研究工作,从论文中复现模型,用于自己公司的数据上,并调整模型结构、参数,让其更适用于自己公司的数据集。这类工作的招聘要求,大概有熟悉CV、NLP等领域内的算法,熟悉tensorflow、pytorch等框架,能熟练阅读论文并复现精度。
- 提升模型训练效率的,这类工作利用horovod、mpi等分布式技术,减小模型的训练时间。这类工作的招聘要求,就是要求熟悉并行技术。
- 在k8s上训练模型的,这类工作利用k8s管理训练任务,这类工作的要求,就需要对kubeflow、k8s熟悉;
推理阶段:
- 对训练后模型进行优化,训练后的模型,离能部署还有一段距离,这类工作就是对模型进行量化、算子融合等操作,以此使模型推理性能更高。这类工作需要掌握tensorrt、tvm等推理优化框架。
- 对模型进行部署,这类工作就是将模型做成http、grpc服务,以此服务于人脸识别、车辆识别等场景。在这一步需要掌握的一些模型部署框架,例如tensorflow serving、torchserve、triton等。
- k8s上部署模型, 这类工作就需要对例如kserve这样的框架熟悉,以及其依赖的knative、istio、k8s熟悉
算法行业目前的分工还不是很明确,以上几类工作可能都是一个人兼任。但我相信随着人工智能领域的发展,分工会越来越明显。
posted on 2021-12-30 16:10 MissSimple 阅读(568) 评论(0) 收藏 举报
浙公网安备 33010602011771号