模型部署工程师与模型训练工程师各应该掌握的技术

现在算法行业有这样几类从业者:

  训练阶段:

  • 提升算法精度的,工作职责就是紧跟最新研究工作,从论文中复现模型,用于自己公司的数据上,并调整模型结构、参数,让其更适用于自己公司的数据集。这类工作的招聘要求,大概有熟悉CV、NLP等领域内的算法,熟悉tensorflow、pytorch等框架,能熟练阅读论文并复现精度。
  • 提升模型训练效率的,这类工作利用horovod、mpi等分布式技术,减小模型的训练时间。这类工作的招聘要求,就是要求熟悉并行技术。
  • 在k8s上训练模型的,这类工作利用k8s管理训练任务,这类工作的要求,就需要对kubeflow、k8s熟悉;

  推理阶段:

  • 对训练后模型进行优化,训练后的模型,离能部署还有一段距离,这类工作就是对模型进行量化、算子融合等操作,以此使模型推理性能更高。这类工作需要掌握tensorrt、tvm等推理优化框架。
  • 对模型进行部署,这类工作就是将模型做成http、grpc服务,以此服务于人脸识别、车辆识别等场景。在这一步需要掌握的一些模型部署框架,例如tensorflow serving、torchserve、triton等。
  • k8s上部署模型, 这类工作就需要对例如kserve这样的框架熟悉,以及其依赖的knative、istio、k8s熟悉

算法行业目前的分工还不是很明确,以上几类工作可能都是一个人兼任。但我相信随着人工智能领域的发展,分工会越来越明显。

 

posted on 2021-12-30 16:10  MissSimple  阅读(568)  评论(0)    收藏  举报

导航