mlops的一些记录

MLOPS

image-20220227114840274

Hidden Technical Debt in Machine Learning Systems.

google对MLOPS的介绍:MLOps:机器学习中的持续交付和自动化流水线

image-20220529100335044

mlops上也有不错的介绍,那么如何搭建一个MLOPS?

mymlops是一个不错的选择,提供了50+种MLOPS中会用到的工具,根据流程进行组合

看了一圈发现直接使用MLflow或许是最简洁的方案,如果是云平台kuberflow是一个不错的选择。目前来看,MLflow对前半部分:模型训练、管理做的比较好;kuberflow在模型部署方面更有优势。还需要深入使用,得出进一步结论。

一些公司的架构

美团

image-20220226161301832

image-20220226161513898

https://tech.meituan.com/2020/01/23/meituan-delivery-machine-learning.html

亚马逊MLOPS

模型构建、训练评估、生产、测试和质量控制、模型部署、监控

特征治理

image-20220227093043029

image-20220227100544982

在线:高并发,低延迟

离线:Hbase

实验管理

  • 实验版本管理

模型管理

  • 模型编录
  • 版本控制
  • 元数据管理
  • 上线状态管理
  • 自动化部署
  • 模型血缘,pipeline记录

工作流设计

  • 数据流处理
  • 模型训练
  • 超参调优
  • 模型创建
  • 模型注册
  • 模型批量管理
  • 特征质量检查
  • 可解释性检查
  • 条件分支
  • EMR
  • 回调

模型监控

  • 特征监控
  • 模型监控

image-20220227100811751

image-20220227100010812

数据是否有差异

image-20220227100053889

指标差异

image-20220227100110456

贝壳MLOPS

  • 数据平台
  • 训练平台
  • 推理平台

image-20220227103426352

放弃hadoop,转向k8s

tencent music

image-20220227113556963

posted @ 2022-05-29 10:57  鱼与鱼  阅读(101)  评论(0编辑  收藏  举报