摘要:
Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本系列将通过源码分析来带领大家了解 Horovod。本文是系列第四篇,看看如何获取 host 之间的路由等网络信息。 阅读全文
posted @ 2021-06-17 19:15
罗西的思考
阅读(1521)
评论(0)
推荐(0)
摘要:
Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本系列将通过源码分析来带领大家了解 Horovod。本文是系列第三篇,从 python 开始进入 Horovod 世界,看看 Horovodrun 背后做了什么。 阅读全文
posted @ 2021-06-15 08:22
罗西的思考
阅读(3485)
评论(1)
推荐(0)
摘要:
Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本系列将通过源码分析来带领大家了解 Horovod。系列大约有15 ~ 18 篇,本文是系列第二篇,从用户角度切入 Horovod。 阅读全文
posted @ 2021-06-10 09:16
罗西的思考
阅读(4818)
评论(1)
推荐(1)
摘要:
Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本系列将通过源码分析来带领大家了解 Horovod。系列大约有15 ~ 18 篇,本文是系列第一篇,介绍相关背景知识。 阅读全文
posted @ 2021-06-07 09:33
罗西的思考
阅读(6222)
评论(4)
推荐(0)
摘要:
Facebook Hydra 允许开发人员通过编写和覆盖配置来简化 Python 应用程序(尤其是机器学习方面)的开发。开发人员可以借助Hydra,通过更改配置文件来更改产品的行为方式,而不是通过更改代码来适应新的用例。 阅读全文
posted @ 2021-06-03 19:26
罗西的思考
阅读(2497)
评论(0)
推荐(0)
浙公网安备 33010602011771号