上一页 1 ··· 17 18 19 20 21 22 23 24 25 ··· 36 下一页
摘要: Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本系列将通过源码分析来带领大家了解 Horovod。本文是系列第四篇,看看如何获取 host 之间的路由等网络信息。 阅读全文
posted @ 2021-06-17 19:15 罗西的思考 阅读(1521) 评论(0) 推荐(0)
摘要: Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本系列将通过源码分析来带领大家了解 Horovod。本文是系列第三篇,从 python 开始进入 Horovod 世界,看看 Horovodrun 背后做了什么。 阅读全文
posted @ 2021-06-15 08:22 罗西的思考 阅读(3485) 评论(1) 推荐(0)
摘要: Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本系列将通过源码分析来带领大家了解 Horovod。系列大约有15 ~ 18 篇,本文是系列第二篇,从用户角度切入 Horovod。 阅读全文
posted @ 2021-06-10 09:16 罗西的思考 阅读(4818) 评论(1) 推荐(1)
摘要: Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本系列将通过源码分析来带领大家了解 Horovod。系列大约有15 ~ 18 篇,本文是系列第一篇,介绍相关背景知识。 阅读全文
posted @ 2021-06-07 09:33 罗西的思考 阅读(6222) 评论(4) 推荐(0)
摘要: Facebook Hydra 允许开发人员通过编写和覆盖配置来简化 Python 应用程序(尤其是机器学习方面)的开发。开发人员可以借助Hydra,通过更改配置文件来更改产品的行为方式,而不是通过更改代码来适应新的用例。 阅读全文
posted @ 2021-06-03 19:26 罗西的思考 阅读(2497) 评论(0) 推荐(0)
摘要: 本文给出一种忘记使用nohup该如何补救的办法。 阅读全文
posted @ 2021-05-31 21:19 罗西的思考 阅读(2380) 评论(1) 推荐(5)
摘要: 新使用一个功能之前必须慎重。除了进行大量测试以外,如果有条件,可以读取相关代码看看其内部执行原理。本文我们就通过源码来看看 Redis SwapDB 命令是否靠谱。 阅读全文
posted @ 2021-05-27 20:54 罗西的思考 阅读(667) 评论(0) 推荐(1)
摘要: 之前在 Celery 的故障切换之中 提到了 Quartz 的故障切换策略,我们就顺便看看 Quartz 如何实现。大家可以互相印证下,看看这些系统之间的异同和精华所在。 阅读全文
posted @ 2021-05-24 20:44 罗西的思考 阅读(2650) 评论(0) 推荐(2)
摘要: Celery是一个简单、灵活且可靠的,处理大量消息的分布式系统,专注于实时处理的异步任务队列,同时也支持任务调度。本文介绍 Celery 的Lamport 逻辑时钟 & Mingle。 阅读全文
posted @ 2021-05-20 20:38 罗西的思考 阅读(877) 评论(0) 推荐(0)
摘要: Celery是一个简单、灵活且可靠的,处理大量消息的分布式系统,专注于实时处理的异步任务队列,同时也支持任务调度。本文介绍 Celery 的故障转移容错机制。 阅读全文
posted @ 2021-05-17 20:22 罗西的思考 阅读(2547) 评论(0) 推荐(2)
上一页 1 ··· 17 18 19 20 21 22 23 24 25 ··· 36 下一页