2025 年 5月 17 日随笔档案 - 最爱丁珰

2025年5月17日

摘要：非常棒的问题！👏 你问的这两点：为什么 X, y = X.to(devices[0]), y.to(devices[0]) 是必须的？ net(X) 是如何决定数据在 GPU 之间分配的？我们来一个一个详细解释。 🔍 第一个问题：为什么 X, y = X.to(devices[0]), y 阅读全文

posted @ 2025-05-17 22:16 最爱丁珰阅读(25) 评论(0) 推荐(0)

12.3.2 并行计算与通信

摘要：非常棒的问题！你提到的这段代码中： def copy_to_cpu(x, non_blocking=False): return [y.to('cpu', non_blocking=non_blocking) for y in x] 其中的 non_blocking 参数是 PyTorch 中用于阅读全文

posted @ 2025-05-17 20:25 最爱丁珰阅读(62) 评论(0) 推荐(0)

12.3.1 基于GPU的并行计算

摘要：预热的原因： 🧠 核心原因：GPU 的初始化和缓存机制会影响首次运行速度 1. 首次执行会有额外开销当你第一次在一个设备（如 cuda:0）上执行一个操作时，系统会进行一些初始化工作：加载内核（kernel）；分配内存；编译 PTX（Parallel Thread Execution）代码阅读全文

posted @ 2025-05-17 19:46 最爱丁珰阅读(40) 评论(0) 推荐(0)

12.1.3 Sequential的混合式编程

摘要： with可以把它看作是一个“自动开关门”的机制 with open('file.txt', 'r') as f: content = f.read() # 到这里，文件会自动关闭，不需要你手动调用 f.close() 本质上是一个上下文管理器，能够工作的关键在于对象是否实现了上下文管理协议（注意Py 阅读全文

posted @ 2025-05-17 18:36 最爱丁珰阅读(8) 评论(0) 推荐(0)

12.1.1 符号式编程

摘要：如果在一个GPU（甚至多个GPU）上执行这些命令，那么Python解释器产生的开销可能会非常大这是因为每个 add 函数调用都是独立发生的，Python 不会知道这三个 add 调用之间有什么联系，也不会合并它们成一个更高效的计算流程；当你把 Python 的这些小操作映射到 GPU 上执行时，每阅读全文

posted @ 2025-05-17 18:13 最爱丁珰阅读(12) 评论(0) 推荐(0)

最爱丁珰

公告