随笔档案「2025年8月19日」：【深度学习】Deep Learning Framework Matr... - 双份浓缩馥芮白

2025年8月19日

【深度学习】Deep Learning Framework Matrix Multiplication Speed Compare（numpy & torch & mlx）

摘要： ✨ 实验环境 SoC：M1 Pro 10 cores CPU 16 cores GPU RAM：16GB numpy：2.2.6 torch：2.8.0 mlx：0.28.0 ✨FP16 & FP32 库硬件平台运算速度主要原因 PyTorch GPU FP16 显著快于 FP32 现代 GP 阅读全文

posted @ 2025-08-19 13:13 双份浓缩馥芮白阅读(26) 评论(0) 推荐(0)

双份浓缩馥芮白

公告