https://zhuanlan.zhihu.com/p/700873851
一文理解 GPU 张量核心(Tensor Core)
建议在支持 8-bit 张量核心的 NVIDIA GPU(Turing、Ampere 及更新架构,如 T4、RTX 20/30/40、A100 等)上运行。