摘要:
int8 量化是一种用于减少模型大小和计算复杂度的方法,特别是在深度学习模型中。它通过将浮点数(通常是 fp32)转换为 8 位整数 (int8),从而减少内存使用和提高计算效率。这在嵌入式设备和移动设备上特别有用。下面是 int8 量化的基本原理及其涉及的过程。 1. 为什么需要量化? 减少模型大 阅读全文
posted @ 2024-07-22 14:20
海_纳百川
阅读(925)
评论(0)
推荐(0)
摘要:
阅读全文
posted @ 2024-07-22 09:24
海_纳百川
阅读(21)
评论(0)
推荐(0)

浙公网安备 33010602011771号