摘要:
https://zhuanlan.zhihu.com/p/627436535 LLM(11):大语言模型的模型量化(INT8/INT4)技术 https://mp.weixin.qq.com/s/rd9d5RLvvs_bFgq9VI6RqQ 大规模 Transformer 模型 8 比特矩阵乘简介 阅读全文
posted @ 2026-01-12 23:03
blcblc
阅读(8)
评论(0)
推荐(0)
该文被密码保护。 阅读全文
posted @ 2026-01-12 19:42
blcblc
阅读(0)
评论(0)
推荐(0)
该文被密码保护。 阅读全文
posted @ 2026-01-12 17:26
blcblc
阅读(0)
评论(0)
推荐(0)
该文被密码保护。 阅读全文
posted @ 2026-01-12 17:17
blcblc
阅读(0)
评论(0)
推荐(0)
该文被密码保护。 阅读全文
posted @ 2026-01-12 14:48
blcblc
阅读(0)
评论(0)
推荐(0)
摘要:
https://www.jaeaiot.com/news/detail/295.html NVIDIA A10 与 A100 GPU 对比分析:用于LLM 和Stable Diffusion推理 阅读全文
posted @ 2026-01-12 14:17
blcblc
阅读(9)
评论(0)
推荐(0)
摘要:
https://www.zhihu.com/search?type=content&q=%E6%BF%80%E6%B4%BB%E9%87%8D%E8%AE%A1%E7%AE%97 激活重计算(Activation Recomputation) 阅读全文
posted @ 2026-01-12 11:02
blcblc
阅读(7)
评论(0)
推荐(0)

浙公网安备 33010602011771号