摘要:
1. 前言 砚上三五笔,落墨鹧鸪啼 关于大模型总是会出现几B,然后想知道他们的存储空间大小分别是多少。还有描述一些显卡的TFLOPS是怎么计算的。这里做一个简单的记录。 如有不对,欢迎评论区指正! 2. 正文 2.1 精度类型 包括FP64:64位双精度浮点型 8字节 double FP32:32位 阅读全文
posted @ 2025-09-18 22:38
泪水下的笑靥
阅读(93)
评论(0)
推荐(0)
摘要:
1. 前言 砚上三五笔,落墨鹧鸪啼 原文链接: https://thinkingmachines.ai/ 相关分析链接:https://www.gongjiyun.com/blog/2025/9/fu1xw1spci9vnokjipecs9y9nzn/ 最近看到一篇名为《击败 LLM 推理中的非确定 阅读全文
posted @ 2025-09-18 21:38
泪水下的笑靥
阅读(26)
评论(0)
推荐(0)
摘要:
1. 前言 砚上三五笔,落墨鹧鸪啼 本文主要记录:最近要在CUDA的运算分配上做一个比较详细的分析,看看运算效率是怎么计算的。 如有不对,欢迎评论区指正! 2. 正文 2.1 CUDA 2.1.1 计算层面 统一计算设备架构CUDA(Compute Unified Device Architectu 阅读全文
posted @ 2025-09-18 16:47
泪水下的笑靥
阅读(40)
评论(0)
推荐(0)

浙公网安备 33010602011771号