摘要:
深度求索(DeepSeek)公司即将发布新一代大模型DeepSeek R2。 核心看点如下: 1)架构革新:采用自研Hybrid MoE 3.0架构,动态激活参数达1.2万亿,实际计算消耗仅780亿,效率提升显著; 2)硬件国产化:基于华为昇腾910B芯片集群训练,算力利用率达82%,性能接近英伟达 阅读全文
posted @ 2025-05-01 05:36
吴建明wujianming
阅读(919)
评论(0)
推荐(0)
摘要:
今天凌晨,Qwen3 开源了。 添加图片注释,不超过 140 字(可选) 强的离谱,DeepSeek 这次真的要坐不住了。 先贴一张图。 添加图片注释,不超过 140 字(可选) 从这些主流的学术测试结果来看,Qwen3 全面超越了DeepSeek R1。 注意我用的词——“全面”。这不只是在一两个 阅读全文
posted @ 2025-05-01 05:25
吴建明wujianming
阅读(633)
评论(0)
推荐(0)
摘要:
MLIR 多层级中间表示 是 编译器的中间表示,添加了 优化功能。这种混合设计经过优化,可以表示 represent、分析 analyze、转换 transform 上层 数据流计算图 以及 用于 特定目标的 代码生成 codegen, 最终 用于 高性能数据并行计算。除了表示能力之外, 它持续维护 阅读全文
posted @ 2025-05-01 05:17
吴建明wujianming
阅读(258)
评论(0)
推荐(0)
摘要:
为在科技产业上追上美国,欧洲二战后蛰伏四十载,而再次被美国横扫,“欧洲之王”诺基亚只花了四年,美国人真就无法被打败吗? 2007年1月9日,本该进入雨季的旧金山已多日无雨,干燥的美利坚似乎正等待着天降花火,去引爆互联网泡沫破裂后的新时代。此时,苹果公司一年一度的Macworld大会,于三藩市如期举行 阅读全文
posted @ 2025-05-01 05:04
吴建明wujianming
阅读(92)
评论(0)
推荐(0)
摘要:
6本书推荐《MLIR编译器原理与实践》、《ONNX人工智能技术与开发实践》、《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《MLIR编译器原理与实践》已经出版,京东、淘宝天 阅读全文
posted @ 2025-05-01 04:33
吴建明wujianming
阅读(30)
评论(0)
推荐(0)

浙公网安备 33010602011771号