摘要:
本想练练手合成点数据,没想到却一不小心干翻了PyTorch专家内核!斯坦福华人团队用纯CUDA-C写出的AI生成内核,瞬间惊艳圈内并登上Hacker News热榜。团队甚至表示:本来不想发这个结果的。 就在刚刚,斯坦福HAI华人大神团队又出惊人神作了。 他们用纯CUDA-C语言编写的快速AI生成内核 阅读全文
posted @ 2025-06-02 05:08
吴建明wujianming
阅读(49)
评论(0)
推荐(0)
摘要:
据国外科技媒体tomshardware报道,随着华盛顿收紧出口管制,中国科技公司争先恐后地抛弃英伟达 添加图片注释,不超过 140 字(可选) 许多中国科技巨头现在正在寻找英伟达的替代品,因为特朗普扩大的出口管制已经禁止销售专门围绕拜登政府前禁令构建的 H20 芯片。据英国《金融时报》报道,阿里巴巴 阅读全文
posted @ 2025-06-02 05:00
吴建明wujianming
阅读(47)
评论(0)
推荐(0)
摘要:
今天,继续为大家送上芯片科普知识(还没有宝宝的建议先收藏)。 上周,三大芯片设计 EDA 巨头受美国施压,不得已暂停了对中国的 EDA 支持与服务,这将对我国芯片设计产生较为严重的影响。今天要分享的内容就和芯片设计 EDA 相关。 芯片 EDA 工具所涉领域极为广泛,今天我们将为大家讲讲 EDA 模 阅读全文
posted @ 2025-06-02 04:57
吴建明wujianming
阅读(68)
评论(0)
推荐(0)
摘要:
【项目背景】 介绍在Windows11平台下的Deepseek私有化应用部署。 【经验介绍】 1、部署环境说明。 步骤 对象 功能 1 ollama 运行LLM 推理引擎框架 2 Deepseek-R1:7B\8B\14B\32B AI模型,其中7B表示模型的大小,数字越大越好。对于个人用户14B就 阅读全文
posted @ 2025-06-02 04:47
吴建明wujianming
阅读(114)
评论(0)
推荐(0)
摘要:
调试是一种思维方式,更是一套系统方法。从工程现场的混乱无序,到建立可复现的模型,从“尝试”到因果验证,我们在不断地将不确定因素转化为确定性。本文总结了我在近期项目中的一些调试体会,分享如下。 一、硬件是基础,软件是竞争力 早期样机阶段,硬件可能存在飞线、暂态干扰等问题。我们的目标是将软硬件一起推向“ 阅读全文
posted @ 2025-06-02 04:44
吴建明wujianming
阅读(49)
评论(0)
推荐(0)
推荐6本书《MLIR编译器原理与实践》、《ONNX人工智能技术与开发实践》、《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》
摘要:
6本书推荐《MLIR编译器原理与实践》、《ONNX人工智能技术与开发实践》、《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《MLIR编译器原理与实践》已经出版,京东、淘宝天 阅读全文
posted @ 2025-06-02 04:36
吴建明wujianming
阅读(8)
评论(0)
推荐(0)

浙公网安备 33010602011771号