会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
吴建明
微信视频号:sph0RgSyDYV47z6 快手号:4874645212 抖音号:dy0so323fq2w 小红书号:95619019828 B站1:UID:3546863642871878 B站2:UID: 3546955410049087
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
67
68
69
70
71
72
73
74
75
···
367
下一页
2025年5月3日
推荐6本书《MLIR编译器原理与实践》、《ONNX人工智能技术与开发实践》、《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》,happyhappy
摘要: 6本书推荐《MLIR编译器原理与实践》、《ONNX人工智能技术与开发实践》、《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《MLIR编译器原理与实践》已经出版,京东、淘宝天
阅读全文
posted @ 2025-05-03 04:43 吴建明wujianming
阅读(28)
评论(0)
推荐(0)
2025年5月2日
华为据报准备测试最新AI晶片 力争与英伟达匹敌
摘要: 中国科技巨头华为据报正准备测试其最新的人工智能(AI)处理器昇腾910D。(法新社) 《华尔街日报》星期天(4月27日)报道引述知情人士称,华为已与多家中国科技公司接洽,探讨测试昇腾910D晶片的技术可行性。 添加图片注释,不超过 140 字(可选) 专家:美国晶片禁令反助中国创新占领全球市场 华为
阅读全文
posted @ 2025-05-02 08:12 吴建明wujianming
阅读(85)
评论(0)
推荐(0)
华为挑战英伟达AI霸主地位
摘要: 华为挑战英伟达AI霸主地位 添加图片注释,不超过 140 字(可选) 华为近期正加速在AI晶片领域发力,以挑战英伟达AI霸主的地位。图为华为Atlas 800人工智能服务器4月15日在香港博览会展出。(路透社) 添加图片注释,不超过 140 字(可选) 黄仁勋说:“中国并不落后,就在我们身后,距离非
阅读全文
posted @ 2025-05-02 08:08 吴建明wujianming
阅读(113)
评论(0)
推荐(0)
人工智能智能体杂谈
摘要: 在人工智能飞速发展的当下,人工智能智能体(AI Agent)正逐渐崭露头角,成为推动各行业变革的关键力量,也正悄然改变着我们的生活与工作方式。 添加图片注释,不超过 140 字(可选) 一、揭开人工智能智能体的神秘面纱 人工智能智能体通常是指有能力主动思考和行动的智能实体,能够以类似人类的方式工作。
阅读全文
posted @ 2025-05-02 05:00 吴建明wujianming
阅读(130)
评论(0)
推荐(0)
DeepSeek-R2即将重磅升级!
摘要: 据内部情报,DeepSeek的R2目前已经开始小批量测试,正式版于将于年中发布,参数规模直接冲上了1.2万亿大关,关键是价格还将砍到让人直呼"白菜价"!这波操作简直是把性价比玩出了新高度~ 添加图片注释,不超过 140 字(可选) 【黑科技一:涡轮增压版AI引擎】 这次DeepSeek R2祭出了自
阅读全文
posted @ 2025-05-02 04:49 吴建明wujianming
阅读(621)
评论(0)
推荐(0)
大模型推理服务杂谈
摘要: 回顾一下大模型推理服务方法, 层级式地说明这些方法, 实例优化、集群扩缩容策略 等等。 实例优化: 模型的部署, 主要是当单卡内存有限, 把模型参数分布到不同卡上的方法。连续请求调度, 通过预测解码长度, 对批处理优先级进行调度, 较短的请求优先处理减少整体的时延。动态批处理主要处理解码过程中请求的
阅读全文
posted @ 2025-05-02 04:28 吴建明wujianming
阅读(259)
评论(0)
推荐(0)
推荐6本书《MLIR编译器原理与实践》、《ONNX人工智能技术与开发实践》、《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》,快乐happy
摘要: 本书推荐《MLIR编译器原理与实践》、《ONNX人工智能技术与开发实践》、《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《MLIR编译器原理与实践》已经出版,京东、淘宝天猫
阅读全文
posted @ 2025-05-02 04:22 吴建明wujianming
阅读(30)
评论(0)
推荐(0)
2025年5月1日
2025上海车展报告分析
摘要: 2025上海车展报告分析 添加图片注释,不超过 140 字(可选) 添加图片注释,不超过 140 字(可选) 添加图片注释,不超过 140 字(可选) 添加图片注释,不超过 140 字(可选) 添加图片注释,不超过 140 字(可选) 添加图片注释,不超过 140 字(可选) 添加图片注释,不超过
阅读全文
posted @ 2025-05-01 05:47 吴建明wujianming
阅读(36)
评论(0)
推荐(0)
1.2万亿参数+成本暴跌97%!国产大模型DeepSeek R2即将出炉
摘要: 深度求索(DeepSeek)公司即将发布新一代大模型DeepSeek R2。 核心看点如下: 1)架构革新:采用自研Hybrid MoE 3.0架构,动态激活参数达1.2万亿,实际计算消耗仅780亿,效率提升显著; 2)硬件国产化:基于华为昇腾910B芯片集群训练,算力利用率达82%,性能接近英伟达
阅读全文
posted @ 2025-05-01 05:36 吴建明wujianming
阅读(768)
评论(0)
推荐(0)
Qwen3,原生支持 MCP
摘要: 今天凌晨,Qwen3 开源了。 添加图片注释,不超过 140 字(可选) 强的离谱,DeepSeek 这次真的要坐不住了。 先贴一张图。 添加图片注释,不超过 140 字(可选) 从这些主流的学术测试结果来看,Qwen3 全面超越了DeepSeek R1。 注意我用的词——“全面”。这不只是在一两个
阅读全文
posted @ 2025-05-01 05:25 吴建明wujianming
阅读(559)
评论(0)
推荐(0)
上一页
1
···
67
68
69
70
71
72
73
74
75
···
367
下一页
公告