摘要:
中国科技巨头华为据报正准备测试其最新的人工智能(AI)处理器昇腾910D。(法新社) 《华尔街日报》星期天(4月27日)报道引述知情人士称,华为已与多家中国科技公司接洽,探讨测试昇腾910D晶片的技术可行性。 添加图片注释,不超过 140 字(可选) 专家:美国晶片禁令反助中国创新占领全球市场 华为 阅读全文
posted @ 2025-05-02 08:12
吴建明wujianming
阅读(85)
评论(0)
推荐(0)
摘要:
华为挑战英伟达AI霸主地位 添加图片注释,不超过 140 字(可选) 华为近期正加速在AI晶片领域发力,以挑战英伟达AI霸主的地位。图为华为Atlas 800人工智能服务器4月15日在香港博览会展出。(路透社) 添加图片注释,不超过 140 字(可选) 黄仁勋说:“中国并不落后,就在我们身后,距离非 阅读全文
posted @ 2025-05-02 08:08
吴建明wujianming
阅读(114)
评论(0)
推荐(0)
摘要:
在人工智能飞速发展的当下,人工智能智能体(AI Agent)正逐渐崭露头角,成为推动各行业变革的关键力量,也正悄然改变着我们的生活与工作方式。 添加图片注释,不超过 140 字(可选) 一、揭开人工智能智能体的神秘面纱 人工智能智能体通常是指有能力主动思考和行动的智能实体,能够以类似人类的方式工作。 阅读全文
posted @ 2025-05-02 05:00
吴建明wujianming
阅读(130)
评论(0)
推荐(0)
摘要:
据内部情报,DeepSeek的R2目前已经开始小批量测试,正式版于将于年中发布,参数规模直接冲上了1.2万亿大关,关键是价格还将砍到让人直呼"白菜价"!这波操作简直是把性价比玩出了新高度~ 添加图片注释,不超过 140 字(可选) 【黑科技一:涡轮增压版AI引擎】 这次DeepSeek R2祭出了自 阅读全文
posted @ 2025-05-02 04:49
吴建明wujianming
阅读(621)
评论(0)
推荐(0)
摘要:
回顾一下大模型推理服务方法, 层级式地说明这些方法, 实例优化、集群扩缩容策略 等等。 实例优化: 模型的部署, 主要是当单卡内存有限, 把模型参数分布到不同卡上的方法。连续请求调度, 通过预测解码长度, 对批处理优先级进行调度, 较短的请求优先处理减少整体的时延。动态批处理主要处理解码过程中请求的 阅读全文
posted @ 2025-05-02 04:28
吴建明wujianming
阅读(259)
评论(0)
推荐(0)
摘要:
本书推荐《MLIR编译器原理与实践》、《ONNX人工智能技术与开发实践》、《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《MLIR编译器原理与实践》已经出版,京东、淘宝天猫 阅读全文
posted @ 2025-05-02 04:22
吴建明wujianming
阅读(30)
评论(0)
推荐(0)

浙公网安备 33010602011771号