摘要:
本文针对FlashAttention反向融合算子的性能优化方案展开介绍,并通过优化实现了典型场景4倍左右的性能提升,希望对开发者优化此类基于Ascend C开发的融合算子带来启发。 阅读全文
posted @ 2024-06-12 14:08
华为云开发者联盟
阅读(350)
评论(0)
推荐(1)
摘要:
本文介绍了在Python中使用线程池和进程池来实现并发编程的方法,并提供了相应的代码示例。 阅读全文
posted @ 2024-06-12 10:04
华为云开发者联盟
阅读(672)
评论(0)
推荐(3)
摘要:
GaussDB作为企业级的数据库,经过了多年的技术发展,具备丰富的技术特性,使用LLVM技术后提升了系统的查询性能,使得开发者在OLAP和OLTP多场景中均受益。 阅读全文
posted @ 2024-06-12 09:24
华为云开发者联盟
阅读(448)
评论(0)
推荐(0)
浙公网安备 33010602011771号