摘要: 说明 本文作为上一篇 矩阵转置 transpose 复现的补充测试。来看看 streaming store 到底什么实力。 性能测试 FORCE_INLINE void transpose_8x8_store_contiguous(const uint8_t* src0, const uint8_t 阅读全文
posted @ 2025-11-19 20:52 咖啡放葡萄糖 阅读(114) 评论(2) 推荐(0)
摘要: 说明 矩阵转置是高性能计算中的经典问题。OpenCV 的 transpose 函数内部依赖 ippicv 库中的 ippiTranspose_8u_C1R 实现。本文将对该优化算法进行复现与分析。 与上一篇基于 cv::flip / ippiMirror 的图像翻转不同,矩阵转置不再是简单的行内倒序 阅读全文
posted @ 2025-11-19 00:30 咖啡放葡萄糖 阅读(206) 评论(4) 推荐(0)