胡说八道

学而不思则罔,思而不学则殆

  博客园 :: 首页 :: 新随笔 :: 联系 :: 订阅 :: 管理 ::
      通过一个Vector*Matrix的例子来详细的讲述了如何使用SSE来优化我们的操作,讲解的很详细了.

      例子分成下面的这几个步骤来完成优化操作:
      Naïve C++ 
      Basic SSE 
      Batch Processing
      16-byte memory alignment 
      Instruction Pairing
      Prefetching
      Increase Temporal Locality of Memory I/O 
      Application-Specific Specialization 

      最终函数的执行时间从90 cycles/vector降到了17 cycles/vector,呵呵

    Optimizing for SSE: A Case Study
posted on 2004-12-29 12:19  胡说八道  阅读(805)  评论(0)    收藏  举报