摘要: 实际上,搞汇编优化的很多时间是在处理如何有效的组织数据,以适应并行计算指令的数据结构。本小结描述的是数据混洗指令,这类指令使用起来相当的灵活。具体如下: 1. shufps XMM,XMM/m128,imm8(0~255) 描述: 从指令后缀来看,这是一条SSE1指令。 该指令把源存储器与目的寄存器按双字32位划分,由立即数imm8八个二进制位(00~11,00^11,00~11,00~11)指定排列, 目的寄存器高64位放源存储器被指定数,目的寄存器低64位放目的寄存器被指定数。内存变量地址必须对齐16字节 imm8的高4位选的是源存储器,低4位选的是目的... 阅读全文
posted @ 2013-04-23 12:22 celerychen 阅读(2291) 评论(0) 推荐(0)
摘要: SSE4.1指令集在视频编码中的运用 阅读全文
posted @ 2013-04-02 15:24 celerychen 阅读(4795) 评论(1) 推荐(1)
摘要: SSE指令在视频编码中的运用 阅读全文
posted @ 2013-04-01 10:59 celerychen 阅读(908) 评论(0) 推荐(0)
摘要: SSSE3指令集 阅读全文
posted @ 2013-03-29 17:12 celerychen 阅读(5177) 评论(0) 推荐(0)
摘要: SSE3指令集 阅读全文
posted @ 2013-03-29 15:28 celerychen 阅读(1719) 评论(0) 推荐(0)
摘要: SSE混选指令 阅读全文
posted @ 2013-03-28 17:28 celerychen 阅读(1144) 评论(0) 推荐(0)
摘要: SSE定点运算指令 阅读全文
posted @ 2013-03-28 16:25 celerychen 阅读(1034) 评论(0) 推荐(0)
摘要: SSE2浮点指令集 阅读全文
posted @ 2013-03-28 10:58 celerychen 阅读(1653) 评论(0) 推荐(0)
摘要: SSE指令集系列 阅读全文
posted @ 2013-03-27 15:03 celerychen 阅读(911) 评论(0) 推荐(0)
摘要: SSE指令集系列 阅读全文
posted @ 2013-03-27 14:49 celerychen 阅读(589) 评论(0) 推荐(0)