OI中卡常数技巧

一、I/O优化

读入优化是卡常数最重要的一条！

1 inline int read()
2 {
3     int x=0,f=1;char c=getchar();
4     while(c<'0'||c>'9'){if(c=='-')f=-1;c=getchar();}
5     while(c>='0'&&c<='9'){x=x*10+c-'0';c=getchar();}
6     return x*f;
7 }

输出优化好像不常用...

二、inline

在声明函数之前写上inline，可以加快一下函数调用，但只能用于一些操作简单、调用频繁的函数。涉及递归，大号的循环等很复杂的函数，编译器会自动忽略inline。（我不知道强制inline有没有用）。

三、register

在定义变量前写上register，用于把变量放到CPU寄存器中，适用于一些使用频繁的变量（比如循环变量），但寄存器空间有限，如果放得变量太多，多余变量就会被放到一般内存中

快到什么境界？

register int a=0;
for(register int i=1;i<=999999999;i++)
a++;

int b=0;
for(int i=1;i<=999999999;i++)
b++;

优化：0.2826 sec

不优化：1.944sec

四、初始化优化

在初始化Floyd或者其他类似的东西

for(int i=1;i<=n;i++)
    for(int j=1;j<=n;j++)
        gra[i][j]=inf
for(int i=1;i<=b;i++)
    gra[i][i]=0

是比

for(int i=1;i<=n;i++)
    for(int j=1;j<=n;j++)
    {
        if(i==j)    gra[i][j]=0;
        else       gra[i][j]=inf
    }

快的（测试大约1是2的80%的时间）

原因后者每次都要判断

五、循环展开

循环展开也许只是表面，在缓存和寄存器允许的情况下一条语句内大量的展开运算会刺激 CPU 并发(前提是你的 CPU 不是某 CPU)...

减少了不直接有助于程序结果的操作的数量，例如循环索引计算和分支条件。
提供了一些方法，可以进一步变化代码，减少整个计算中关键路径上的操作数量。

用法（下面是一个将一个int 类型数组初始化为0的代码段）：

void Init_Array(int *dest, int n)
{
    int i;
    for(i = 0; i < n; i++)
        dest[i] = 0;
}

而如果用循环展开的话，代码如下:

void Init_Array(int *dest, int n)
{
    int i;
    int limit = n - 3;
    for(i = 0; i < limit; i+= 4)//每次迭代处理4个元素
    {
        dest[i] = 0;
        dest[i + 1] = 0;
        dest[i + 2] = 0;
        dest[i + 3] = 0;
    }
    for(; i < n; i++)//将剩余未处理的元素再依次初始化
        dest[i] = 0;
}

六、取模优化

//设模数为 mod
inline int inc(int x,int v,int mod){x+=v;return x>=mod?x-mod:x;}//代替取模+
inline int dec(int x,int v,int mod){x-=v;return x<0?x+mod:x;}//代替取模-

七、前置++

后置 ++ 需要保存临时变量以返回之前的值，在 STL 中非常慢。事实上，int 的后置 ++ 在实测中也比前置 ++ 慢 0.5 倍左右（UOJ 上自定义测试）

八、bool优化

不要开bool，所有bool改成char，int是最快的(原因不明)。

九、选择结构优化

if()else语句比()?():()语句要慢，逗号运算符比分号运算符要快。

posted @ 2017-10-15 22:26 iBilllee 阅读(4991) 评论(0) 收藏举报

刷新页面返回顶部

iBilllee

OI中卡常数技巧

公告