20200917-3 白名单

作业要求参见:https://edu.cnblogs.com/campus/nenu/2020Fall/homework/11207

作业0(5分)

修改create.cpp文件,改成由命令行参数确定生成的数据的数据量。修改readme.md的对应部分。(要求贴出修改之后的代码和read.md。)

查找C++命令行参数相关介绍:参数argc就代表启动程序时,命令行参数的个数,argv是一个数组,其中的每个元素都是一个char*类型的指针,该指针指向一个字符串,这个字符串里就存放着命令行参数。查找atoi()函数含义:将数字格式的字符串转换为整数类型。

修改后的代码:

//create.cpp
#include <iostream>
#include <stdlib.h>
#include <time.h>

using namespace std;

int main(int argc, char* argv[])
{
    int n = atoi(argv[1]);
    srand((unsigned)time(NULL));
    for (int i = 0; i < n; i++)
    {
        cout << rand() << "\n";
    }
    cout << endl;
    return 0;
}

修改后的ReadMe.md

作业1(10分)

对上面两段老杨写的代码任选其一进行profile,观察现象(要求有截图记录)。

选择对brute.cpp程序进行profile,性能分析图如下:

分析:发现brute.cpp程序中的输入、输出CPU使用占比较大,尤其是输出,导致brute.cpp程序运行缓慢。

你是一个好人,为了让老杨知道为什么要对代码进行profile,于是你在原来的题目的基础上做出了修改,修改之后的题要求如下:

1) 读入两个文件,一个用控制台,一个用命令行参数指出文件名。

文件 biggerwhitelist,包含1列整数1M个,随机生成(要求老杨自己想办法),通过命令行参数指出文件名。

设置命令行参数截图:

结果截图:

文件 biggerq,包含1列整数10M个,随机生成(也要求老杨自己想办法),通过控制台读入。

控制台读入截图:

结果截图:

2) 在文件biggerq中查找所有不在biggerwhitelist中的整数,重定向输出到一个文件中。

控制台截图:

结果截图:

3) 写一份如何部署运行代码的readme。

作业2(10分)

以biggerwhitelist和biggerq作为输入,对作业1中选择的代码再次进行profile,找到代码执行最“慢”的地方,截图为证并文字说明。

对作业1选择的文件brute.cpp代码(原基础上有做修改---is_match函数)再次profile,性能分析图如下:

运行时间截图:

分析:从性能分析图中可以看到is_match函数占用CPU很大,达到94.52%,从运行时间截图中可以看出用了17:47min,时间很长。所以is_match函数处是执行最慢的地方。具体到相应代码位置,得出结论是:is_match函数中的for循环CPU占比较大,所以下一步应该对is_match函数进行优化。

作业3(10分)

根据作业2找到的最慢的地方,优化作业1中你选择的代码,在保证输出结果正确的前提下,减少老杨程序运行的时间。(优化后的代码需要你提交到git上,作为教师的判断依据。优化后的程序的名字应该是better.cpp或者better.cs。)

对brute.cpp文件代码的is_match函数部分使用二分法查找进行优化,可以大大提高查找的速度。

优化后的重要代码:

bool is_match(int t, int w[], int w_length)
{    
    int left = 0, right = w_length - 1, mid;
    while (left < right)
    {
        mid = (left + right) / 2;
        if (t == w[mid])
            return false;
        else if (t < w[mid])
        {
            right = mid - 1;
        }
        else if (t > w[mid])
        {
            left = mid + 1;
        }
    }
    return true;
}

coding.net代码地址:https://zhangwenyan1.coding.net/public/writelist/brute/git

作业4(5分)

对作业3优化后的代码进行profile,结果与作业2的结果做对比。画表格并文字说明。

对优化后的代码进行profile,性能分析图如下: 

运行时间截图:

分析:从性能分析图中可以看出better.cpp程序中的is_match函数执行过程中CPU占比是1.14%,比较上次profile的结果,明显优化成功。从运行时间截图中可以看出用了2:54min,时间相比优化前缩短很多。

优化前后表格对比:

分析:优化前后,is_match函数CPU占比大大减小,减少了93.38%,且运行时间也明显缩短,缩短了14:53min。因此我认识到了profile的重要性,以及优化代码所起到的作用,可以减小CPU占比,提高程序运行效率。

做业5(5分)

你觉得老杨的文档(readme),注释和代码风格又哪些问题,该如何改进?

  • 文档(readme)中不够详细。

例如这句:执行“create 10>whitelist”生成文件whitelist;

我认为可以写成这样:执行“create 10>whitelist”调试create.cpp文件成whitelist文件;可能更易让读者清楚其中的过程。

  • 文档(readme)中有错误。

例如这句:执行“brute -w q < whitelist > output”

根据功能要求应改为:执行“brute -w whitelist < q > output”

  • 程序中的注释不规范,且有多余,建议规范代码,删除多余处。

例如这部分代码:

// init w
////    for(int i=0;i<w_1m)
////    {
////        w[i]=-1; //填充非法数据
////    }

多行注释可用:/* 注释 */    如下图所示:

  • 在原brute.cpp文件中,发现is_match函数代码与程序要求不匹配,需要进行修改,修改前后代码如下:

修改前is_match函数代码:

bool is_match(int t, int w[], int w_length)
{
    for(int i=0;i<w_length;i++)
    {
        if(t!=w[i])
        {
            return true;
        }
    }
    return false;
}

且修改之前的brute.cpp中这段代码中!=中的!使用了中文!导致程序错误。

修改后is_match函数代码:

bool is_match(int t, int w[], int w_length)
{
    for(int i=0;i<w_length;i++)
    {
        if(t==w[i])
        {
            return false;
        }
    }
    return true;
}
posted @ 2020-09-23 11:41  zwh12  阅读(189)  评论(0编辑  收藏  举报