code_analyzer(代码分析助手)

软件名： code_analyzer

使用c语言 pcre正则库分析源码文件，包括文件中的头文件、宏定义、函数。

用途：

无聊时，可以用来打发下时间。

演示：

对于本源程序的分析结果如下：

##########################头文件########################

1.头文件:              stdio.h
2.头文件:             stdlib.h
3.头文件:             string.h
4.头文件:               pcre.h

##########################宏##########################

1.宏原型: #define OVECCOUNT 30
宏名:            OVECCOUNT
值:                   30
2.宏原型: #define EBUFLEN 128
宏名:              EBUFLEN
值:                  128
3.宏原型: #define BUFLEN 10024
宏名:               BUFLEN
值:                10024

########################函数#########################

1.函数原型: int main(int argc, char *argv[])
函数返回值:       int 
函数名:            main
参数: int argc, char *argv[]

2.函数原型: void read_file(char *filename, char *buf)
函数返回值:      void 
函数名:       read_file
参数: char *filename, char *buf

3.函数原型: int regex_f(char *src, char *pattern, regex_buf *re_buf, regex_flag flag)
函数返回值:       int 
函数名:         regex_f
参数: char *src, char *pattern, regex_buf *re_buf, regex_flag flag

使用方法：

命令行使用方法是:

参数1:源程序文件, 参数2:输出文件名(可选项,默认out.txt)

源码：

//********************************************************************************
//            Author:             tanhehe
//            DateTime:           Mon Aug 26 19:34:47 2013
//            SearchMe:           http://www.cnblogs.com/tanhehe
//            email:              443016215@qq.com
//            程序名:              CodeAnalyzer
//            Description:        代码分析助手
//
//********************************************************************************

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <pcre.h>

#define OVECCOUNT 30
#define EBUFLEN 128
#define BUFLEN 10024

typedef enum regex_flag {REG_FUNCTION, REG_MACRO, REG_HEADERS, REG_VARIABLES}regex_flag;

union regex_content {
    char func[100][5][100];    /* 存储函数信息 */
    char macr[100][3][30];    /* 存储宏信息 */
    char head[100][2][30];    /* 存储头文件信息 */
};

typedef struct regex_buf {
    int cn;
    regex_flag flag;
    union regex_content buf;
}regex_buf;

void read_file(char *filename, char *buf);
int regex_f(char *src, char *pattern, regex_buf *re_buf, regex_flag flag);

char buf[BUFLEN];

int main(int argc, char *argv[]) {
    char    *ifilename        = "main.c";
    char    *ofilename        = "out.txt";
    char    *pattern_function    = "((\\w+\\s+\\*?)(?#返回值)\\s*+(\\w+)(?#函数名)\\s*\\(((.(?![\"=><])(?#参数内不能包含引号))*)(?#参数)\\))\\s*{";
    char    *pattern_macro        = "#\\s?define\\s+(\\w+)\\s+(.+)";
    //char    *pattern_variables    = "(\\w+)\\s+(\\w+);";
    char    *pattern_headers    = "#\\s*include\\s*<(.+)>";

    FILE    *fp;
    regex_buf    re_buf;
    int        i;

    if(argc < 2) {
        fprintf(stderr, "缺少源文件\n");
        return 1;
    }
    if(argc >= 2) {
        ifilename = argv[1];
    }
    if(argc >= 3) {
        ofilename = argv[2];
    }

    if((fp = fopen(ofilename, "w")) == NULL) {
        fprintf(stderr, "open file error!\n");
    }

    read_file(ifilename, buf);
    printf("成功读取%s......\n", ifilename);

    fprintf(fp, "\n##########################头文件########################\n\n");
    if(regex_f(buf, pattern_headers, &re_buf, REG_HEADERS) == 0) {
        for(i=0; i<re_buf.cn; i++) {
            fprintf(fp, "%d.头文件: %20s\n", i+1, re_buf.buf.head[i][1]);
        }
    }
    printf("已分析完毕头文件......\n");

    fprintf(fp, "\n##########################宏##########################\n\n");
    if(regex_f(buf, pattern_macro, &re_buf, REG_MACRO) == 0) {
        for(i=0; i<re_buf.cn; i++) {
            fprintf(fp, "%d.宏原型: %s\n", i+1, re_buf.buf.macr[i][0]);
            fprintf(fp, "宏名: %20s\n值: %20s\n", re_buf.buf.macr[i][1], re_buf.buf.macr[i][2]);
        }
    }
    printf("已分析完毕宏定义......\n");

    fprintf(fp, "\n########################函数#########################\n\n");

    if(regex_f(buf, pattern_function, &re_buf, REG_FUNCTION) == 0) {
        for(i=0; i<re_buf.cn; i++) {
            fprintf(fp, "%d.函数原型: %s\n", i+1, re_buf.buf.func[i][1]);
            fprintf(fp, "函数返回值: %10s\n函数名: %15s\n参数: %20s\n\n", re_buf.buf.func[i][2], re_buf.buf.func[i][3], re_buf.buf.func[i][4]);
        }
    }

    printf("已分析完毕函数......\n");

    fclose(fp);
    printf("已成功写入%s......\n", ofilename);
    return 0;
}

void read_file(char *filename, char *buf) {
    FILE            *fp;
    char        temp[1000];

    if((fp = fopen(filename, "r")) == NULL) {
        fprintf(stderr, "readerr!\n");
        exit(1);
    }

    buf[0] = '\0';

    while(fgets(temp, sizeof(temp)-1, fp)) {
        strcat(buf, temp);
    }
}


int regex_f(char *src, char *pattern, regex_buf *re_buf, regex_flag flag) {
    pcre        *re;
    const char        *error;
    int            erroffset;
    int            ovector[OVECCOUNT];
    int            rc, i;
    int            cn = 0;

    re_buf->flag = flag; re_buf->cn = 0;

    re = pcre_compile(pattern, 0, &error, &erroffset, NULL);
    if(re == NULL) {
        printf("PCRE compilation failed at offset %d: %s\n", erroffset, error);
        return 1;
    }

    rc = pcre_exec(re, NULL, src, strlen(src), 0, 0, ovector, OVECCOUNT);
    if(rc < 0) {
        if(rc == PCRE_ERROR_NOMATCH) printf("Sorry, no match ...\n");
        else printf("Matching error %d\n", rc);
        free(re);
        return -1;
    }

    for(i=0; i<rc; i++) {
        char *substring_start = src + ovector[2*i];
        int substring_length = ovector[2*i+1]-ovector[2*i];

        //printf("%2d: %.*s\n", i, substring_length, substring_start);
        switch(flag) {
        case REG_MACRO:
            sprintf(re_buf->buf.macr[cn][i], "%.*s", substring_length, substring_start);
            break;
        case REG_FUNCTION:
            sprintf(re_buf->buf.func[cn][i], "%.*s", substring_length, substring_start);
            break;
        case REG_HEADERS:
            sprintf(re_buf->buf.head[cn][i], "%.*s", substring_length, substring_start);
            break;
            //  扩展
        }
    }
    cn++;

    for(;;) {
        int start_offset = ovector[1];
        rc = pcre_exec(re,  NULL, src, strlen(src), start_offset, 0, ovector, OVECCOUNT);

        if(rc == PCRE_ERROR_NOMATCH) { /* 匹配完毕 */
            break;
        }
        else if(rc < 0) {    /* 匹配错误 */
            //printf("Matching error %d\n", rc);
            pcre_free(re);
            return 1;
        }
        else if(rc == 0) {            /* 匹配, 但空间不足 */
            rc = OVECCOUNT/3;
            printf("ovector only has room for %d captured substring\n", rc-1);
            return 1;
        }

        for(i=0; i<rc; i++) {
            char *substring_start = src + ovector[2*i];
            int substring_length = ovector[2*i+1] - ovector[2*i];
    //        printf("%2d: %.*s\n", i, substring_length, substring_start);
            switch(flag) {
            case REG_MACRO:
                sprintf(re_buf->buf.macr[cn][i], "%.*s", substring_length, substring_start);
                break;
            case REG_FUNCTION:
                sprintf(re_buf->buf.func[cn][i], "%.*s", substring_length, substring_start);
                break;
            case REG_HEADERS:
                sprintf(re_buf->buf.head[cn][i], "%.*s", substring_length, substring_start);
                break;
            // 扩展
            }
        }
        cn++;
    }

    pcre_free(re);

    re_buf->cn = cn;
    return 0;
}

说明 :

因为在windows下，配置pcre库未成功，所以不打算弄个windows版本了。只有linux版本.
其实呢，这个软件和上一个是我目标软件中的两个功能。现在把他们单独实现。随着以后的学习，有能力时，会继续完成其他功能，然后整合在一起。

源程序：http://tanhe123.ys168.com/

源代码：https://github.com/tanhe123/code_analyzer

posted on 2013-08-27 11:37 Still_Raining 阅读(2969) 评论(4) 收藏举报