c语言实现wc.exe的基本功能

前言

Github地址:https://github.com/wc-TST-2020/wc

编程语言:C

项目简介

  wc.exe 是一个常见的工具,它能统计文本文件的字符数、单词数和行数。这个项目要求写一个命令行程序,模仿已有wc.exe 的功能,并加以扩充,给出某程序设计语言源文件的字符数、单词数和行数。

实现一个统计程序,它能正确统计程序文件中的字符数、单词数、行数,以及还具备其他扩展功能,并能够快速地处理多个文件。
具体功能要求:
  程序处理用户需求的模式为:

  wc.exe [parameter] [file_name]

 

 

  基本功能列表:

  wc.exe -c file.c     //返回文件 file.c 的字符数

  wc.exe -w file.c    //返回文件 file.c 的词的数目  

  wc.exe -l file.c      //返回文件 file.c 的行数

 


  扩展功能:
      -s   递归处理目录下符合条件的文件。
      -a   返回更复杂的数据(代码行 / 空行 / 注释行)。

  空行:本行全部是空格或格式控制字符,如果包括代码,则只有不超过一个可显示的字符,例如“{”。

  代码行:本行包括多于一个字符的代码。

  注释行:本行不是代码行,并且本行包括注释。一个有趣的例子是有些程序员会在单字符后面加注释:

      } //注释
  在这种情况下,这一行属于注释行。

  [file_name]: 文件或目录名,可以处理一般通配符。

  高级功能:

   -x 参数。这个参数单独使用。如果命令行有这个参数,则程序会显示图形界面,用户可以通过界面选取单个文件,程序就会显示文件的字符数、行数等全部统计信息。

  需求举例:
    wc.exe -s -a *.c


返回当前目录及子目录中所有*.c 文件的代码行数、空行数、注释行数。

 

解题思路

  1. 命令行操作,想到通过C的命令行参数实现。

  2. 行数计算,通过读取'\n'实现。

  3. 字符计算,计算所有字符,读取到EOF停止读取。

  4. 词数计算,通过读取连续的字母(仅限字母,不包括符号.和_)实现。

  5. 空行计算,通过两个换行符之间是否不存在或只存在一个可视字符实现。

  6. 注释行计算,通过计算每行前三个字符是否连续出现字符‘ / ’实现(不能计算注释符 /* */ )。

 

关键代码

  主函数

  通过命令行提示符输入命令和文件位置。判断输入的字符串是否是指定的字符串来调用相关函数,然后输出结果。

  int main(int argc,char *argv[]) {
     //char name[1000];
     //char order[1000];
     //scanf("%s",order);
     //scanf("%s",name);
     if (strcmp(argv[1], "-c") == 0) {
        printf("character %d", count_char(argv[2]));
        printf("\n");
     }
     else if (strcmp(argv[1], "-w") == 0) {
        printf("word %d", count_word(argv[2]));
        printf("\n");
     }
     else if (strcmp(argv[1], "-l") == 0) {
        printf("line: %d", count_line(argv[2]));
        printf("\n");
     }
     else if (strcmp(argv[1], "-a") == 0) {
        printf("empty_line: %d, Comment lines using single line annotators: %d", count_empty_line(argv[2]),count_notes_line(argv[2]));
        printf("\n");
     }
     else printf("we are working\n");
     return 0;
  }

  功能:计算字符数

  每读取一个字符(包括所有字符)记录就加一,直到文件读取完毕

  int count_char(char* name) {
     FILE* fp;
     int num = 0;
     char find;
     //errno_t err;
     if ((fp = fopen(name, "r")) == NULL) {
       printf("File open failed\n");
        return -1;
     }
     while ((find = getc(fp)) != EOF) {
        num++;
     }
     fclose(fp);
     return num;
   } 

  功能:计算单词数

  每读取完一段连续的字母(不包括‘ . ’和‘ _ ’)记录就加一,直到文件读取完毕。

  int count_word(char* name) {
     FILE* fp;
     int num, word, t_word = 0;
     char find;
     //errno_t err;
     num = 0;
     word = 0;
     if ((fp = fopen(name, "r")) == NULL) {
        printf("File open failed\n");
        return -1;
     }
     while ((find = getc(fp)) != EOF) {
        num++;
        if ((find >= 'A' && find <= 'Z') || (find >= 'a' && find <= 'z')) { //将if()内的(find >= 'A' && find <= 'Z') || (find >= 'a' && find <= 'z')
           t_word++;                   //改为(find >= 'A' && find <= 'Z') || (find >= 'a' && find <= 'z')||(find == '.')||(find == '_')
           if (t_word < num) {               //就能避免将A_B_C计成3个单词的情况了。
              t_word = num;
              word++;
           }
        }
     }
     fclose(fp);
    return word;
  } 

 

  功能:计算行数

  计算文件内有多少个‘ \n ’,文件内' \n '的数量加一就是行数。

  int count_line(char* name) {
     FILE* fp;
     int line = 0;
     char find;
     //errno_t err;
     if ((fp = fopen(name, "r")) == NULL) {
        printf("File open failed\n");
        return -1;
     }
     while ((find = getc(fp)) != EOF) {
        if (find == '\n') {
           line++;
        }
     }
     fclose(fp);
     return line+1;
  }

  功能:计算空行数

  将每一行的字符存放在一个字符数组中,读取该字符数组,判断该行中是否存在一个以上可视字符,若是,则该行不是空行。

  int count_empty_line(char* name) {
     FILE* fp;
     int e_line = 0;
     int i,sign = 0;
     int common_sign, special_sign;
     char find;
     char word[1000];
     common_sign = 0;
     special_sign = 0;
     //errno_t err;
     if ((fp = fopen(name, "r")) == NULL) {
        printf("File open failed\n");
        return -1;
     }
     while ((find = getc(fp)) != EOF) {
        word[sign] = find;
        ++sign;
        if(find == '\n'){
           common_sign = 0;
           special_sign = 0;
           for(i = 0; i < sign; i++){
              if(word[i] == ' '|| word[i] == ' ' || word[i] == '\n'){
                 ++common_sign;
              }
              else{
                 ++special_sign;
              }
           }
           if(common_sign == sign || special_sign == 1) ++e_line;
           sign = 0;
        }
     }
     common_sign = 0;
       special_sign = 0;
     for(i = 0; i < sign; i++){
        if(word[i] == ' '|| word[i] == ' ' || word[i] == '\n'){
           ++common_sign;
        }
        else{
           ++special_sign;
        }
     }
     if(common_sign == sign || special_sign == 1) ++e_line;
     fclose(fp);
     return e_line;
  }

  功能:计算用单行注释符的注释行数

  将每一行的字符存放在一个字符数组中,读取该字符数组,判断该行的前三个字符是否存在连续的两个‘/’,若是,则该行是使用单行注释符的注释符行。

  int count_notes_line(char* name) {
     FILE* fp;
     int n_line = 0;
     int i,sign = 0;
     int flag = 0;
     char find;
     char word[1000];
     //errno_t err;
     if ((fp = fopen(name, "r")) == NULL) {
        printf("File open failed\n");
        return -1;
     }
     while ((find = getc(fp)) != EOF) {
        word[sign] = find;
        ++sign;
        if(find == '\n'){
           for(i = 0; i < sign; i++){
              if((i == 0 || i == 1) && (word[i] == '/' && word[i+1] == '/')) ++n_line;
           }
           sign = 0;
        }
     }
     for(i = 0; i < sign; i++){
        if((i == 0 || i == 1) && (word[i] == '/' && word[i+1] == '/')) ++n_line;
     }
     fclose(fp);
     return n_line;
  }

 

测试运行

 用于测试的代码
  #include<stdio.h>
  int main(){
     printf("hello world");
     return 0;
  }//
  /*
 

  */
  asfsdgdfh/* */
  /* */ lasdkfj
  /* /*/
  //
  测试结果:

 

 

PSP

PSP2.1

Personal Software Process Stages

预估耗时(分钟)

实际耗时(分钟)

Planning

计划

20

20

· Estimate

· 估计这个任务需要多少时间

5 * 180

 6 * 180

Development

开发

4 * 180 

5 * 180 

· Analysis

· 需求分析 (包括学习新技术)

120 

120 

· Design Spec

· 生成设计文档

20 

20

· Design Review

· 设计复审 (和同事审核设计文档)

20 

20 

· Coding Standard

· 代码规范 (为目前的开发制定合适的规范)

20

20

· Design

· 具体设计

 120

180 

· Coding

· 具体编码

 120

180

· Code Review

· 代码复审

 30

25 

· Test

· 测试(自我测试,修改代码,提交修改)

 30

40 

Reporting

报告

 40

30

· Test Report

· 测试报告

40 

35 

· Size Measurement

· 计算工作量

20 

20

· Postmortem & Process Improvement Plan

· 事后总结, 并提出过程改进计划

20 

25 

合计

 

2240

 2595

总结

  这个项目让我对主函数参数和如何使用c语言操纵文件有所了解。在这个项目中要使用到主函数参数和C语言与文件有关的函数,则此之前我并没有使用过这两方面的知识,因此这个项目相当一部分时间我都花在掌握这两方面知识上。

 

posted @ 2020-03-15 17:33  八个出了七个  阅读(351)  评论(0)    收藏  举报