软件测试第二周个人作业WordCount程序实现

GitHub地址:https://github.com/Guchencc/WordCount

一.PSP表格

PSP2.1

PSP阶段

预估耗时

(分钟)

实际耗时

(分钟)

Planning

计划

 

 

· Estimate

· 估计这个任务需要多少时间

 300

440

Development

开发

 

 

· Analysis

· 需求分析 (包括学习新技术)

 20

 30

· Design Spec

· 生成设计文档

 10

 10

· Design Review

· 设计复审 (和同事审核设计文档)

 10

 10

· Coding Standard

· 代码规范 (为目前的开发制定合适的规范)

 10

 10

· Design

· 具体设计

 20

 30

· Coding

· 具体编码

 120

 240

· Code Review

· 代码复审

 10

 30

· Test

· 测试(自我测试,修改代码,提交修改)

 20

 30

Reporting

报告

 20

 20

· Test Report

· 测试报告

 10

 10

· Size Measurement

· 计算工作量

 10

 10

· Postmortem & Process Improvement Plan

· 事后总结, 并提出过程改进计划

 10

 10

 

合计

 270

440

 

 

二、解题思路

  了解完题目后,首先回顾了java与文件读写以及目录文件查询等相关函数。改程序是输入命令行然后进行相关操作的,那么首先就需要解析作为主函数参数传入的命令行参数,解析过程中需要区分文件path和命令以及登记相关变量的值,解析完后对变量filelist中的文件进行计数,大体思路如此。

 

 

 

 

三、程序设计实现过程

  本程序实现只用了一个主类WordCount类,其属性如下:

  private String filename; //当前计数处理的文件名

  private int charcount=0;//字符计数器

  private int wordcount=0;//单词计数器

  private int linecount=0;//行计数器

  private int codeLinecount=0;//代码行计数器

  private int blankLinecount=0;//空行计数器

  private int commentLinecount=0;//注释行计数器

  private ArrayList<String> optlist=new ArrayList<>();//存储输入的命令

  private ArrayList<String> stoplist=new ArrayList<>();//存储读取的停用词

  private ArrayList<String> filelist=new ArrayList<>();//存储输入的计数文件

  private String suffix;//存储输入的通配符后缀

  private String outFileName;//存储输入的输出文件名

  private String stopFileName;////存储当前处理的的停用词文件名

 

 

 

  相关函数如下:

  main()为程序主函数。

  CommandParser(String[ ] args)函数接受来自主函数的args数组,解析命令行参数并给WordCount类中的相关属性赋值。

  Count()函数根据解析后的属性赋值进行计数操作,它会计算所有filelist动态数组中的文件,并根据oplist动态数组中的命令选择输出项。

  outprint()函数根据oplist动态数组中的命令选择数据进行文本输出

  resetcount()函数重置各类计数器

  readStopFile()读取输入的停用词文件中的停用词并添加进stoplist动态数组

  findAllFiles()函数递归处理输入的文件路径(包含*.XXX)获取所有以XXX为文件格式的文件路径,并添加进filelist动态数组。

 

四、代码说明

  

public void CommandParser(String[] args) { //命令行参数解析,
    for(int i=0;i<args.length;i++){
        args[i]=args[i].toLowerCase();
        if (args[i].equals("-c")||args[i].equals("-l")||args[i].equals("-w")||args[i].equals("-a")||args[i].equals("-s")) //将计数命令直接添加进oplist
            optlist.add(args[i]);
        else if (args[i].equals("-e")){   //如果输入的命令包含-e 则后面必定是停用词文件路径
            i++;
            if (args.length>i) {
                if (args[i].equals("-o") || args[i].equals("\n")) {
                    System.out.println("未输入停用单词表文件名!");
                    return;
                }
            }else  {
                System.out.println("未输入停用单词表文件名!");
                return;
            }
            stopFileName=args[i];
            optlist.add(args[--i]);
            readStopFile();
        }
        else if (args[i].equals("-o")){  //如果输入的命令包含-o 则后面必定是输出文件路径
            if(++i==args.length) {
                System.out.println("未输入输出文件名!");
                return;
            }
            outFileName=args[i];
            optlist.add(args[--i]);
        }
        else if (args[i].equals(outFileName)||args[i].equals(stopFileName));
        else if (optlist.contains("-s") && args[i].matches(".*\\*[.](txt|c|py|java|cpp)$")){    //根据正则表达式匹配输入的含有通配符的路径
            String root="";
            suffix=args[i].substring(args[i].lastIndexOf('.')+1,args[i].length());  //获取想要获取的文件后缀名
            root=args[i].replaceAll("\\*[.](txt|c|py|java|cpp)$","");   //获取想要查找含有通配符格式的文件根目录
            if (root.length()<1)        //如果没有指定目录则从当前目录开始查找
                root=System.getProperty("user.dir");
            findAllFiles(root);      //查找匹配通配符格式的所有文件
        }
        else if (!optlist.contains("-s"))   //如果输入的命令行中无-s  则输入文件名不包含通配符,而是具体的文件路径,直接添加进filelist中
            filelist.add(args[i]);
    }
}

  

  

 


public void Count() throws Exception {
    String str="";
    boolean isstop=false;
    for (int i=0;i<filelist.size();i++){  //遍历待统计文件数组,并根据相关名词定义进行计数
        String path=filelist.get(i);
        filename=path.substring(path.lastIndexOf('\\')+1,path.length());
        BufferedReader br=new BufferedReader(new InputStreamReader(new FileInputStream(filelist.get(i))));
        while((str=br.readLine())!=null) {
            if (str.trim().replaceAll("(//.*|/\\*.*\\*/|/\\*.*|\\*/|\\{|\\})","").length()>1)
                codeLinecount++;
            if (str.trim().matches("^(//|/\\*).*") || str.trim().matches("^[!-~](//.*|/\\*.*\\*/)") || str.trim().matches("\\*/")){
                commentLinecount++;
            }
            if(str.matches("\\s*") || (str.trim().length()==1 && (str.trim().charAt(0)>0x21 && str.trim().charAt(0)<0x7F)))
                blankLinecount++;

            linecount++;
            charcount+=str.length();
            String[] words=str.trim().split("\\s|,");
            if (optlist.contains("-e")){    //如果命令包含-e 则遍历单词,若遇到与stoplist中相同的单词则不进行word计数
                for(String word:words) {
                    for (String stopword : stoplist) {
                        if (word.equals(stopword))
                            isstop = true;
                    }
                    if (!isstop && !word.equals(""))
                        wordcount++;
                    isstop = false;
                }
            }
            else {
                for (String word:words)
                    if (!word.equals(""))   //如果命令不包含-e 则直接对单词计数
                        wordcount++;
            }
            isstop=false;
        }
        charcount=charcount+linecount-1;    // \r\t

        if (optlist.contains("-c")){    //根据oplist中的统计命令选择输出结果
            System.out.println(filename+","+"字符数:"+charcount);
        }
        if (optlist.contains("-w")){
            System.out.println(filename+","+"单词数:"+wordcount);
        }
        if (optlist.contains("-l")){
            System.out.println(filename+","+"行数:"+linecount);
        }
        if (optlist.contains("-a")){
            System.out.println(filename+","+"代码行/空行/注释行:"+codeLinecount+"/"+blankLinecount+"/"+commentLinecount);
        }
        outprint();     //记录统计结果
        resetCount();   //重置计数器
    }
}

  


public void outprint(){
    File file=null;
    String str="";
    if (!optlist.contains("-c")&&!optlist.contains("-w")&&!optlist.contains("-l")&&!optlist.contains("-a")){
        System.out.println("无统计操作,无输出项!");
        return;
    }
    if(optlist.contains("-o") && outFileName!=null)
        file = new File(outFileName);       //如果指定输出文件路径,则在相应路径输出统计结果
    else
        file = new File("result.txt");      //否则在当前路径下的result.txt文件中输出。
    try{
        FileWriter fw=new FileWriter(file,true);
        PrintWriter pw=new PrintWriter(fw);
        if(!file.exists()){
            file.createNewFile();
        }
        if (optlist.contains("-c"))         //根据oplist中的命令选择记录统计结果
            str+=filename+","+"字符数:"+charcount+"\r\n";
        if (optlist.contains("-w"))
            str+=filename+","+"单词数:"+wordcount+"\r\n";
        if (optlist.contains("-l"))
            str+=filename+","+"行数:"+linecount+"\r\n";
        if (optlist.contains("-a"))
            str+=filename+","+"代码行/空行/注释行:"+codeLinecount+"/"+blankLinecount+"/"+commentLinecount+"\r\n";
        pw.write(str);
        pw.close();
        fw.close();
    }catch (Exception e){
        System.out.println("输出文件失败!");
    }
}

  

  


public void readStopFile(){
    String str="";
    String[] stopwords;
    try {
        BufferedReader bf = new BufferedReader(new InputStreamReader(new FileInputStream(stopFileName)));
        while ((str = bf.readLine()) != null) {     //遍历输入的停用词文件并登记停用词
            stopwords = str.trim().split("\\s");
            Collections.addAll(stoplist, stopwords);
        }
    }catch (Exception e){
        System.out.println("读取停用词表错误!");
    }
}

  

public void findAllFiles(String path){
    File file=new File(path);
    if (!file.isDirectory()) {
        String filename = file.getName();
        if (filename.substring(filename.lastIndexOf('.') + 1, filename.length()).equals(suffix))   //将文件后缀与提取的通配符后缀比较,若相同则将该文件路径加入filelist
            filelist.add(file.getAbsolutePath());

    } else if (file.isDirectory()){
        for (File f:file.listFiles())
            findAllFiles(f.getAbsolutePath());      //递归遍历文件夹与文件
    }
}

  

  

五、测试设计过程

主要测试文件 test.txt

 

 

(1)基本功能

①统计字符 -c

输入:wc.exe -c test.c

 

②统计单词数 -w

输入:wc.exe -w test.c

③统计行数 -l

输入:wc.exe -l test.c

④输出文件 -o

输入:wc.exe -c -w -l test.c -o output.txt

 

(2)扩展功能

①统计代码行、空行、注释行 -a

输入:wc.exe -a test.c

 

②停用词表 -s

停用词文件stoplist.txt

 

输入:wc.exe -w test.c

 

 输入:wc.exe -w test.c -e stoplist.txt

 

③文件夹遍历处理  -s

 

输入:wc.exe -s -c -w -l -a *.txt

 

输入:wc.exe -s -c -w -l -a *.c

 

 

 输入:wc.exe -s -c C:\Users\Guchen\gitrepository\untitled1\bin\jre1.8.0_111\*.txt

 

 

 

 

六、参考文献链接

https://baike.baidu.com/item/正则表达式/1700215?fr=aladdin

http://www.cnblogs.com/ningjing-zhiyuan/p/8563562.html

http://blog.csdn.net/zamamiro/article/details/70172900

http://blog.csdn.net/honjane/article/details/40739337

 

posted @ 2018-03-22 19:46  Guchen  阅读(268)  评论(2编辑  收藏  举报