18软工作业(2020.10.09)

姓名:刘吉

学号:2018****07113

仓库地址 : https://gitee.com/Liuji113/liuji_-project

 

时间安排:           任务   ——               计划用时      ——     实际用时

       搭建配置开发环境    15分钟     ——     10分钟

            完成作业实现的程序    4个小时     ——    5个小时

       代码整理                        10分钟       ——    15分钟

             撰写单元测试                4个小时     ——    4个小时

           程序进行效能分析        2个小时     ——    2个小时

        撰写博客码云                   20分钟      ——    15分钟

 

设计思路:

Step-0:输出某个英文文本文件中 26 字母出现的频率,由高到低排列,并显示字母出现的百分比,精确到小数点后面两位。

Step-1:输出单个文件中的前 N 个最常出现的英语单词。

Step-2:   支持 stop words,我们可以做一个 stop word 文件 (停词表), 在统计词汇的时候,跳过这些词。

Step-3:   输出某个英文文本文件中 单词短语出现的频率,由高到低排列,并显示字母出现的百分比,精确到小数点后面两位。

Step-4:   把动词形态都统一之后再计数。 

 

代码片段:

 

 输出结果:

 

Eclipse测试

 

 

   

posted @ 2020-10-09 21:16  阿凡先生-  阅读(119)  评论(0)    收藏  举报