18软工作业(2020.10.09)
姓名:刘吉
学号:2018****07113
仓库地址 : https://gitee.com/Liuji113/liuji_-project
时间安排: 任务 —— 计划用时 —— 实际用时
搭建配置开发环境 15分钟 —— 10分钟
完成作业实现的程序 4个小时 —— 5个小时
代码整理 10分钟 —— 15分钟
撰写单元测试 4个小时 —— 4个小时
程序进行效能分析 2个小时 —— 2个小时
撰写博客码云 20分钟 —— 15分钟
设计思路:
Step-0:输出某个英文文本文件中 26 字母出现的频率,由高到低排列,并显示字母出现的百分比,精确到小数点后面两位。
Step-1:输出单个文件中的前 N 个最常出现的英语单词。
Step-2: 支持 stop words,我们可以做一个 stop word 文件 (停词表), 在统计词汇的时候,跳过这些词。
Step-3: 输出某个英文文本文件中 单词短语出现的频率,由高到低排列,并显示字母出现的百分比,精确到小数点后面两位。
Step-4: 把动词形态都统一之后再计数。
代码片段:

输出结果:

Eclipse测试


浙公网安备 33010602011771号