文档字符统计程序模型
/* 文档字符统计程序模型
功能:
1. 读取*.txt格式文件,统计其字数(汉字,字母,数字,标点分别输出);
2. 按出现次数统计文件内的单字(n=1),并按降序排序输出,同时输出出现次数;
(a. 穷尽每一个不同的单字; b. 排序结果有序号)
3. 按同样方式输出n=2~N时的结果,N为输出的每一段字符出现次数均为1时的最短字符长度;
4. 上述第2、第3条要求仅针对汉字操作(当文件为英文文件时对英文单词操作);
5. 输出结果生成**.txt格式文件。
例如:
读取 情人.txt
输出 情人-N.txt
--
汉字 12658 字母 562 数字 8 标点 3206
--
n=1
1 人 355
2 中 230
3 妈 80
4 爱 55
5 美 33
6 丽 33
...
78 生 1
79 僻 1
80 字 1
--
n=2
1 回忆 56
2 美好 20
3 欢喜 15
4 伤痛 10
...
45 再见 1
46 无力 1
--
n=3
...
--
n=N
...
--
*/

浙公网安备 33010602011771号