文档字符统计程序模型


/* 文档字符统计程序模型
    功能:
    1. 读取*.txt格式文件,统计其字数(汉字,字母,数字,标点分别输出);
    2. 按出现次数统计文件内的单字(n=1),并按降序排序输出,同时输出出现次数;
       (a. 穷尽每一个不同的单字; b. 排序结果有序号)
    3. 按同样方式输出n=2~N时的结果,N为输出的每一段字符出现次数均为1时的最短字符长度;
    4. 上述第2、第3条要求仅针对汉字操作(当文件为英文文件时对英文单词操作);
    5. 输出结果生成**.txt格式文件。
    例如:
    读取 情人.txt
    输出 情人-N.txt
    --
    汉字 12658 字母 562 数字 8 标点 3206
    --
    n=1
    1 人 355
    2 中 230
    3 妈 80
    4 爱 55
    5 美 33
    6 丽 33
    ...
    78 生 1
    79 僻 1
    80 字 1
    --
    n=2
    1 回忆 56
    2 美好 20
    3 欢喜 15
    4 伤痛 10
    ...
    45 再见 1
    46 无力 1
    --
    n=3
    ...
    --
    n=N
    ...
    --
 */

 

posted @ 2015-09-26 13:48  misybing  阅读(38)  评论(0)    收藏  举报