使用 StreamTokenizer类获得文本中的单词和数字个数
package com.utils;
import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.io.StreamTokenizer;
public class WordCount {
	public static void main(String[] args) {
		// TODO 自动生成的方法存根
		File file = new File("D://tmp/unZipFile.txt");
		int wordCounter = 0;
		int numberCounter = 0;
		FileReader reader = null;
		try {
			reader=new FileReader(file);
			StreamTokenizer st=new StreamTokenizer(reader);
			while(st.nextToken()!=StreamTokenizer.TT_EOF){
				switch(st.ttype){
				case StreamTokenizer.TT_NUMBER:
					numberCounter++;
					break;
				case StreamTokenizer.TT_WORD:
				    wordCounter ++;
				   break;
				}
			}
		} catch (FileNotFoundException e) {
			// TODO 自动生成的 catch 块
			e.printStackTrace();
		} catch (IOException e) {
			// TODO 自动生成的 catch 块
			e.printStackTrace();
		}
	System.out.println( wordCounter );
	System.out.println( numberCounter );
	}
}
posted on 2016-02-27 20:29 1130136248 阅读(173) 评论(0) 收藏 举报
 
                    
                 
                
            
         浙公网安备 33010602011771号
浙公网安备 33010602011771号