利用IK Analyzer分词

 1 import java.io.IOException;
 2 import java.io.StringReader;
 3 import org.apache.lucene.analysis.Analyzer;
 4 import org.apache.lucene.analysis.TokenStream;
 5 import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
 6 import org.wltea.analyzer.lucene.IKAnalyzer;
 7 
 8 public class IK_Analyzer {
 9     
10     public static String Seg(String sentence) throws IOException {
11         String text="";
12         //创建分词对象
13         Analyzer anal=new IKAnalyzer(true);
14         StringReader reader=new StringReader(sentence);
15         //分词
16         TokenStream ts=anal.tokenStream("", reader);
17         CharTermAttribute term=ts.getAttribute(CharTermAttribute.class);
18         //遍历分词数据
19         while(ts.incrementToken()){
20             text+=term.toString()+"/";
21         }
22         reader.close();
23         anal.close();
24         return text.trim()+"\n";
25     }
26 
27     public static void main(String[] args) {
28         try {
29             System.out.println(IK_Analyzer.Seg("你妈妈喊你回家吃饭哦,回家喽!回家喽!"));
30             System.out.println(IK_Analyzer.Seg("你非常好,像白马一样。"));
31             System.out.println(IK_Analyzer.Seg("白龙马,名著小说《西游记》中的角色。本是西海龙王三太子,因纵火烧毁玉帝赏赐的明珠而被西海龙王上天庭告忤逆,要被斩首。后因南海观世音菩萨出面才免于死罪,被贬到蛇盘山鹰愁涧等待唐僧取经。之后又误吃唐僧所骑的白马,被菩萨点化,变身为白龙马,皈依佛门,载乘唐僧上西天取经,最终修成正果,被升为八部天龙广力菩萨(又称八部天龙马)。后在化龙池得复原身,盘绕在大雷音寺的擎天华表柱上。"));
32         } catch (IOException e) {
33                 e.printStackTrace();
34         }
35     }
36 }

posted @ 2018-02-12 21:06  祁俊辉  阅读(305)  评论(0编辑  收藏  举报