基于朴素贝叶斯分类器的文本分类算法C#版(一)

转自:http://www.cnblogs.com/waemz/archive/2009/02/25/1397647.html

 

昨天有幸拜读了洞庭散人的<基于朴素贝叶斯分类器的文本分类算法>,我正在学习这个,我从内心感谢洞庭散人的分享!随即我把它移植到了c#平台上。

该程序用到了Lucene.Net,用到了基于词典的ICTCLAS中文分词1.0.

ICTCLAS中文分词for Lucene.Net接口代码(实现Analyzer):

 

Code

 

 

ICTCLAS中文分词for Lucene.Net接口代码(实现Tokenizer):

 

Code

 

 

中文分词器代码:

 

Code

 

 

训练管理器代码:

 

Code

 

 

先验概率计算代码:

 

Code

 

 

条件概率计算代码:

 

Code

 

 

用于保存分类结果的类:

 

Code

 

 

贝叶斯分类器代码:

 

Code

 

 

posted @ 2009-03-05 15:51  YaSin  阅读(783)  评论(0)    收藏  举报