摘要: 朴素贝叶斯算法简单、高效。接下来我们来介绍其如何应用在《红楼梦》作者的鉴别上。 第一步,当然是先得有文本数据,我在网上随便下载了一个txt(当时急着交初稿。。。)。分类肯定是要一个回合一个回合的分,所以我们拿到文本数据后,先进行回合划分。然后就是去标点符号、分词,做词频统计。 文本分类我个人感觉最重 阅读全文
posted @ 2017-06-05 17:04 hahaxzy 阅读(3780) 评论(2) 推荐(0) 编辑