摘要: 1、引言 最近,在做用户画像,利用文本分类方法挖掘用户兴趣模型。虽然文本分类不是很难,但是简单的事情,细节却是相当的重要。这篇文章我主要是想记录一下,我在做分类的时候,使用到的特征选择的方法,以及相关的是实现方法。 2、特征选择的方法 (1)信息增益 信息增益这一词来自通信领域,香浓提出的信息熵理论 阅读全文