由于篇幅的问题,不得不将一篇文章分三个随笔来写。而本文承接前面两篇文章《跨行业数据挖掘标准流程(上)》、《跨行业数据挖掘标准流程(中)》。欲了解前两篇文章,请参考下面的链接:

《跨行业数据挖掘标准流程(上)》:http://www.cnblogs.com/ljy2013/p/5542961.html

《跨行业数据挖掘标准流程(中)》:http://www.cnblogs.com/ljy2013/p/5543018.html

六、模型的评价

模型的评价在这里我给出了几个评价指标,但是具体的评价还是需要根据具体的业务场景才能决定。例如:在正负样本极度不平衡的场景下,一般会选择AUC作为模型的评价指标。也有些模型在一些业务场景下需要线上去运行之后,来检测模型的好坏。

七、模型部署

由于有些模型分析出来之后,仅仅供领导们来执行决策的一种参考,或者是一种拉风投的一个噱头;而有一些模型可能是跟一些业务有关系,或者是为了改善某个线上的业务逻辑所建立的,所以需要上线运行。例如:电子商务的推荐算法,金融行业的违约和拒绝模型都需要上线运行。