摘要: 正确率(precision),TP/(TP+FP),给出的是预测为正例的样本中的真正正例的比例。 召回率(recall),TP/(TP+FN),给出的是预测为正例中的真实正例占所有真实正例的比例。 F-度量值(F-Score),组合precision和recall为一个单独的得分,被定义为精确度和召 阅读全文
posted @ 2020-09-29 17:35 ~宁静致远~ 阅读(597) 评论(0) 推荐(0)
摘要: 大多数情况下,两者的表现比较相近,但在一些情况中不排除某种方法相对另一种方法有明显优势,因此建议两者都试一下。 random forest将一些较强的分类器组合在一起,boosting trees将一些较弱的分类器组合在一起;因此可以理解为random forest降低方差,boosting tre 阅读全文
posted @ 2020-09-29 16:39 ~宁静致远~ 阅读(207) 评论(0) 推荐(0)
摘要: 1.对数据进行概览,观测其异常值和缺失值,异常值可以通过qq图或设定偏离均值一定方差范围以外的阈值进行过滤。 2.缺失值和异常值处理,根据具体情况,是否需要对缺失值进行删除或填充,是否需要将异常值删除或将其处理到正常范围以内。 3.利用描述性统计量和箱线图观察样本各个特征分布情况。需要注意:观察不同 阅读全文
posted @ 2020-09-29 09:52 ~宁静致远~ 阅读(848) 评论(0) 推荐(0)