随笔档案「2020年6月」 - 1k-yang

Data Mining | 二分类模型评估-ROC/AUC/K-S/GINI

摘要：1 混淆矩阵衍生指标上面提到的ACC、PPV、TPR、FPR等指标，都是对某一给定分类结果的评估，而绝大多数模型都能产生好多份分类结果（通过调整阈值），所以它们的评估是单一的、片面的，并不能全面地评估模型的效果。因此，需要引入新的评估指标，来综合全面地评估模型，它们就是如下所述，由混淆矩阵衍生的一阅读全文

posted @ 2020-06-16 15:35 1k-yang 阅读(4039) 评论(0) 推荐(1)

Data Mining | 二分类模型评估-混淆矩阵

摘要：1 二分类模型评估 1.1 混淆矩阵在完成机器学习建模之后，我们需要用一些指标，来度量模型性能的好坏（即模型的泛化能力），以便对比不同模型，从而知道哪个模型相对好，哪个模型相对差，并通过这些指标来进一步调参逐步优化模型。对于分类和回归两类有监督学习评判标准如下，这里主要讨论与分类相关的一些指标。阅读全文

posted @ 2020-06-11 09:40 1k-yang 阅读(2487) 评论(0) 推荐(1)

Data Mining | 数据挖掘技术基础与进阶

摘要：1 数据挖掘技术基础 1.1 描述性统计分析在现实工作中，不是所有的问题都需要用建模来解决，一些简单的问题如果能用简单方法，就不要使用复杂的解决方案。这样既提升了效率，也减少了出错的可能。即使是非常复杂的问题，我们往往也需要首先用简单的方法，对问题进行一个概括和总览 —— 描述性统计。描述性统计阅读全文

posted @ 2020-06-09 10:34 1k-yang 阅读(715) 评论(0) 推荐(0)

1k-yang

江山如画，岂独他人专美于前

06 2020 档案

公告