导航

2018年10月31日

摘要: 本章将继续探讨信用风险评分中使用的EDA过程,并重点介绍对候选自变量预测力的判断。首先,要明确区分相关性和关联性指标之间的细微差别。在统计学上,术语相关性是用来表示两个变量取值之间线性关系的一系列特定指标。被考察的变量可以是连续变量或顺序变量。其他所有形式的非线性关系都通过所谓的关联性指标进行称量。 阅读全文

posted @ 2018-10-31 21:22 高山老王 阅读(806) 评论(0) 推荐(0)

摘要: 数据描述,数据探索,或探索性数据分析(EDA),是同一事件的不同名称;即数据的初步分析。该分析包括以下全部或部分的探索:1、每个候选预测变量的统计特性和分布2、候选预测变量与状态变量之间,以及预测变量相互之间的是否存在关联性或相关性。3、检查缺失值和极端值,并评估它们对结果模型的冲击4、调查候选预测 阅读全文

posted @ 2018-10-31 14:02 高山老王 阅读(586) 评论(0) 推荐(0)