摘要:
变量类型:1、原始变量:这些变量是从数据库中提取的,概括了交易、产品所有权标识和客户人口统计资料待特征;特点:易于解释,但是可能不是最有效的;2、衍生变量指标:这些字段来源于原始变量,有明确的业务涵义。特别:需要计算,可能表现出比原始变量更好的预测力;3、分析变量:这些变量是分析人员对原始数据进行转 阅读全文
posted @ 2018-10-30 18:54 高山老王 阅读(293) 评论(0) 推荐(0)
|
|
|
|
摘要:
变量类型:1、原始变量:这些变量是从数据库中提取的,概括了交易、产品所有权标识和客户人口统计资料待特征;特点:易于解释,但是可能不是最有效的;2、衍生变量指标:这些字段来源于原始变量,有明确的业务涵义。特别:需要计算,可能表现出比原始变量更好的预测力;3、分析变量:这些变量是分析人员对原始数据进行转 阅读全文
posted @ 2018-10-30 18:54 高山老王 阅读(293) 评论(0) 推荐(0)
摘要:
EDA与数据描述探索性数据分析(EDA)和数据描述是检查数据并理解其特征的一系列过程的名称。在评分卡过程中,需要进行下列分析:1)候选预测变量单变量有效预防人特征的评价,及其取值在变量范围内的分布;2)计算每个候选预测变量分类或分段条件下的违约率分布,也被称为要素分析;3)通过列联列表、关联性和相关 阅读全文
posted @ 2018-10-30 18:47 高山老王 阅读(535) 评论(0) 推荐(1) |
|