09 2019 档案
摘要:%matplotlib inline %matplotlib inline这一句是IPython的魔法函数,使用%matplotlib命令可以将matplotlib的图表直接嵌入到Notebook之中,省略掉plt.show()这一步,直接显示图像。 %config InlineBackend.fi
阅读全文
摘要:1. pandas的核心或基础知识点: pandas的核心结构是DataFrame,它是由多个series组合而成(Series类型由一组数据及与之相关的数据索引组成),而实际值的核心结果是ndarray,故pandas是基于numpy的一种工具。 2. 各种基础函数的使用: pd.read_csv
阅读全文
摘要:评分卡建模的基本流程: IV值的区分度情况: 模型效果评估: PSI稳定性的评估, 0.2已经很不稳定了
阅读全文
摘要:关联规则挖掘的目的是在数据项目中找出所有的并发关系,除了基本Aprioris算法,还有一些常用的改进算法,例如多最小支持度的关联规则挖掘,分类关联规则挖掘。 支持度:规则前项LHS和规则后项RHS所包括的商品都同时出现的概率,LHS和RHS商品的交易次数/总交易次数。 置信度:在所有的购买了左边商品
阅读全文
摘要:聚类分析:是研究样本或指标进行分类的一种多元统计方法。 聚类分析按根据分类对象的不同分为R型和Q型,R型对变量进行分类,Q型对样品进行分类。 常用的聚类方法:系统聚类法、模糊聚类法(多为定性变量的分类)、K 均值法(动态聚类法)、有序样品的聚类(最优分割法)、分解法、加入法等 定量数据在进行聚类分析
阅读全文
摘要:Logistic回归模型是一种概率模型,它是以疾病,死亡等结果发生的概率为因变量,影响疾病发生的因素为自变量建立回归模型。它特别适用于因变量为二项,多项分类的资料。 1)logistic回归的作用: 预测预报:通过模型可以预测发病、死亡等的概 因素分析:寻找对发病、死亡等影响有显著性的因素 2)Lo
阅读全文

浙公网安备 33010602011771号