上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 25 下一页
摘要: 一、简介 孤立森林(Isolation Forest)是另外一种高效的异常检测算法,它和随机森林类似,但每次选择划分属性和划分点(值)时都是随机的,而不是根据信息增益或者基尼指数来选择。在建树过程中,如果一些样本很快就到达了叶子节点(即叶子到根的距离d很短),那么就被认为很有可能是异常点。 具体步骤 阅读全文
posted @ 2018-06-08 18:00 光彩照人 阅读(6184) 评论(0) 推荐(1)
摘要: 异常点往往是由于某一个特征或者多个特征数值异常。但是对于多维度特征无法直接进行可视化观测异常点,利用PCA技术进行维度缩减,可以在二维或者三维空间上进行可视化展示。 原数据如下: 找出异常点的索引号 总结: 从原数据我们直观看数据,就发现第4和第5行数据属于异常,通过画图找出来的异常点与初步判断一致 阅读全文
posted @ 2018-06-07 18:11 光彩照人 阅读(1009) 评论(0) 推荐(0)
摘要: AUC的含义是什么? 答:其含义为,随机给定一个正样本和一个负样本,用一个分类器进行分类和预测,该正样本得分排名比负样本的得分靠前的概率。 利用sklearn画AUC曲线 from sklearn.metrics import roc_curve labels=[1,1,0,0,1] preds=[ 阅读全文
posted @ 2018-06-05 11:09 光彩照人 阅读(836) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2018-06-04 16:57 光彩照人 阅读(490) 评论(0) 推荐(0)
摘要: 该红色区域在一个2×8的矩形方框里面。使用蒙特卡洛方法,随机在这个矩形里面产生大量随机点(数量为N),计算有多少点(数量为count)落在红色区域内(判断条件为y<x**3),count/N就是落在红色区域的点的比例,根据相应比例即可求出红色区域的面积。代码如下: 下面为估算有多少个点落在红色区域, 阅读全文
posted @ 2018-06-04 12:00 光彩照人 阅读(4541) 评论(0) 推荐(0)
摘要: 泰勒公式通过把【任意函数表达式】转换(重写)为【多项式】形式,是一种极其强大的函数近似工具。 为什么说它强大呢? 多项式非常【友好】,三易,易计算,易求导,易积分 几何感觉和计算感觉都很直观,如抛物线和几次方就是底数自己乘自己乘几次 泰勒公式干的事情就是:使用多项式表达式估计(近似)f(x)在x=a 阅读全文
posted @ 2018-05-23 16:01 光彩照人 阅读(1395) 评论(0) 推荐(0)
摘要: 由于模型是以特定时期的样本所开发的,此模型是否适用于开发样本之外的族群,必须经过稳定性测试才能得知。稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发样本评分的的分布差异,为最常见的模型稳定度评估指针。其实PSI表示的就是按分数分档后,针对不同样本, 阅读全文
posted @ 2018-05-22 17:22 光彩照人 阅读(14226) 评论(0) 推荐(0)
摘要: 学习曲线是一种有用的诊断图形,它描述了机器学习算法相对可用观测量数量的表现。它的主要思想是将算法的训练性能与交叉验证结果进行比较,训练性能主要是指样本内误差获准确率,交叉验证通常采用十折交叉验证方法。 就训练集而言,训练结果的期待开始时应该高,然后会下降。然而,根据假设的偏差和方差水平不同,有不同的 阅读全文
posted @ 2018-05-16 11:47 光彩照人 阅读(1455) 评论(0) 推荐(0)
摘要: lightgbm对于类别变量的处理 效率和内存上的提升 1) 在训练决策树计算切分点的增益时,xgboost采用预排序,即需要对每个样本的切分位置都要计算一遍,所以时间复杂度是O(#data)。 而LightGBM则是将样本离散化为直方图,直方图算法的基本思想是先把连续的浮点特征值离散化成k个整数, 阅读全文
posted @ 2018-05-11 15:04 光彩照人 阅读(2622) 评论(0) 推荐(0)
摘要: 尊重原创 来源: https://blog.csdn.net/a790209714/article/details/78086867 XGBoost的四大改进: ①改进残差函数 不用Gini作为残差,用二阶泰勒展开+树的复杂度(正则项) 带来如下好处: 1.可以控制树的复杂度 2.带有关于梯度的更多 阅读全文
posted @ 2018-05-11 10:07 光彩照人 阅读(2266) 评论(0) 推荐(0)
上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 25 下一页