摘要:
1. 前向搜索 每次增量地从剩余未选中的特征选出一个加入特征集中,待达到阈值或者 时,从所有的 中选出错误率最小的。过程如下: 初始化特征集 为空。 扫描 从 到 如果第 个特征不在 中,那么特征 和 放在一起作为 (即 )。 在只使用 中特征的情况下,利用交叉验证来得到 的错误率。 从上步中得到的 阅读全文
posted @ 2019-07-01 18:45
nxf_rabbit75
阅读(1684)
评论(0)
推荐(0)
摘要:
1.热力图heatmap seaborn.heatmap(data, vmin=None, vmax=None, cmap=None, center=None, robust=False, annot=None, fmt='.2g', annot_kws=None, linewidths=0, li 阅读全文
posted @ 2019-07-01 17:32
nxf_rabbit75
阅读(6377)
评论(0)
推荐(1)
摘要:
一、正则化 1.L1/Lasso L1正则方法具有稀疏解的特性,因此天然具备特征选择的特性,但是要注意,L1没有选到的特征不代表不重要,原因是两个具有高相关性的特征可能只保留了一个,如果要确定哪个特征重要应再通过L2正则方法交叉检验。 举例:下面的例子在波士顿房价数据上运行了Lasso,其中参数al 阅读全文
posted @ 2019-07-01 10:44
nxf_rabbit75
阅读(2513)
评论(0)
推荐(1)