序数和类别特征处理方法
摘要:简介 本文主要说明特征工程中关于序数特征和类别特征的常用处理方法。主要包含LabelEncoder、One-Hot编码、DummyCoding、FeatureHasher以及要重点介绍的WOE编码。 作者:HaloZhang链接:https://www.jianshu.com/p/3d828de72
阅读全文
posted @
2023-06-19 18:28
白的枫叶
阅读(17)
推荐(0)
特征工程
摘要:特征工程,是指用一系列工程化的方式从原始数据中筛选出更好的数据特征,以提升模型的训练效果。
阅读全文
posted @
2023-05-31 16:40
白的枫叶
阅读(8)
推荐(0)
randomforestregressor参数详解
摘要:sklearn.ensemble.RandomForestRegressor( n_estimators=10, # 数值型参数,默认值为100,此参数指定了弱分类器的个数。设置的值越大,精确度越好,但是当 n_estimators 大于特定值之后,带来的提升效果非常有限。 criterion='m
阅读全文
posted @
2023-05-30 17:02
白的枫叶
阅读(1416)
推荐(0)
Matplotlib subplot2grid()函数详解
摘要:matplotlib.pyplot 模块提供了 subplot2grid() ,该函数能够在画布的特定位置创建 axes 对象(即绘图区域)。不仅如此,它还可以使用不同数量的行、列来创建跨度不同的绘图区域。与 subplot() 和 subplots() 函数不同,subplot2gird() 函数
阅读全文
posted @
2023-05-30 14:27
白的枫叶
阅读(204)
推荐(0)
matplotlib.pyplot中的rcparams参数小结
摘要:rc参数简介 pyplot中的默认配置的可以通过rcparams参数来控制,简称rc参数。rc参数存储在字典变量中,通过字典的方式进行访问。rc参数的基本格式是: plt.rcParams['font.family'] = 'YaHei Consolas Hybrid' # 设置字体样式 plt.r
阅读全文
posted @
2023-05-30 11:25
白的枫叶
阅读(795)
推荐(0)
numpy中的vstack和hstack
摘要:vstack和hstack都是numpy中用于合并两个小数组的函数。他们俩不仅名字很像,用法也很像,所以很容易搞混。首先需要明确几个共性: 两个函数都只接收一个参数:vstack(tup)和hstack(tup)。但是,正如前面说到的,这两个函数是用于合并两个数组的,所以我们需要传递两个数组。于是v
阅读全文
posted @
2023-05-22 21:39
白的枫叶
阅读(122)
推荐(0)