文章分类 -  机器学习

序数和类别特征处理方法
摘要:简介 本文主要说明特征工程中关于序数特征和类别特征的常用处理方法。主要包含LabelEncoder、One-Hot编码、DummyCoding、FeatureHasher以及要重点介绍的WOE编码。 作者:HaloZhang链接:https://www.jianshu.com/p/3d828de72 阅读全文
posted @ 2023-06-19 18:28 白的枫叶 阅读(17) 评论(0) 推荐(0)
特征工程
摘要:特征工程,是指用一系列工程化的方式从原始数据中筛选出更好的数据特征,以提升模型的训练效果。 阅读全文
posted @ 2023-05-31 16:40 白的枫叶 阅读(8) 评论(0) 推荐(0)
randomforestregressor参数详解
摘要:sklearn.ensemble.RandomForestRegressor( n_estimators=10, # 数值型参数,默认值为100,此参数指定了弱分类器的个数。设置的值越大,精确度越好,但是当 n_estimators 大于特定值之后,带来的提升效果非常有限。 criterion='m 阅读全文
posted @ 2023-05-30 17:02 白的枫叶 阅读(1416) 评论(0) 推荐(0)
Matplotlib subplot2grid()函数详解
摘要:matplotlib.pyplot 模块提供了 subplot2grid() ,该函数能够在画布的特定位置创建 axes 对象(即绘图区域)。不仅如此,它还可以使用不同数量的行、列来创建跨度不同的绘图区域。与 subplot() 和 subplots() 函数不同,subplot2gird() 函数 阅读全文
posted @ 2023-05-30 14:27 白的枫叶 阅读(204) 评论(0) 推荐(0)
matplotlib.pyplot中的rcparams参数小结
摘要:rc参数简介 pyplot中的默认配置的可以通过rcparams参数来控制,简称rc参数。rc参数存储在字典变量中,通过字典的方式进行访问。rc参数的基本格式是: plt.rcParams['font.family'] = 'YaHei Consolas Hybrid' # 设置字体样式 plt.r 阅读全文
posted @ 2023-05-30 11:25 白的枫叶 阅读(795) 评论(0) 推荐(0)
numpy中的vstack和hstack
摘要:vstack和hstack都是numpy中用于合并两个小数组的函数。他们俩不仅名字很像,用法也很像,所以很容易搞混。首先需要明确几个共性: 两个函数都只接收一个参数:vstack(tup)和hstack(tup)。但是,正如前面说到的,这两个函数是用于合并两个数组的,所以我们需要传递两个数组。于是v 阅读全文
posted @ 2023-05-22 21:39 白的枫叶 阅读(122) 评论(0) 推荐(0)