上一页 1 ··· 243 244 245 246 247 248 249 250 251 ··· 385 下一页
摘要: 0 PCA与SVD 1 降维究竟是怎样实现? class sklearn.decomposition.PCA (n_components=None, copy=True, whiten=False, svd_solver=’auto’, tol=0.0,iterated_power=’auto’, 阅读全文
posted @ 2021-06-25 23:36 秋华 阅读(367) 评论(0) 推荐(0)
摘要: 1 从什么叫“维度”说开来 我们不断提到一些语言,比如说:随机森林是通过随机抽取特征来建树,以避免高维计算;再比如说,sklearn中导入特征矩阵,必须是至少二维;上周我们讲解特征工程,还特地提到了,特征选择的目的是通过降维来降低算法的计算成本……这些语言都很正常地被我用来使用,直到有一天,一个小伙 阅读全文
posted @ 2021-06-25 23:11 秋华 阅读(269) 评论(0) 推荐(0)
摘要: 1 Embedded嵌入法 from sklearn.feature_selection import SelectFromModel from sklearn.ensemble import RandomForestClassifier as RFC RFC_ = RFC(n_estimators 阅读全文
posted @ 2021-06-25 19:55 秋华 阅读(571) 评论(0) 推荐(0)
摘要: 当数据预处理完成后,我们就要开始进行特征工程了。 #导入数据,让我们使用digit recognizor数据来一展身手 import pandas as pd data = pd.read_csv(r"C:\work\learnbetter\micro-class\week 3 Preprocess 阅读全文
posted @ 2021-06-24 23:58 秋华 阅读(787) 评论(0) 推荐(0)
摘要: 1 处理分类型特征:编码与哑变量 from sklearn.preprocessing import LabelEncoder y = data.iloc[:,-1] #要输入的是标签,不是特征矩阵,所以允许一维 le = LabelEncoder() #实例化 le = le.fit(y) #导入 阅读全文
posted @ 2021-06-24 23:12 秋华 阅读(405) 评论(0) 推荐(0)
摘要: 1 数据无量纲化 from sklearn.preprocessing import MinMaxScaler data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]] #不太熟悉numpy的小伙伴,能够判断data的结构吗? #如果换成表是什么样子? import 阅读全文
posted @ 2021-06-24 22:53 秋华 阅读(522) 评论(0) 推荐(0)
摘要: 1 Bagging vs Boosting 2 RFC的参数列表 3 RFC的属性列表 4 RFC的接口列表 阅读全文
posted @ 2021-06-24 19:56 秋华 阅读(140) 评论(0) 推荐(0)
摘要: 来源:https://zhuanlan.zhihu.com/p/115646862 之前一直对pandas和numpy里的axis 参数理解的不透彻,今天把它写下来加深印象。 axis = 0 是代表跨行,而axis = 1 是代表跨列,想明白这一点,对于其他的操作就都想明白了。 numpy 官方文 阅读全文
posted @ 2021-06-23 23:59 秋华 阅读(818) 评论(0) 推荐(0)
摘要: 案例中,往往使用真实数据,为什么我们要使用sklearn自带的数据呢?因为真实数据在随机森林下的调参过程,往往非常缓慢。真实数据量大,维度高,在使用随机森林之前需要一系列的处理,因此不太适合用来做直播中的案例演示。在本章,我为大家准备了kaggle上下载的辨别手写数字的数据,有4W多条记录700多个 阅读全文
posted @ 2021-06-23 23:54 秋华 阅读(889) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2021-06-23 23:34 秋华 阅读(139) 评论(0) 推荐(0)
上一页 1 ··· 243 244 245 246 247 248 249 250 251 ··· 385 下一页