摘要: 1 有放回随机抽样:重要参数subsample axisx = np.linspace(0,1,20) rs = [] for i in axisx: reg = XGBR(n_estimators=180,subsample=i,random_state=420) rs.append(CVS(re 阅读全文
posted @ 2021-07-03 23:37 秋华 阅读(285) 评论(0) 推荐(0)
摘要: 1 提升集成算法:重要参数n_estimators 1. 导入需要的库,模块以及数据 from xgboost import XGBRegressor as XGBR from sklearn.ensemble import RandomForestRegressor as RFR from skl 阅读全文
posted @ 2021-07-03 23:26 秋华 阅读(1389) 评论(0) 推荐(0)
摘要: 1 机器学习竞赛的胜利女神 2 xgboost库与XGB的sklearn API #windows pip install xgboost #安装xgboost库 pip install --upgrade xgboost #更新xgboost库 #MAC brew install gcc@7 pi 阅读全文
posted @ 2021-07-03 22:56 秋华 阅读(207) 评论(0) 推荐(1)
摘要: 1 文本编码技术简介 1.1 单词计数向量 sample = ["Machine learning is fascinating, it is wonderful" ,"Machine learning is a sensational techonology" ,"Elsa is a popula 阅读全文
posted @ 2021-07-03 21:22 秋华 阅读(169) 评论(0) 推荐(0)
摘要: 1 多项式朴素贝叶斯MultinomialNB 1. 导入需要的模块和库 from sklearn.preprocessing import MinMaxScaler from sklearn.naive_bayes import MultinomialNB from sklearn.model_s 阅读全文
posted @ 2021-07-03 21:11 秋华 阅读(297) 评论(0) 推荐(0)
摘要: 1 布里尔分数Brier Score from sklearn.metrics import brier_score_loss #注意,第一个参数是真实标签,第二个参数是预测出的概率值 #在二分类情况下,接口predict_proba会返回两列,但SVC的接口decision_function却只会 阅读全文
posted @ 2021-07-03 20:47 秋华 阅读(454) 评论(0) 推荐(0)
摘要: 1 认识高斯朴素贝叶斯 1. 展示我所使用的设备以及各个库的版本 %%cmd pip install watermark #在这里必须分开cell,魔法命令必须是一个cell的第一部分内容 #注意load_ext这个命令只能够执行一次,再执行就会报错,要求用reload命令 %load_ext wa 阅读全文
posted @ 2021-07-03 20:03 秋华 阅读(386) 评论(0) 推荐(0)
摘要: 1 真正的概率分类器 2 朴素贝叶斯是如何工作的 2.1 瓢虫冬眠:理解P(Y|X) 2.2 贝叶斯的性质与最大后验估计 2.3 汉堡称重:连续型变量的概率估计 3 sklearn中的朴素贝叶斯 阅读全文
posted @ 2021-07-03 19:42 秋华 阅读(111) 评论(0) 推荐(0)
摘要: NumPy 提供了线性代数函数库 linalg,该库包含了线性代数所需的所有功能,可以看看下面的说明: 函数描述 dot 两个数组的点积,即元素对应相乘。 vdot 两个向量的点积 inner 两个数组的内积 matmul 两个数组的矩阵积 determinant 数组的行列式 solve 求解线性 阅读全文
posted @ 2021-07-03 13:28 秋华 阅读(370) 评论(0) 推荐(0)
摘要: NumPy 提供了多种排序的方法。 这些排序函数实现不同的排序算法,每个排序算法的特征在于执行速度,最坏情况性能,所需的工作空间和算法的稳定性。 下表显示了三种排序算法的比较。 种类速度最坏情况工作空间稳定性 'quicksort'(快速排序) 1 O(n^2) 0 否 'mergesort'(归并 阅读全文
posted @ 2021-07-03 13:21 秋华 阅读(184) 评论(0) 推荐(0)
摘要: NumPy 提供了很多统计函数,用于从数组中查找最小元素,最大元素,百分位标准差和方差等。 函数说明如下: numpy.amin() 和 numpy.amax() numpy.amin() 用于计算数组中的元素沿指定轴的最小值。 numpy.amax() 用于计算数组中的元素沿指定轴的最大值。 im 阅读全文
posted @ 2021-07-03 12:42 秋华 阅读(234) 评论(0) 推荐(0)
摘要: 舍入函数 numpy.around() 函数返回指定数字的四舍五入值。 numpy.around(a,decimals) 参数说明: a: 数组 decimals: 舍入的小数位数。 默认值为0。 如果为负,整数将四舍五入到小数点左侧的位置 numpy.floor() numpy.floor() 返 阅读全文
posted @ 2021-07-03 12:36 秋华 阅读(82) 评论(0) 推荐(0)
摘要: 以下函数用于对 dtype 为 numpy.string_ 或 numpy.unicode_ 的数组执行向量化字符串操作。 它们基于 Python 内置库中的标准字符串函数。 这些函数在字符数组类(numpy.char)中定义。 函数描述 add() 对两个数组的逐个字符串元素进行连接 multip 阅读全文
posted @ 2021-07-03 12:34 秋华 阅读(145) 评论(0) 推荐(0)
摘要: 1 分割数组 函数数组及操作 split 将一个数组分割为多个子数组 hsplit 将一个数组水平分割为多个子数组(按列) vsplit 将一个数组垂直分割为多个子数组(按行) numpy.split numpy.split 函数沿特定的轴将数组分割为子数组,格式如下: numpy.split(ar 阅读全文
posted @ 2021-07-03 11:34 秋华 阅读(391) 评论(0) 推荐(0)
摘要: 1 修改数组维度 维度描述 broadcast 产生模仿广播的对象 broadcast_to 将数组广播到新形状 expand_dims 扩展数组的形状 squeeze 从数组的形状中删除一维条目 numpy.broadcast numpy.broadcast 用于模仿广播的对象,它返回一个对象,该 阅读全文
posted @ 2021-07-03 11:27 秋华 阅读(161) 评论(0) 推荐(0)
摘要: 1 修改数组形状 函数描述 reshape 不改变数据的条件下修改形状 flat 数组元素迭代器 flatten 返回一份数组拷贝,对拷贝所做的修改不会影响原始数组 ravel 返回展开数组 numpy.reshape numpy.reshape 函数可以在不改变数据的条件下修改形状,格式如下: n 阅读全文
posted @ 2021-07-03 11:19 秋华 阅读(378) 评论(0) 推荐(0)
摘要: 1 整数数组索引 2 布尔索引 我们可以通过一个布尔数组来索引目标数组。 布尔索引通过布尔运算(如:比较运算符)来获取符合指定条件的元素的数组。 以下实例获取大于 5 的元素: 3 花式索引 花式索引指的是利用整数数组进行索引。 花式索引根据索引数组的值作为目标数组的某个轴的下标来取值。对于使用一维 阅读全文
posted @ 2021-07-03 11:04 秋华 阅读(79) 评论(0) 推荐(0)
摘要: NumPy 切片和索引 ndarray对象的内容可以通过索引或切片来访问和修改,与 Python 中 list 的切片操作一样。 ndarray 数组可以基于 0 - n 的下标进行索引,切片对象可以通过内置的 slice 函数,并设置 start, stop 及 step 参数进行,从原数组中切割 阅读全文
posted @ 2021-07-03 10:58 秋华 阅读(87) 评论(0) 推荐(0)
摘要: NumPy 从数值范围创建数组 这一章节我们将学习如何从数值范围创建数组。 numpy.arange numpy 包中的使用 arange 函数创建数值范围并返回 ndarray 对象,函数格式如下: numpy.arange(start, stop, step, dtype) 根据 start 与 阅读全文
posted @ 2021-07-03 10:46 秋华 阅读(250) 评论(0) 推荐(0)
摘要: NumPy 从已有的数组创建数组 本章节我们将学习如何从已有的数组创建数组。 numpy.asarray numpy.asarray 类似 numpy.array,但 numpy.asarray 参数只有三个,比 numpy.array 少两个。 numpy.asarray(a, dtype = N 阅读全文
posted @ 2021-07-03 10:42 秋华 阅读(88) 评论(0) 推荐(0)
摘要: NumPy 创建数组 ndarray 数组除了可以使用底层 ndarray 构造器来创建外,也可以通过以下几种方式来创建。 numpy.empty numpy.empty 方法用来创建一个指定形状(shape)、数据类型(dtype)且未初始化的数组: numpy.empty(shape, dtyp 阅读全文
posted @ 2021-07-03 10:39 秋华 阅读(116) 评论(0) 推荐(0)
摘要: NumPy 数组属性 本章节我们将来了解 NumPy 数组的一些基本属性。 NumPy 数组的维数称为秩(rank),秩就是轴的数量,即数组的维度,一维数组的秩为 1,二维数组的秩为 2,以此类推。 在 NumPy中,每一个线性的数组称为是一个轴(axis),也就是维度(dimensions)。比如 阅读全文
posted @ 2021-07-03 10:29 秋华 阅读(366) 评论(0) 推荐(0)
摘要: NumPy 数据类型 numpy 支持的数据类型比 Python 内置的类型要多很多,基本上可以和 C 语言的数据类型对应上,其中部分类型对应为 Python 内置的类型。下表列举了常用 NumPy 基本类型。 名称描述 bool_ 布尔型数据类型(True 或者 False) int_ 默认的整数 阅读全文
posted @ 2021-07-03 10:24 秋华 阅读(223) 评论(0) 推荐(0)
摘要: NumPy Ndarray 对象 NumPy 最重要的一个特点是其 N 维数组对象 ndarray,它是一系列同类型数据的集合,以 0 下标为开始进行集合中元素的索引。 ndarray 对象是用于存放同类型元素的多维数组。 ndarray 中的每个元素在内存中都有相同存储大小的区域。 ndarray 阅读全文
posted @ 2021-07-03 10:19 秋华 阅读(365) 评论(0) 推荐(0)
摘要: 1 多项式对数据做了什么 from sklearn.preprocessing import PolynomialFeatures import numpy as np #如果原始数据是一维的 X = np.arange(1,4).reshape(-1,1) X#二次多项式,参数degree控制多项 阅读全文
posted @ 2021-07-03 09:52 秋华 阅读(538) 评论(0) 推荐(0)
摘要: 2 使用分箱处理非线性问题 1. 导入所需要的库 import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression from sklearn.tree import 阅读全文
posted @ 2021-07-03 09:50 秋华 阅读(191) 评论(0) 推荐(0)
摘要: 1 重塑我们心中的“线性”概念 1.1 变量之间的线性关系 1.2 数据的线性与非线性 1.3 线性模型与非线性模型 1. 导入所需要的库 import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model imp 阅读全文
posted @ 2021-07-03 09:12 秋华 阅读(192) 评论(0) 推荐(0)