03 2022 档案
摘要:数据分析与预处理 查看样本数据是否均衡 样本不均衡解决方案 (1)下采样 让正常样本和异常样本数据一样少。 缺点:原始数据很丰富,下采样过后,只利用了其中一小部分。 (2)过采样 让异常样本和正常样本一样多。 缺点:异常数据是造出来的。 特征标准化 数据特征决定结果的上限,而模型的调优只决定如何接近
阅读全文
摘要:回归算法 线性回归方程 $h_{\theta }(x) =\theta _{0} +\theta _{1}x_{1}+\theta _{2}x_{2}=\sum_{i=0}^{n}\theta _{i}x_{i}=\theta ^{T}x$ $\theta _{0}$为偏置项 误差项分析 误差项:真
阅读全文
摘要:Numpy 1、ndarray中所有元素必须是同一类型,否则会自动向下转换,int→float→str 2、得到索引位置 df['amount'].argmin()out:最小值的index 3、用元素的索引位置替代排序后的实际结果 np.argsort(df['amount']) 4、按照大小顺序
阅读全文
摘要:1.to_categorical的功能 简单来说,to_categorical就是将类别向量转换为二进制(只有0和1)的矩阵类型表示。其表现为将原有的类别向量转换为独热编码的形式。先上代码看一下效果: from keras.utils.np_utils import * #类别向量定义 b = [0
阅读全文

浙公网安备 33010602011771号