随笔档案「2019年9月」 - 我不是高斯分布

sklearn——数据数据预处理

摘要：一、数据的标准化、归一化、正则化 1、标准化将数据转化为均值为0方差为1的数据，即标准正态分布。标准化可以规范数据，但不适用于稀疏数据，因为会破坏其数据结果。标准化的过程为两步：去均值的中心化（均值变为0）；方差的规模化（方差变为1）。即每一列减去该列的均值再除以该列的方差。在分类、聚类算法中，阅读全文

posted @ 2019-09-30 09:34 我不是高斯分布阅读(3027) 评论(0) 推荐(1)

sklearn——逻辑回归、ROC曲线与KS曲线

摘要：一、sklearn中逻辑回归的相关类在sklearn的逻辑回归中，主要用LogisticRegression和LogisticRegressionCV两个类来构建模型，两者的区别仅在于交叉验证与正则化系数C，下面介绍两个类（重要参数带**加绿）： sklearn.linear_model.Logi 阅读全文

posted @ 2019-09-25 15:59 我不是高斯分布阅读(9702) 评论(0) 推荐(0)

sklearn——metrics模型评估指标

摘要：一、简介 sklearn.metrics中包含了许多模型评估指标，例如决定系数R2、准确度等，下面对常用的分类模型与回归模型的评估指标做一个区分归纳，二、分类模型指标 1、准确率分类准确率分数是指所有分类正确的百分比。分类准确率这一衡量分类器的标准比较容易理解，但是它不能告诉你响应值的潜在分布，阅读全文

posted @ 2019-09-25 15:58 我不是高斯分布阅读(9020) 评论(0) 推荐(0)

python之numpy

摘要：1、用np.r_[]与np.c_[]将数组按行与列连接 2、用np.meshgrid()生成网格点坐标，可以用于等高线图 3、np.ravel()和np.flatten()将数组降为1维，区别是np.ravel()返回视图，np.flatten()返回一份拷贝。另外可以直接调用数组array类的方法阅读全文

posted @ 2019-09-23 20:19 我不是高斯分布阅读(575) 评论(0) 推荐(0)

sklearn——特征选择

摘要：一、关于特征选择主要参考连接为：参考链接，里面有详细的特征选择内容。介绍特征选择是特征工程里的一个重要问题，其目标是寻找最优特征子集。特征选择能剔除不相关(irrelevant)或冗余(redundant )的特征，从而达到减少特征个数，提高模型精确度，减少运行时间的目的。另一方面，选取出真正阅读全文

posted @ 2019-09-23 10:04 我不是高斯分布阅读(2320) 评论(0) 推荐(0)

我不是高斯分布

09 2019 档案

公告