09 2019 档案

摘要:一、数据的标准化、归一化、正则化 1、标准化 将数据转化为均值为0方差为1的数据,即标准正态分布。标准化可以规范数据,但不适用于稀疏数据,因为会破坏其数据结果。标准化的过程为两步:去均值的中心化(均值变为0);方差的规模化(方差变为1)。即每一列减去该列的均值再除以该列的方差。 在分类、聚类算法中, 阅读全文
posted @ 2019-09-30 09:34 我不是高斯分布 阅读(3027) 评论(0) 推荐(1)
摘要:一、sklearn中逻辑回归的相关类 在sklearn的逻辑回归中,主要用LogisticRegression和LogisticRegressionCV两个类来构建模型,两者的区别仅在于交叉验证与正则化系数C,下面介绍两个类(重要参数带**加绿): sklearn.linear_model.Logi 阅读全文
posted @ 2019-09-25 15:59 我不是高斯分布 阅读(9702) 评论(0) 推荐(0)
摘要:一、简介 sklearn.metrics中包含了许多模型评估指标,例如决定系数R2、准确度等,下面对常用的分类模型与回归模型的评估指标做一个区分归纳, 二、分类模型指标 1、准确率 分类准确率分数是指所有分类正确的百分比。分类准确率这一衡量分类器的标准比较容易理解,但是它不能告诉你响应值的潜在分布, 阅读全文
posted @ 2019-09-25 15:58 我不是高斯分布 阅读(9020) 评论(0) 推荐(0)
摘要:1、用np.r_[]与np.c_[]将数组按行与列连接 2、用np.meshgrid()生成网格点坐标,可以用于等高线图 3、np.ravel()和np.flatten()将数组降为1维,区别是np.ravel()返回视图,np.flatten()返回一份拷贝。另外可以直接调用数组array类的方法 阅读全文
posted @ 2019-09-23 20:19 我不是高斯分布 阅读(575) 评论(0) 推荐(0)
摘要:一、关于特征选择 主要参考连接为:参考链接,里面有详细的特征选择内容。 介绍 特征选择是特征工程里的一个重要问题,其目标是寻找最优特征子集。特征选择能剔除不相关(irrelevant)或冗余(redundant )的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。另一方面,选取出真正 阅读全文
posted @ 2019-09-23 10:04 我不是高斯分布 阅读(2320) 评论(0) 推荐(0)