随笔分类 -  scikit-learn

机器学习
摘要:xgboos: 极限梯度提升算法 阅读全文
posted @ 2022-01-07 17:28 帅爆太阳的男人 阅读(24) 评论(0) 推荐(0)
摘要:概率分类器: 朴素贝叶斯是一种直接衡量标签和特征质检的概率关系的有监督学习算法, 是一种专注分类的算法, 朴素贝叶斯的算法根源是基于概率论和数理统计的贝叶斯理论, 因此它是根正苗红的概率模型. 关键概念: 联合概率: X取值为x和Y的取值为y, 两个事件同时发生的概率, 表示为: P(X=x, Y= 阅读全文
posted @ 2021-12-13 15:49 帅爆太阳的男人 阅读(898) 评论(0) 推荐(0)
摘要:回归是一种应用广泛的预测建模技术, 这种技术的核心在于预测的结果是连续型变量 通常理解线性代数可以有两种角度:矩阵的角度喝代数的角度, 几乎所有的机器学习的教材都是从线性代数角度来理解线性回归, 类似于逻辑回归喝支持向量机, 将求解参数的问题转化为一个带条件的最优化问题, 然后用三维图像让大家求极值 阅读全文
posted @ 2021-12-05 14:30 帅爆太阳的男人 阅读(301) 评论(0) 推荐(0)
摘要:参数C的进阶 支持向量机分类器, 是在数据空间中找出一个超平面作为决策边界, 利用这个决策边界来对数据进行分类, 并使分类误差尽量小的模型. 所以软间隔让决定两条虚线超平面向量可鞥来自于同一个类别的样本点, 而硬间隔的时候两条虚线超平面比速是由两个不同类别的支持向量决定 二分类SVC中样本不均衡问题 阅读全文
posted @ 2021-11-23 15:34 帅爆太阳的男人 阅读(119) 评论(0) 推荐(0)
摘要:支持向量机, 它源于统计学习理论, 是除了集成算法之外, 接触的第一个强学习器 功能 有监督学习 线性二分类与多分类(Linear Support Vector Classification) 非线性二分类与多分类(Support Vector Classification, SVC) 普通连续型变 阅读全文
posted @ 2021-11-16 20:34 帅爆太阳的男人 阅读(412) 评论(0) 推荐(0)
摘要:无监督学习-聚类算法 聚类算法有焦作"无监督分类", 其目的是将数据阿虎分成有意义或有用的组(簇). 聚类 分类 核心 将数据分成多个组, 探索每个组的数据是否有联系 从已经分组的数据中取学习, 把新数据放到已经分好的组中去 学习类型 无监督, 无需标签进行训练 有监督, 需要标签进行训练 典型算法 阅读全文
posted @ 2021-11-09 20:32 帅爆太阳的男人 阅读(579) 评论(0) 推荐(0)
摘要:回归的分类器 是一种名为"回归"的线性分类器, 其本质是由线性回归变化而来的. Z = θ0 + θ1x1 + θ2x2 +...+ θnxn 其中: θ被统称为模型的参数, θ0 被称为截距, θ1 ~ θn 被称为系数, 我们可以将系数和自变量用矩阵来表示 线性回归的任务, 就是构造一个预测函数 阅读全文
posted @ 2021-10-20 13:47 帅爆太阳的男人 阅读(156) 评论(0) 推荐(0)
摘要:维度: 对于数组和Series来说, 维度就是功能shape返回得结果, shape中返回几个数字, 就是几维 数组中每一张表, 都可以是一个特征矩阵干活一个DataFrame, 针对每一张表, 维度指得是样本得数量或特征的数量, 一般无特别说明, 指的是特征得数量. 对于图像来说, 维度就是图像中 阅读全文
posted @ 2021-10-13 18:50 帅爆太阳的男人 阅读(168) 评论(0) 推荐(0)
摘要:数据预处理: 数据的无量钢化可以是线性的, 叶可以是非线性的, 线性的无量钢化包括中心化处理和缩放处理 中心化: 本质是让所有的记录减去一个固定值, 即让数据样本平移到某个位置, 缩放的本质是通过除以一个固定在某个范围中, 取对数也是一种缩放处理 归一化: 当数据(x)按照最小化后, 在按极差(最大 阅读全文
posted @ 2021-09-16 11:39 帅爆太阳的男人 阅读(486) 评论(0) 推荐(0)
摘要:xgboost 阅读全文
posted @ 2021-09-15 17:46 帅爆太阳的男人 阅读(51) 评论(0) 推荐(0)
摘要:随机森林 集成算法时时下非常流行的机器学习算法,它本身不死一个单独的及其学习算法, 而是通过在数据上构建多个模型, 集成所有模型的建模结果, 基本上所有的机器学习领域都可以看到集成学习的身影, 在心事中集成学习也有相当大的作用, 它可以用来做市场营销模拟的建模, 统计客户来源, 保留和流式, 也可用 阅读全文
posted @ 2021-08-26 15:03 帅爆太阳的男人 阅读(226) 评论(0) 推荐(0)
摘要:分类树: 决策树是一种非参数的有监督学习方法, 他能够从一系列有特征合标签的数据中总结处决策规则, 并用树状图结构来呈现这些规则,以解决分类和回归问题 根节点: 没有进边,有出边, 包含最初的,针对特征的提问 中间节点: 既有进边, 也有出边, 进边只有一条, 出边可以有很多条, 都是针对特征的提问 阅读全文
posted @ 2021-08-23 11:36 帅爆太阳的男人 阅读(166) 评论(0) 推荐(0)