摘要:
pipeline管道机制使用方法: 流水线的输入为一连串的数据挖掘步骤,其中最后一步必须是估计器(Estimator),可理解成分类器前几步是转换器(Transformer)。输入的数据集经过转换器的处理后,输出的结果作为下一步的输入。 最后,用位于流水线最后一步的估计器对数据进行分类。 每一步都用 阅读全文
posted @ 2020-04-23 15:28
蜘蛛侠不会飞
阅读(2117)
评论(0)
推荐(0)
摘要:
•1.SVM 的基本思想: •SVM把分类问题转换成寻求分类平面的问题,并通过最大化分类边界点到分类平面的距离来实现分类。通俗的讲支持向量机的解决的问题是找到最好的分类超平面。支持向量机(Support vector machine)通常用来解决二分类问题 2.构造目标函数 类似于点到直线的距离 阅读全文
posted @ 2020-04-23 15:26
蜘蛛侠不会飞
阅读(914)
评论(0)
推荐(0)
摘要:
1. 算法核心思想: 通过计算每个训练样本到待分类样本的距离,选取和待分类样本的距离最近的 K 个训练样本,K个样本中那个类别的训练样本占据着多数, 则表明待分类的样本就属于哪一个类别。 KNN算法在类别的决策中, 只与极少数的相邻样本相关。因此,对于类别的样本交叉或重叠较多的待分类样本集来说, K 阅读全文
posted @ 2020-04-23 15:24
蜘蛛侠不会飞
阅读(502)
评论(0)
推荐(0)
摘要:
1.什么是决策树: 决策树是以树状结构表示数据分类的结果 非叶子结点代表测试的条件。 分支代表测试的结果 2.如何构建决策树: ´1.信息熵(informationentropy):是度量样本集合纯度最常用的一种指标。 2.基尼系数(gini):是度量样本集合不确定性指标。(基尼指数与熵可近 阅读全文
posted @ 2020-04-23 15:22
蜘蛛侠不会飞
阅读(584)
评论(0)
推荐(0)
摘要:
逻辑回归的基本过程:a建立回归或者分类模型 >b 建立代价函数 > c 优化方法迭代求出最优的模型参数 >d 验证求解模型的好坏。 1.逻辑回归模型: 逻辑回归(Logistic Regression):基于线性回归的分类算法。一般用于解决二分类问题。 线性回归模型如下: 逻辑回归思想是基于线性回 阅读全文
posted @ 2020-04-23 15:19
蜘蛛侠不会飞
阅读(995)
评论(0)
推荐(0)
摘要:
1.栈 #coding=gbk #栈的常用操作 # Stack() 建立一个空的栈对象 # push() 把一个元素添加到栈的最顶层 # pop() 删除栈最顶层的元素,并返回这个元素 # peek() 返回最顶层的元素,并不删除它 # isEmpty() 判断栈是否为空 # size() 返回栈中 阅读全文
posted @ 2020-04-23 15:12
蜘蛛侠不会飞
阅读(303)
评论(0)
推荐(0)

浙公网安备 33010602011771号