06 2019 档案
摘要:什么是回归? 假设现在有一些数据点,我们用 一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合过程就称作回归。 一、基于 Logistic 回归和 Sigmoid 函数的分类 我们想要的函数应该是,能接受所有的输入然后预测出类别。例如,在两个类的情况下,函数输出0或1。Sigmoid函数能在
阅读全文
摘要:决策树的原理:通过一系列问题进行if/else的推导,最终实现决策。 我们经常用决策树处理分类问题,决策树是最经常使用的数据挖掘算法。K-近邻算法可以完成很多分类任务,但是最大的缺点是给出的数据没有内在意义,决策树的优势就在于数据形式非常容易理解。 二、决策树的构造 在一个数据集上哪个特征在划分数据
阅读全文
摘要:1 #这个函数是用来统计得到一个总体单词向量的,就是:所有的文本一共有多少个不同的单词, 2 #由这些不同的单词组成一个单词向量,向量可以理解成为列表 3 #dataSet:是训练数据集 4 def createVocabList(dataSet): 5 #使用python内置set函数创建一个空的
阅读全文
摘要:一、K-近邻算法原理 如图所示,数据表中有两个属性,两个标签(A,B),预测最后一行属于哪种标签。 通过可视化数据,可以看到A和B分别集中某一领域,观察可见,第六行(2.1,1.4)比较靠近标签A。 K-近邻原理:因为未知标签的属性是已知的,可以通过计算未知标签的属性与已知标签的属性的距离,参数K表
阅读全文


浙公网安备 33010602011771号