05 2016 档案

摘要:三.非线性支持向量机 问题起源:1.对于一些非线性可分的问题,我们希望能通过一个映射问题将特征映射到新的空间中去(可能是更高维的空间),寄希望于在新的空间中样本能够线性可分;2.我们注意到在线性支持向量机的对偶问题的求解过程中,目标函数和决策函数都只是涉及到输入实例与实例之间的内积,所以将核函数引进 阅读全文
posted @ 2016-05-26 10:22 司马_羽鹤 阅读(135) 评论(0) 推荐(0)
摘要:引言:当两类样本线性可分时,针对我们之前学习的感知机而言,存在多个超平面能将数据分开,这里要讨论什么样的分类面最好的问题。为此,我们形式化的定义了最优分类超平面,他有两点特征:1.能将训练样本没有错误的分开;2.在样本中距离超平面最近的样本与超平面之间的距离最大。 1.没有错误的分开: 对尺度影响的 阅读全文
posted @ 2016-05-20 10:59 司马_羽鹤 阅读(355) 评论(0) 推荐(0)
摘要:1.分级聚类(Hierarchical Clustering) 凝聚的层次聚类(自底向上) 分裂的层次聚类(自顶向下) 1.1 自底向上的分级聚类步骤 –(1) 初始化:每个样本形成一个类 –(2) 合并:计算任意两个类之间的距离(或相似性),将距离最小(或相似性最大)的两个类合并为一个类,记录下这 阅读全文
posted @ 2016-05-19 10:18 司马_羽鹤 阅读(664) 评论(0) 推荐(0)
摘要:1.定义 :将数据分成多个类别,在同一个类内,对象(实体)之间具有较高的相似性,不同类对象之间的差异性较大。 对一批没有类别标签的样本集,按照样本之间的相似程度分类,相似的归为一类,不相似的归为其它类。这种分类称为聚类分析,也称为无监督分类。 2.结果取决于两个因素:第一个是任务的选择,同样的样本不 阅读全文
posted @ 2016-05-12 11:01 司马_羽鹤 阅读(426) 评论(0) 推荐(0)