06 2018 档案

摘要:k-近邻算法采用测量不同特征值之间的距离方法进行分类。 k-近邻算法 优点:精度高、对异常值不敏感、无数据输入假定 缺点:计算复杂度高、空间复杂度高 适用数据范围:数值型和标称型 工作原理:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的 阅读全文
posted @ 2018-06-05 15:05 jason*liu 阅读(321) 评论(0) 推荐(0)
摘要:1.1 机器学习概念:机器学习能让我们从数据集中受到启发,换句话说,我们会利用计算机来彰显数据背后的真实含义。机器学习就是把无序的数据转换成有用的信息。1.2 机器学习的主要任务:大多数人都见过回归的例子——数据拟合曲线:通过给定数据点的最优拟合曲线。分类和回归属于监督学习(因为这类算法必须知道预测什么,即目标变量的分类信息)。无监督学习中,将数据集合分成由类似的对象组成的多个类的过程被称为聚类;... 阅读全文
posted @ 2018-06-03 11:35 jason*liu 阅读(339) 评论(0) 推荐(0)