06 2018 档案
摘要:k-近邻算法采用测量不同特征值之间的距离方法进行分类。 k-近邻算法 优点:精度高、对异常值不敏感、无数据输入假定 缺点:计算复杂度高、空间复杂度高 适用数据范围:数值型和标称型 工作原理:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的
阅读全文
摘要:1.1 机器学习概念:机器学习能让我们从数据集中受到启发,换句话说,我们会利用计算机来彰显数据背后的真实含义。机器学习就是把无序的数据转换成有用的信息。1.2 机器学习的主要任务:大多数人都见过回归的例子——数据拟合曲线:通过给定数据点的最优拟合曲线。分类和回归属于监督学习(因为这类算法必须知道预测什么,即目标变量的分类信息)。无监督学习中,将数据集合分成由类似的对象组成的多个类的过程被称为聚类;...
阅读全文
浙公网安备 33010602011771号