06 2018 档案

机器学习实战（二）k-近邻算法

摘要：k-近邻算法采用测量不同特征值之间的距离方法进行分类。 k-近邻算法优点：精度高、对异常值不敏感、无数据输入假定缺点：计算复杂度高、空间复杂度高适用数据范围：数值型和标称型工作原理：存在一个样本数据集合，也称作训练样本集，并且样本集中每个数据都存在标签，即我们知道样本集中每一数据与所属分类的阅读全文

posted @ 2018-06-05 15:05 jason*liu 阅读(321) 评论(0) 推荐(0)

机器学习实战（一）机器学习基础

摘要：1.1 机器学习概念：机器学习能让我们从数据集中受到启发，换句话说，我们会利用计算机来彰显数据背后的真实含义。机器学习就是把无序的数据转换成有用的信息。1.2 机器学习的主要任务：大多数人都见过回归的例子——数据拟合曲线：通过给定数据点的最优拟合曲线。分类和回归属于监督学习（因为这类算法必须知道预测什么，即目标变量的分类信息）。无监督学习中，将数据集合分成由类似的对象组成的多个类的过程被称为聚类；... 阅读全文

posted @ 2018-06-03 11:35 jason*liu 阅读(339) 评论(0) 推荐(0)

06 2018 档案

公告