摘要: 一、knn的原理 K-近邻算法采用测量不同特征值之间的距离方法进行分类。 问题是求某点的最近 K 个点。求两点间距离公式,此外还可能需要增加权重 优点:精度高、对异常值不敏感、无数据输入假定。 缺点:时间复杂度高、空间复杂度高。 1、当样本不平衡时,比如一个类的样本容量很大,其他类的样本容量很小,输 阅读全文
posted @ 2019-11-10 14:48 yancheng111 阅读(523) 评论(0) 推荐(0)
摘要: 目录: 一、数据预处理: 数据审核 筛选 排序 二、品质数据的整理与展示: 分类数据的整理与展示 顺序数据的分类与展示 三、数值型数据的整理与展示: 数据分组 数据展示 一、数据预处理: 数据的预处理的涵盖范围很广泛,涉及到数据相关行业的工作内容都离不开预处理,不管是做机器学习还是需要做业务相关分析 阅读全文
posted @ 2019-11-10 11:12 yancheng111 阅读(1474) 评论(0) 推荐(0)