Loading

摘要: k 近邻算法采用测量不同特征值之间的距离来进行分类。 优点:精度高、对异常值不敏感、无数据输入假定 缺点:计算复杂度高、空间复杂度高 使用数据范围:数值型和标称型 用例子来理解k 近邻算法 电影可以按照题材分类,每个题材又是如何定义的呢?那么假如两种类型的电影,动作片和爱情片。动作片有哪些公共的特征 阅读全文
posted @ 2019-03-17 20:21 coder-qi 阅读(1375) 评论(0) 推荐(0)
摘要: 数据集划分 机器学习一般的数据集会划分为两个部分: 训练数据:用于训练,构建模型 测试数据:在模型检验时使用,用于评估模型是否有效 训练数据和测试数据常用的比例一般为:70%: 30%, 80%: 20%, 75%: 25% sklearn数据集划分API: sklearn.model_select 阅读全文
posted @ 2019-03-17 15:27 coder-qi 阅读(1243) 评论(0) 推荐(0)