摘要: k 近邻算法 采用测量不同特征值之间的距离来进行分类 优点:精度高、对异常值不敏感、无数据输入假定 缺点:计算复杂度高、空间复杂度高 使用数据范围:数值型和标称型 决策树 是一种基本的分类方法,也可以用于回归。决策树模型呈树形结构。在分类问题中,表示基于特征对实例进行分类的过程,它可以认为是if t 阅读全文
posted @ 2019-11-27 23:03 ohou 阅读(2896) 评论(0) 推荐(0)
摘要: 本文采用 正规方程 、 梯度下降 、 带有正则化的岭回归 三种方法对BOSTON房价数据集进行分析预测,比较三种方法之间的差异 阅读全文
posted @ 2019-11-27 22:46 ohou 阅读(5331) 评论(0) 推荐(0)
摘要: 良/恶性乳腺癌肿瘤预测数据描述 (1)[数据源](https://archive.ics.uci.edu/ml/machine learning databases/breast cancer wisconsin/breast cancer wisconsin.data )。 (2)699条样本,共 阅读全文
posted @ 2019-11-27 21:03 ohou 阅读(1269) 评论(0) 推荐(0)
摘要: 数据的特征工程 从数据中抽取出来的对预测结果有用的信息,通过专业的技巧进行数据处理,使得特征能在机器学习算法中发挥更好的作用。优质的特征往往描述了数据的固有结构。 最初的原始特征数据集可能太大,或者信息冗余,因此在机器学习的应用中,一个初始步骤就是选择特征的子集,或构建一套新的特征集,减少功能来促进 阅读全文
posted @ 2019-11-27 20:44 ohou 阅读(340) 评论(0) 推荐(0)
摘要: "Kaggle数据来源" order_id product_id add_to_cart_order reordered product_name aisle_id department_id user_id eval_set order_number order_dow order_hour_of 阅读全文
posted @ 2019-11-27 20:23 ohou 阅读(2488) 评论(0) 推荐(0)
回到顶部