摘要: scikit-learn 是基于 Python 语言的机器学习工具 简单高效的数据挖掘和数据分析工具 可供大家在各种环境中重复使用 建立在 NumPy ,SciPy 和 matplotlib 上 开源,可商业使用 - BSD许可证 sklearn 中文文档:http://www.scikitlear 阅读全文
posted @ 2021-01-26 17:25 元小疯 阅读(1667) 评论(0) 推荐(0) 编辑
摘要: 1、基本概念 K近邻法(K-nearest neighbors,KNN)既可以分类,也可以回归。 KNN做回归和分类的区别在于最后预测时的决策方式。 KNN做分类时,一般用多数表决法 KNN做回归时,一般用平均法。 基本概念如下:对待测实例,在训练数据集中找到与该实例最邻近的K个实例(也就是上面所说 阅读全文
posted @ 2021-01-26 17:09 元小疯 阅读(1642) 评论(0) 推荐(0) 编辑
摘要: 1、算法模型 算法模型对象:特殊的对象.在该对象中已经集成好个一个方程(还没有求出解的方程). - 模型对象的作用:通过方程实现预测或者分类 - 样本数据(df,np): 特征数据:自变量 目标数据:因变量 2、模型对象的分类 - 有监督学习:模型需要的样本数据中存在特征数据和目标数据 - 无监督学 阅读全文
posted @ 2021-01-26 15:04 元小疯 阅读(175) 评论(0) 推荐(0) 编辑