摘要: 一、判断机器学习算法的性能 机器学习经过训练得到的模型,其意义在于真实环境中的使用; 将全部的原始数据当做训练集直接训练出模型,然后投入到真实环境中,这种做法是不恰当的,存在问题: 方案:训练数据集与测试数据集切分(train test split),将原始数据的80%作为训练数据来训练模型,另外2 阅读全文
posted @ 2018-05-23 16:35 何永灿 阅读(13098) 评论(0) 推荐(0)
摘要: 一、scikit-learn库中的kNN算法 scikit-learn库中,所有机器学习算法都是以面向对象的形式进行包装的; 所有scikit-learn库中机器学习算法的使用过程:调用、实例化、fit、预测; 1)使用scikit-learn库中的kNN算法解决分来问题: 代码实现过程: impo 阅读全文
posted @ 2018-05-23 10:00 何永灿 阅读(1685) 评论(0) 推荐(0)