随笔分类 - 机器学习
摘要:一、数据存在缺失 1、删除相应的属性,即删掉整个列 —— 适用于对于某一个特征存在很多缺失值的时候删除相应的记录(但如果一个特征中只有几个样本缺失了这条特征,全部删掉整个列 等同于完全放弃此特征) 2、删除相应的记录,若一个记录里包含了缺失值,就舍弃该记录。这种方法也简单且直接,也是平时工程里常用的
阅读全文
摘要:任务4 随着K值的增大,决策边界会变得更加平滑,决策边界的平滑也意味着模型的稳定性。但稳定不代表这个模型就会越准确。 np.random.multivariate_normal(): 从多元正态分布中随机抽取样本,将一维正态分布推广到更高维度的方法。这种分布由其均值和协方差矩阵指定。这些参数类似于一
阅读全文
摘要:手写KNN算法实现分类问题 导入数据集,并分割成训练集和测试集 KNN算法要求出距r离最近的K 个数据,这里定义一个函数euc_dis,求欧几里得距离 定义一个函数 knn_classify,计算 testInstance 与 X 中的每个向量的距离,将样本对应标签添加到maxY数组中 from s
阅读全文
摘要:第一次和机器学习打照面,还没学过python呢。除了领略到了机器学习的神奇之处,也在这个门槛上跌跌撞撞,结结实实地摔了跤吃了苦。往事开头难。 首先是安装,花了大半天,总是报错,哼,我已经截图保存制服它的证据了 初步了解了何为特征、标签、样本、模型、回归与分类(参考博客:https://blog.cs
阅读全文

浙公网安备 33010602011771号