机器学习入门

1. 定义

一个机器学习算法，只需通过训练，就可以解决某一领域中每一个新问题，而不是对每个新问题特定地进行编程

根据已知类别的训练样本，由机器从其中进行学习或者训练，从中勾画出各类事物在特征空间分布的规律性，进而对新样本进行判断；

由机器从未知类别的样本中进行学习（自学习），从中发现有利于对象分类的规律；

由机器利用部分已知类别的样本，从中恢复样本的相关附加信息，进而进行聚类分析。

问题: 在训练集跑后挑选的模型可能会在公开的testing set表现良好,但是在私有的testing set表现很差
可以使用交叉验证缓解上述问题:将training set分为(training set 和 validation set),根据validation set的表现去评价在training set训练过的模型性能
使用N-fold Cross Validation进行分割training set

posted @ 2024-10-08 20:34 awei040519 阅读(26) 评论(0) 收藏举报

刷新页面返回顶部