摘要: 一、正则化 1、模型选择典型的方式就是正则化。正则化就是结构风险最小化策略的实现,就是在经验风险项中添加一个郑泽华想或者叫做惩罚项。 正则化项与模型的关系一般是模型复杂度越高,正则化项的值就会越大。 正则化项的作用就是平衡经验风险较小与模型复杂度较小。最好的结果就是经验风险和模型复杂度同时较小。 正 阅读全文
posted @ 2018-05-14 09:22 Harry_DM 阅读(419) 评论(0) 推荐(0) 编辑
摘要: 一、训练误差与测试误差 统计学习的目的就是利用已经学到的模型对已知数据和未知数据进行预测,因此在损失函数确定的情况下,基于损失函数的训练误差和测试误差就成了我们对模型进行评价的一个标准。 注意:在统计学习中使用的损失函数未必和评估中使用的损失函数一样。 训练误差的大小对于判断给定问题是否容易学习是有 阅读全文
posted @ 2018-05-14 09:19 Harry_DM 阅读(773) 评论(0) 推荐(0) 编辑
摘要: 1) 最大似然估计 MLE 给定一堆数据,假如我们知道它是从某一种分布中随机取出来的,可是我们并不知道这个分布具体的参,即“模型已定,参数未知”。例如,我们知道这个分布是正态分布,但是不知道均值和方差;或者是二项分布,但是不知道均值。 最大似然估计(MLE,Maximum Likelihood Es 阅读全文
posted @ 2018-05-14 09:17 Harry_DM 阅读(282) 评论(0) 推荐(0) 编辑
摘要: 1)输出数据的类型 分类输出的数据类型是离散数据,也就是分类的标签。比如我们前面通过学生学习预测考试是否通过,这里的预测结果是考试通过,或者不通过,这2种离散数据。 回归输出的是连续数据类型。比如我们通过学习时间预测学生的考试分数,这里的预测结果分数,是连续数据。 2)第2个区别是我们想要通过机器学 阅读全文
posted @ 2018-05-14 09:14 Harry_DM 阅读(8016) 评论(0) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2018-05-14 09:12 Harry_DM 阅读(2) 评论(0) 推荐(0) 编辑