随笔分类 -  Machine Learning

摘要:概述 “数据决定了机器学习的上限,而算法只是尽可能逼近这个上限”,这里的数据指的就是经过特征工程得到的数据。特征工程指的是把原始数据转变为模型的训练数据的过程,它的目的就是获取更好的训练数据特征,使得机器学习模型逼近这个上限。特征工程能使得模型的性能得到提升,有时甚至在简单的模型上也能取得不错的效果 阅读全文
posted @ 2020-12-08 22:11 瞬_冷 阅读(150) 评论(0) 推荐(0)
摘要:评估方法 常见的评估方法有: 1. 留出法(hold-out) 2. 交叉验证法(cross validation)3. 自助法(bootstrap) 留出法(hold-out) 将已有的数据集分为两个互斥的部分 保证数据S与T的分布一致 测试集比例一般保持在1/3 ~ 1/5 交叉验证法(cros 阅读全文
posted @ 2020-07-30 18:02 瞬_冷 阅读(373) 评论(0) 推荐(0)
摘要:决策树: 决策树又称为判定树,是运用于分类的一种树结构,其中的每个内部节点代表对某一属性的一次测试,每条边代表一个测试结果,叶节点代表某个类或类的分布。 决策树的决策过程需要从决策树的根节点开始,待测数据与决策树中的特征节点进行比较,并按照比较结果选择选择下一比较分支,直到叶子节点作为最终的决策结果 阅读全文
posted @ 2020-07-28 17:08 瞬_冷 阅读(920) 评论(0) 推荐(0)
摘要:贝叶斯算法: 在大学的时候我们都学过贝叶斯公式: P(B | A) = P(AB) / P(A) = P(A | B)P(B) / P(A) 表明了,在已知A,B共同发生的概率以及事件A发生的概率, 则可以知道在事件A发生的情况下发生事件B的概率。 然后现在我们就可以将这个公式进行应用到工业中去,假 阅读全文
posted @ 2020-07-28 17:06 瞬_冷 阅读(410) 评论(0) 推荐(0)