05 2020 档案
摘要:我们知道,监督式学习算法通常是从数据中学习出来一个模型。假如输入数据是X,输出数据是Y,学习的过程就是找出尽量接近转换函数f的的过程,使得f(X)=Y。 影响机器学习准确度的3种误差包括: Bias Error(偏差) Variance Error(方差) Irreducible Error(不可消
阅读全文
摘要:基尼不纯度Gini Impurity是理解决策树和随机森林分类算法的一个重要概念。我们先看看下面的一个简单例子 - 假如我们有以下的数据集 我们如何选择一个很好的分割值把上面的5个蓝点和5个绿点完美的分开呢?通过观察,我们选择分隔值x=2 如果我们选取x=1.5呢? 这样做的结果是左边是4个蓝点,右
阅读全文

浙公网安备 33010602011771号