摘要:
KNN 基本思路: 如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 KNN是一种memory-based learning,也叫instance-based learning,属于lazy learning。即它没有明显的前期训练过 阅读全文
posted @ 2020-05-27 20:15
heimazaifei
阅读(635)
评论(0)
推荐(0)
摘要:
Kmeans 基本原理 K-Mmeans算法使用贪心策略求得一个近似解,具体步骤如下: 在样本中随机选取k个样本点充当各个簇的中心点 \[ u_{1},u_{2}...u_{k} \] 计算所有样本点与各个簇中心之间的距离 \[ dist(x^{(i)},u_{i}) \] ,然后把样本点划入最 阅读全文
posted @ 2020-05-27 20:14
heimazaifei
阅读(223)
评论(0)
推荐(0)
摘要:
决策树 1970年代,一个叫昆兰的大牛找到了用信息论中的熵来度量决策树的决策选择过程,方法一出,它的简洁和高效就引起了轰动,昆兰把这个算法叫做ID3。 熵 越不确定的事物,它的熵就越大,类似方差。 公式: \[ H(X) = -\sum_{i=1}^{n}p_{i}log(p_{i}) \] 联合熵 阅读全文
posted @ 2020-05-27 20:06
heimazaifei
阅读(298)
评论(0)
推荐(0)

浙公网安备 33010602011771号