摘要:
1. K-Means 算法 此算法是很常用的一个算法,也是基于向量距离来做聚类。算法步骤: (1) 从 n 个向量对象任意选择 k 个向量作为初始聚类中心 (2) 根据在步骤(1)中设置的 k 个向量(中心对象向量),计算每个对象与这 k 个中心对象各自的距离 (3) 对于步骤(2)中的计算,任何一 阅读全文
摘要:
1. 线性回归 利用数理统计学中的回归分析来确定两种或两种以上变量间相互依赖的定量关系的一种统计方法。 表达形式: y = ax + b + e ( e 为误差服从均值为0的正态分布,不是一个定值,也称为残差),当 e 的平方和最小时,可以称之为最佳回归线性方程。 2. 拟合 把平面上一系列的点用一 阅读全文
摘要:
若信源有 m 种消息,且每个消息是以相等可能产生的,则该信源的信息量可以表示如下: 但是很多情况,事件出现的概率是不一样的。事件出现的概率越小,信息量越大。此时信息量的计算公式如下: Xi 表示一个发生珠事件, P 表示这个事件发生的先验概率。所谓先验概率,就是这个事件按照常理,按照一般性规律发生的 阅读全文