1、感知机基础

感知机是一种二类分类模型,训练样本需要完全线性可分,学习策略包括两种:一种是误分

类点的数目,另外一种是误分类点到分离超平面的总距离,通过梯度下降法最小化损失函数。

分离超平面:w * x + b = 0

误分类点:-y(i) * (w * x(i) + b) > 0,若不等式成立,确认x(i),y(i)为误分类点

决策函数:y = sign(w * x + b)

损失函数:Loss1 = -∑ y(i) * (w * x(i) + b),其中0 < i <= M,M为误分类点的数目,

Loss2 = Loss1 / ||w||(总距离公式);两种损失函数均是非负的,损失函数越小

,代表误分类点到分离超平面的总距离越小,误分类点的数目可能越少,当损失

函数为0,则所有训练样本分类正确。

2、感知机学习算法

输入:训练样本

输出:f(x) = sign(w * x + b)

具体操作:首先初始化w和b,重复过程:然后在训练样本中遍历数据,如果y(i) *  (w * x(i) + b) <= 0,

则为误分类点,更新w和b,更新方式为w = w - (-η * y(i) * x(i)),b = b - (-η * y(i)),直到训练样本中

没有误分类点。