Few-shot Learning : Siamese Network
神经网络结构:
1、两张图片(x1、x2)输入卷积神经网络 输出提取的特征向量(h1、h2)
2、对两个特征向量作差 再取向量每个元素的绝对值(z)
3、全连接层处理z向量 输出一个标量(预测相似度)
4、Sigmoid激活函数 输出介于0-1之间的实数

把预设的标签(target = 1)与预测之间的差作为损失函数
损失函数可以是标签与预测的交叉熵(cross-entropy) 衡量标签与预测的差别
注意正样本预设标签为1,负样本预设标签为0

损失函数可以用反向传播来计算梯度,再用梯度下降更新模型参数
1、反向传播获取全连接层的梯度,更新全连接层的参数
2、梯度从z传播到卷积神经网络f,用计算出的梯度更新卷积层的参数


浙公网安备 33010602011771号