Few-shot Learning : Siamese Network

神经网络结构:

1、两张图片(x1、x2)输入卷积神经网络 输出提取的特征向量(h1、h2)

2、对两个特征向量作差 再取向量每个元素的绝对值(z)

3、全连接层处理z向量 输出一个标量(预测相似度)

4、Sigmoid激活函数 输出介于0-1之间的实数

 

 

把预设的标签(target = 1)与预测之间的差作为损失函数

损失函数可以是标签与预测的交叉熵(cross-entropy) 衡量标签与预测的差别

注意正样本预设标签为1,负样本预设标签为0

 

 

 

损失函数可以用反向传播来计算梯度,再用梯度下降更新模型参数

1、反向传播获取全连接层的梯度,更新全连接层的参数

2、梯度从z传播到卷积神经网络f,用计算出的梯度更新卷积层的参数

 

posted @ 2022-04-29 17:53  老裴菌  阅读(88)  评论(0)    收藏  举报