MTCNN做人脸识别任务
一、人脸检测
二、人脸识别
- 输入:固定大小的图像
- 问题1:需要使用的网络层数更多
- 如何完成优化
- 问题2:能处理多个类的情况
- 类似于迁移学习
1、 模型1:VGGNet
- 3*3 娟娟核心代替5*5的卷积
- 训练参数多
2、 模型2:GoogleNet、Inception
特点1- 将一个大的卷积核心拆分成多个小的卷积核心
网络模型优化:
- input输入进来之后,通过1*1卷积核心
如:用tensorflow基础的变换实现
input : B H W C1
中间的变换过程:H ·W (其中W为(1,1,C1,C2))
output: B H W C2
特点2- 可以看作是VGGNet基础上的改进
特点3- 1*1 的卷积称为逐点卷积
特点4- 解决了可训练参数多的问题
3、模型3:ResNet
特点1- 解决了梯度消失的问题
特点2-网络层数可以达到很深
4、BatchNorm优化必不可少
- 使得网络容易收敛,加快收敛速度
- 在一定程度上提升精度
三、损失函数
三元损失函数:
思想;相同的人脸的距离小于不同的人脸的距离
loss = (VA1-VA2)^2 + a - (VA1-VB)^2

浙公网安备 33010602011771号