mAP的具体计算方法
mAP用于多标签分类任务,该类任务的标签有很多个,首先
1. 用训练好的模型获得所有测试样本的置信度confidence score
2. 将训练好的置信度进行排序
3. 得到Top-5的结果
4. 计算准确率和召回率 precision & recall
在实际的多类别任务中,需要知道Top-1 ~ Top-N对应的precision和recall(N为样本数),样本越多,recall一定越高,但precision一定会下降

计算AP的方式有很多,Pascal Voc challenage的计算方法:
设定一组阈值[0, 0.1, 0.2, 0.3 ..., 1],对于recall大于每一个阈值都有一个对应的最大的precision,AP即为sum(precision)/11,这一方法也叫11-point interpolated average precision。
2010年之后的计算方式改为:

假设在N个样本中有M个正例,则有M个recall值(1/M, 2/M, ..., 1),对于每个recall值r,计算出对应的(r' ≥ r)的最大的precision(向下取最大的precision),对M个precision取均值即为AP值。

浙公网安备 33010602011771号