【自然场景文本检测】TextMountain: Accurate Scene Text Detection via Instance Segmentation

推荐阅读EAST论文,二篇论文比较相似

论文地址:https://arxiv.org/abs/1811.12786

概述:损失函数由三部分组成

 

1 TS:预测文本/非文本

该损失函数采用交叉熵,利用了OHEM

2 TCBP:预测文字山峰

 

 

 

这二个式子主要保证离哪条边越近,其中相对越小

 

3 TCD:预测文字方向

 

 这式子主要保证离哪条边越近,其方向向量权重越大

 

 论文显示在rctw2017数据集上表现不错,结果如下:

 

在代码实现上没什么难度,只是训练速度很慢

 训练效果:

 TCBP

 TCD

左侧实际标签,右侧预测标签 

 

posted @ 2018-12-27 10:59 我花开后百花残 阅读(...) 评论(...) 编辑 收藏