文本检测数据集以及标签形式说明

文本检测数据集以及标签形式说明

icdar15系列,带角度的四边形标签

 

 

 

打开标签文件,每行为一个文本框坐标以及语言类型,文字,###代表模糊不清

形式,是四边形的四个点的坐标。

 

ctw1500系列任意形状的数据集标签

 

 

每行共32个数字,前四个数字为该弯曲文本在整张图上的矩形框坐标值,

剩下的28个值为14个点,为相对于矩形框左上角得误差补偿即为与左上角坐标所形成的差值,形成封闭的弯曲文本框,

其计算方式可以简单的理解为:

1.将前4个坐标值的矩形框从原图中截取出来(左上右下4个点)

2.在截取之后的图中取14个点的坐标值

 

posted @ 2020-02-29 17:58  you-wh  阅读(1710)  评论(0编辑  收藏  举报
Fork me on GitHub