关于MSCOCO_text数据集的探索

最近需要做图片中文本识别的项目，然后为了快速验证模型，所以找到了mscoco-text数据集，网站1上是这么说的：

官网是这么说的：

然而，我下下来之后：
1 - 先导入：

2 - 其中key为’imgToAnns’是图片序号对应的注释序号，却是这样的：

然后，其中具体的图片中文字并不是完全标记出来的，比如某张图片中其实一共至少4处文字，其实就标记了一处，更有甚者有的图片单词都是只标记了一半。虽然没错一共是有145862个文字例子存在：

posted @ 2017-06-14 22:00 仙守阅读(526) 评论(0) 收藏举报

刷新页面返回顶部

仙守