摘要: 这个网站类似于Github的Awesome xxx系列,不过它是随时更新的,排序方式,分类也更加友好。 阅读全文
posted @ 2019-04-01 11:35 thomaszdxsn 阅读(234) 评论(0) 推荐(0)
摘要: OCR,全称Optical character recognition,或者optical character reader,中文译名叫做光学文字识别。它是把图像文件中的手写文本,打印文本转换为机器编码文本的一种方法。 阅读全文
posted @ 2019-04-01 05:06 thomaszdxsn 阅读(2981) 评论(0) 推荐(0)
摘要: 如果你使用Tesseract不能获得理想的输出结果,可能会有很多原因。但是请记住,除非你使用一个非常罕见的字体,或者使用一种没有被训练过的新语言这些情况,重新训练Tesseract不会有多大效果。 阅读全文
posted @ 2019-04-01 04:47 thomaszdxsn 阅读(6349) 评论(0) 推荐(0)