Danno

2024年3月9日

摘要：引言场景文本检测任务，一直以来是OCR整个任务中最为重要的一环。虽然有一些相关工作是端对端OCR工作的，但是从工业界来看，相关落地应用较为困难。因此，两阶段的OCR方案一直是优先考虑的。在两阶段中（文本检测+文本识别），文本检测是极为重要的一环。自从DBNet提出后，工业界似乎找到了法宝，DBN 阅读全文

posted @ 2024-03-09 21:14 Danno 阅读(307) 评论(0) 推荐(0)

2023年12月9日

公式识别任务各个链条全部打通

摘要：引言随着LaTeX-OCR模型转换问题的解决，公式识别任务中各个链条已经全部打通。小伙伴们可以放开膀子干了。解决业界问题的方案，并不是单独训练一个模型就完事了，而是有着上下游的依赖。这就像工厂中流水线作业一样，一个小东西的生产是依赖无数个中间阶段才完成的。一个模型应用到产品中，也是有着类似的流阅读全文

posted @ 2023-12-09 21:45 Danno 阅读(111) 评论(0) 推荐(0)

2023年11月23日

TableStructureRec: 表格结构识别推理库来了

摘要：引言 TableStructureRec 仓库是用来对文档中表格做结构化识别的推理库，包括来自 PaddleOCR 的表格结构识别算法模型、来自阿里读光有线和无线表格识别算法模型等。该仓库将表格识别前后处理做了完善，并结合 OCR，保证表格识别部分可直接使用。该仓库会持续关注表格识别这一领域，集阅读全文

posted @ 2023-11-23 22:39 Danno 阅读(1985) 评论(0) 推荐(0)

2023年10月28日

Python环境下LaTeX数学公式转图像方案调研与探讨

摘要： @目录引言方案一：基于LaTeX环境方案二：基于KaTeX(推荐) 方案三：基于Matplotlib写在最后引言近来，涉及到一些公式识别的项目，输入是公式的图像，输出是LaTeX格式的数学公式字符串。这类项目一般都采用深度学习的方法来做，这就涉及到构造公式LaTeX字符串和对应渲染后图像的数据阅读全文

posted @ 2023-10-28 22:06 Danno 阅读(609) 评论(0) 推荐(0)

2023年10月22日

rapidocr_paddle[gpu]：GPU端推理库来了

摘要：简介 rapidocr_paddle系列包是基于PaddlePaddle框架作为推理引擎的，支持CPU和GPU上推理。值得说明的是，这个包和PaddleOCR相比，代码基本都是一样的，只不过这个库将里面核心推理代码抽了出来，更加精简而已。推荐GPU上用这个，CPU端还是以rapidocr_onnx 阅读全文

posted @ 2023-10-22 22:50 Danno 阅读(340) 评论(0) 推荐(0)

2023年9月12日

记录一次部署Hugo主题lotusdocs到Github Pages实践

摘要：引言随着开源项目的越来越复杂，项目文档的重要性日渐突出。一个好的项目要有一个清晰明了的文档来帮助大家使用。最近一直有在找寻一个简洁明了的文档主题来放置项目的各种相关文档。最终找到这次的主角：Lotus Docs 基于Hugo的主题。Lotus Docs的样子，可以移步这里查看。下面着重讲解如何阅读全文

posted @ 2023-09-12 21:48 Danno 阅读(79) 评论(0) 推荐(0)

2023年7月29日

Knowledge-QA-LLM: 基于本地知识库+LLM的问答系统

摘要： ## ⚠️注意：后续更新，请移步[README](https://github.com/RapidAI/Knowledge-QA-LLM) ## Knowledge QA LLM =3.8, - 基于本地知识库+LLM的问答系统。该项目的思路是由[langchain-ChatGLM](https:/ 阅读全文

posted @ 2023-07-29 20:29 Danno 阅读(1784) 评论(0) 推荐(0)

2023年7月24日

TextDetMetric: 计算文本检测算法指标工具

摘要： ## [Text Detect Metric](https://github.com/SWHL/TextDetMetric) =3.6, - 该库用于计算`Precision`、`Recall`和`H-mean`三个指标，用来评测文本检测算法效果。与[魔搭-文本检测测试集](https://www. 阅读全文

posted @ 2023-07-24 09:20 Danno 阅读(227) 评论(0) 推荐(0)

2023年7月16日

在VSCode中编写python代码，代码规范工具介绍与推荐

摘要： ### 引言 - 日常中，写的最多的代码是Python，虽说是算法工程师，这不也是工程师嘛，所以基本的代码功底还是要有的。 - 由于Python是动态类型语言，没有强制的约束，如果没有一些相应规范，会导致大家写的代码可读性较差，且潜在的问题难以发现。 - 因此，本文旨在引入一些工具来帮助大家写出更加阅读全文

posted @ 2023-07-16 15:06 Danno 阅读(4028) 评论(0) 推荐(1)

2023年7月15日

rapid_latex_ocr: 更快更好用的公式图像转latex工具

摘要： ## [Rapid Latex OCR](https://github.com/RapidAI/RapidLatexOCR) =3.6, * `rapid_latex_ocr`是一个将公式图像转为latex格式的工具。 * **仓库中的推理代码来自修改自[LaTeX-OCR](https://git 阅读全文

posted @ 2023-07-15 22:51 Danno 阅读(332) 评论(0) 推荐(0)

公告