OCR技术难点解读:数学公式检测与识别
本文讨论了文档解析中数学表达式检测与识别(MEDR)这一自然语言处理和计算机视觉交叉领域的重要技术,介绍其技术难点、应用场景、发展历程及相关模型等。 阅读全文
posted @ 2025-04-23 16:44 合合技术团队 阅读(158) 评论(0) 推荐(0)
本文讨论了文档解析中数学表达式检测与识别(MEDR)这一自然语言处理和计算机视觉交叉领域的重要技术,介绍其技术难点、应用场景、发展历程及相关模型等。 阅读全文
posted @ 2025-04-23 16:44 合合技术团队 阅读(158) 评论(0) 推荐(0)
启信宝专注于商业查询领域,基于20个维度328项指标评估体系,通过商业查询技术识别实际开展动力电池回收业务的企业,发布了《启信宝动力电池回收利用产业洞察报告》。 阅读全文
posted @ 2025-04-18 11:52 合合技术团队 阅读(52) 评论(0) 推荐(0)
近期,合合信息发布了《智能文档技术与应用白皮书》,系统化呈现了智能文档技术的最新进展与应用场景,为各行业数字化转型提供可落地的智能文档解决方案参考。 阅读全文
posted @ 2025-04-17 10:48 合合技术团队 阅读(73) 评论(0) 推荐(0)
本文讨论了TextIn ParseX通用文档解析这款适配多样化场景的PDF解析工具,介绍了其常用参数的作用及使用方法。关键要点包括解析页码参数、分辨率参数、加密文档参数、标题目录参数、获取JSON结果参数、页面元素参数及表格输出参数。 阅读全文
posted @ 2025-04-16 12:31 合合技术团队 阅读(121) 评论(0) 推荐(0)
本文讨论了法国一家AI独角兽公司发布号称“全世界最好的OCR”产品A产品后,TextIn测试团队对其与TextIn文档解析工具进行对比测试的情况,涵盖测评指标、数据集、结果等内容。 阅读全文
posted @ 2025-04-02 14:47 合合技术团队 阅读(176) 评论(0) 推荐(0)
本文讨论了文字识别技术,尤其是OCR商业化产品的算法逻辑,介绍了其发展历史、核心任务中的文本检测和识别方法等。关键要点包括:OCR概念与溯源、文本检测、基于CTC损失的文本识别方法、基于序列到序列的文本识别方法。 阅读全文
posted @ 2025-03-26 11:15 合合技术团队 阅读(252) 评论(0) 推荐(0)
近期,上海合合信息科技股份有限公司(简称“合合信息”)TextIn“大模型加速器 2.0”版本正式上线,基于领先的智能文档处理技术,对复杂文档的版式、布局和元素进行精准解析及结构化处理,从数据源头降低大模型“幻觉”风险,让大模型在与人类的沟通中“更靠谱”。 阅读全文
posted @ 2025-03-21 15:04 合合技术团队 阅读(76) 评论(0) 推荐(0)
随着DeepSeek的现象级爆发,越来越多的企业开始部署大模型搭建企业知识库,实现企业数据资产化,赋能在线客服、投保承保、智能投研、合规审计等多行业业务场景。 但在实际应用中,企业有大量数据在PDF、扫描件、图片、网页等非结构化文档中,这些多来源、多格式、多版式布局的非结构化数据,很难被大模型准确解 阅读全文
posted @ 2025-03-18 22:11 合合技术团队 阅读(23) 评论(0) 推荐(0)
近期,合合信息旗下扫描全能王发布了2024年度绿色扫描数据,用数字揭开了一场“指尖减碳”的浪漫之旅。未来,以扫描全能王智能扫描技术为代表的科技势能,将带动更多人完成“指尖上的减碳”,共同绘就生态文明建设的崭新画卷。 阅读全文
posted @ 2025-03-18 14:47 合合技术团队 阅读(41) 评论(0) 推荐(0)
合合信息启信慧眼发布《国央企风控合规案例白皮书》,揭秘国央企风控升级路径。 阅读全文
posted @ 2025-03-13 10:57 合合技术团队 阅读(78) 评论(0) 推荐(0)