• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • YouClaw
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录

intsig

合合信息技术团队
  • 博客园
  • 联系
  • 订阅
  • 管理

公告

[置顶] 文本纠错:提升OCR任务准确率的方法理解

摘要: 错字率是OCR任务中的重要指标,文本纠错需要机器具备人类水平相当的语言理解能力。随着人工智能应用的成熟,越来越多的纠错方法被提出。 近年来深度学习在OCR领域取得了巨大的成功,但OCR应用中识别错误时有出现。错误的识别结果不仅难以阅读和理解,同时也降低文本的信息价值。在某些领域,如医疗行业,识别错误可能带来巨大的损失。因此如何降低OCR任务的错字率受到学术界和工业界的广泛关注。合合信息通过本文来讲解文本纠错技术帮助更多人解决业务问题。通常文本纠错的流程可以分为错误文本识别、候选词生成和候选词排序三个步骤。文本纠错方法可包括基于CTC解码和使用模型两种方式,下面分别对这两种纠错方式进行介绍。 阅读全文

posted @ 2023-01-31 11:26 合合技术团队 阅读(640) 评论(0) 推荐(0)

2026年5月21日

信贷审核还在“翻流水”?别让跨页表格拖慢了整条审批链

摘要: 信贷审核还在“翻流水”?别让跨页表格拖慢了整条审批链 我们聊聊银行流水这件事。 做信贷审批、融资租赁、资质审核的团队,对流水的处理量有多大,你肯定有数。一个企业客户申请贷款,需要提供至少 6 个月的主要账户流水。如果是个人经营贷,十几张银行卡的流水凑在一起,动辄几十页。 审核人员要从这些密密麻麻的表格里,找出月均入账、主要收入来源、大额异常支出、月末余 阅读全文

posted @ 2026-05-21 15:47 合合技术团队 阅读(3) 评论(0) 推荐(0)

2026年5月20日

医疗报告智能解析:面向问诊与理赔的文档结构化方案(附GitHub项目地址)

摘要: 医疗报告智能解析:面向问诊与理赔的文档结构化方案(附GitHub项目地址) ​项目介绍:​这是一个面向流程自动化的医疗报告智能解析工具。支持上传 PDF、扫描件及手机拍照件,可自动处理检验报告、影像报告、体检报告、出院小结等多种文档,抽取患者信息、报告信息、检查指标、诊断结论、治疗方案及用药信息等核心字段,并输出统一结构的 JSON 格式。具备图像倾斜校正、透视矫正、表格区 阅读全文

posted @ 2026-05-20 11:06 合合技术团队 阅读(14) 评论(0) 推荐(0)

2026年5月14日

海外发票智能解析:跨版式、多税制票据的自动化处理方案(附GitHub项目地址)

摘要: 海外发票智能解析:跨版式、多税制票据的自动化处理方案(附GitHub项目地址) ​项目介绍:​这是一个面向跨境贸易与财务自动化的海外发票结构化抽取工具。支持上传 PDF/Word/图片格式的商业发票、税务发票、形式发票等多种海外票据,自动提取发票头、买卖双方、金额税额、明细行项目及物流字段,输出统一 Schema 的 JSON。具备多页续表合并、多国版式适配、字段级溯源与总额校 阅读全文

posted @ 2026-05-14 14:22 合合技术团队 阅读(13) 评论(0) 推荐(0)

8种海外发票、上百种版式:出口生意做大了,“录单核对”还在靠手动?

摘要: 8种海外发票、上百种版式:出口生意做大了,“录单核对”还在靠手动? 做出口生意、或是给外贸企业做财务软件、ERP 系统的朋友,我们来聊一个很具体的场景。 一批货发往欧洲,客户回传了发票。格式是 PDF,有时是扫描件,有时是手机拍的图片。发票抬头是德语或法语,明细行列了十几项产品,单价、数量、税率分布在不同的列,还跨了页。 财务人员要把这张票上的供应商名称、税号、In 阅读全文

posted @ 2026-05-14 11:19 合合技术团队 阅读(7) 评论(0) 推荐(0)

2026年5月8日

一张拍歪了的化验单,会让你的 AI 诊疗产品“失明”多久?

摘要: 一张拍歪了的化验单,会让你的 AI 诊疗产品“失明”多久? 先问一个问题:一张被手机拍弯的化验单,你的系统是否能把数据完整地读出来? 这是做医疗 AI 的团队经常面对的现实情况:不是技术不行,是输入太“任性”。 患者上传的检验报告,可能是褶皱的、倾斜的、光线不均的,甚至是对着屏幕翻拍的,上面有明显的反光和摩尔纹。版式也五花八门——不同医院、不同设备、不同年代 阅读全文

posted @ 2026-05-08 14:30 合合技术团队 阅读(7) 评论(0) 推荐(0)

2026年5月7日

让AI不再瞎点屏幕:TextIn GUI API让Agent看懂软件界面

摘要: 让AI不再瞎点屏幕:TextIn GUI API让Agent看懂软件界面 我们一直在讨论 AI Agent 会不会替人操作电脑。 但有一个更底层的问题,反而很少被认真讨论:Agent 看到一个登录页时,它真的知道哪个是输入框,哪个是按钮,哪个地方可以点吗? 对人来说,这个问题几乎不需要思考。看到一个页面,我们天然知道哪里是标题,哪里是输入框,哪里是验证码按钮,哪里是协议链 阅读全文

posted @ 2026-05-07 14:15 合合技术团队 阅读(7) 评论(0) 推荐(0)

2026年4月30日

[V2]AI合同审查的“隐形天花板”:从“能用”到“好用”,你的产品只差一个生产级解析底座

摘要: [V2]AI合同审查的“隐形天花板”:从“能用”到“好用”,你的产品只差一个生产级解析底座 当所有厂商都能调用 GPT-4、DeepSeek-R1、Qwen2.5-VL 时,合同审查产品的核心竞争力早已不是“AI 大脑”,而是“数字手眼”——文档解析的完整性、准确性、流畅性。这是看不见,但客户感知最直接的分水岭。 朋友,我们聊点真问题。 你在做 AI 合同审查产品。 融资拿了,团队搭了,模 阅读全文

posted @ 2026-04-30 10:27 合合技术团队 阅读(12) 评论(0) 推荐(0)

2026年4月29日

智能合同审查搭建教程:低质量PDF怎么处理?先解析清洗,再分路审阅(附GitHub项目地址)

摘要: 智能合同审查搭建教程:低质量PDF怎么处理?先解析清洗,再分路审阅(附GitHub项目地址) ​项目介绍:​这是一个开箱即用的合同风险检测工具。支持上传 PDF/Word 格式的购销、租赁、服务等合同文件,自动识别主体信息缺失、标的物不明、违约责任不完整等法律风险,并输出结构化审查意见与修改建议,结果可溯源至原文页码。适用于企业法务合规审查、业务合同自查及交易对手风险筛查。 ​GitHub 阅读全文

posted @ 2026-04-29 10:57 合合技术团队 阅读(15) 评论(0) 推荐(0)

2026年4月27日

合合信息旗下扫描全能王推出蜜蜂AI,作业批改效率提升超十倍

摘要: 合合信息旗下扫描全能王推出蜜蜂AI,作业批改效率提升超十倍 随着教育事业的发展,如何提升教学效率成为教师减负的关键。AI 工具为提质增效提供了可能,但在实际教学中面临“落地难”的困境。《2025 年中小学教师人群应用人工智能情况调研报告》显示,教师普遍认为,人工智能工具难以精准匹配教学需求,生成内容有偏差或专业度不足,需额外修正。56.3% 的受访者希望获取 阅读全文

posted @ 2026-04-27 11:47 合合技术团队 阅读(25) 评论(0) 推荐(0)

2026年4月23日

RAGFlow集成TextIn方案2.0上线!支持快速镜像部署,随时切换解析插件

摘要: RAGFlow集成TextIn方案2.0上线!支持快速镜像部署,随时切换解析插件 📝 项目简介 当前基于 RAGFlow v0.24.0 | 插件式集成 本项目是 RAGFlow 的​增强版本​,集成了 TextIn 文档智能解析能力,提供更高质量的 PDF 文档理解。 TextIn 是合合信息旗下的文档智能处理云平台,通过 AI 能力实现文本、表格、图表和公式的精准提取。 ​ 阅读全文

posted @ 2026-04-23 11:55 合合技术团队 阅读(27) 评论(0) 推荐(0)

下一页
 
博客园  ©  2004-2026
浙公网安备 33010602011771号 浙ICP备2021040463号-3