• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • YouClaw
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录

intsig

合合信息技术团队
  • 博客园
  • 联系
  • 订阅
  • 管理

公告

[置顶] 文本纠错:提升OCR任务准确率的方法理解

摘要: 错字率是OCR任务中的重要指标,文本纠错需要机器具备人类水平相当的语言理解能力。随着人工智能应用的成熟,越来越多的纠错方法被提出。 近年来深度学习在OCR领域取得了巨大的成功,但OCR应用中识别错误时有出现。错误的识别结果不仅难以阅读和理解,同时也降低文本的信息价值。在某些领域,如医疗行业,识别错误可能带来巨大的损失。因此如何降低OCR任务的错字率受到学术界和工业界的广泛关注。合合信息通过本文来讲解文本纠错技术帮助更多人解决业务问题。通常文本纠错的流程可以分为错误文本识别、候选词生成和候选词排序三个步骤。文本纠错方法可包括基于CTC解码和使用模型两种方式,下面分别对这两种纠错方式进行介绍。 阅读全文

posted @ 2023-01-31 11:26 合合技术团队 阅读(631) 评论(0) 推荐(0)

2026年4月30日

[V2]AI合同审查的“隐形天花板”:从“能用”到“好用”,你的产品只差一个生产级解析底座

摘要: [V2]AI合同审查的“隐形天花板”:从“能用”到“好用”,你的产品只差一个生产级解析底座 当所有厂商都能调用 GPT-4、DeepSeek-R1、Qwen2.5-VL 时,合同审查产品的核心竞争力早已不是“AI 大脑”,而是“数字手眼”——文档解析的完整性、准确性、流畅性。这是看不见,但客户感知最直接的分水岭。 朋友,我们聊点真问题。 你在做 AI 合同审查产品。 融资拿了,团队搭了,模 阅读全文

posted @ 2026-04-30 10:27 合合技术团队 阅读(5) 评论(0) 推荐(0)

2026年4月29日

智能合同审查搭建教程:低质量PDF怎么处理?先解析清洗,再分路审阅(附GitHub项目地址)

摘要: 智能合同审查搭建教程:低质量PDF怎么处理?先解析清洗,再分路审阅(附GitHub项目地址) ​项目介绍:​这是一个开箱即用的合同风险检测工具。支持上传 PDF/Word 格式的购销、租赁、服务等合同文件,自动识别主体信息缺失、标的物不明、违约责任不完整等法律风险,并输出结构化审查意见与修改建议,结果可溯源至原文页码。适用于企业法务合规审查、业务合同自查及交易对手风险筛查。 ​GitHub 阅读全文

posted @ 2026-04-29 10:57 合合技术团队 阅读(6) 评论(0) 推荐(0)

2026年4月27日

合合信息旗下扫描全能王推出蜜蜂AI,作业批改效率提升超十倍

摘要: 合合信息旗下扫描全能王推出蜜蜂AI,作业批改效率提升超十倍 随着教育事业的发展,如何提升教学效率成为教师减负的关键。AI 工具为提质增效提供了可能,但在实际教学中面临“落地难”的困境。《2025 年中小学教师人群应用人工智能情况调研报告》显示,教师普遍认为,人工智能工具难以精准匹配教学需求,生成内容有偏差或专业度不足,需额外修正。56.3% 的受访者希望获取 阅读全文

posted @ 2026-04-27 11:47 合合技术团队 阅读(11) 评论(0) 推荐(0)

2026年4月23日

RAGFlow集成TextIn方案2.0上线!支持快速镜像部署,随时切换解析插件

摘要: RAGFlow集成TextIn方案2.0上线!支持快速镜像部署,随时切换解析插件 📝 项目简介 当前基于 RAGFlow v0.24.0 | 插件式集成 本项目是 RAGFlow 的​增强版本​,集成了 TextIn 文档智能解析能力,提供更高质量的 PDF 文档理解。 TextIn 是合合信息旗下的文档智能处理云平台,通过 AI 能力实现文本、表格、图表和公式的精准提取。 ​ 阅读全文

posted @ 2026-04-23 11:55 合合技术团队 阅读(14) 评论(0) 推荐(0)

2026年4月17日

名片全能王推出“高定名片”体验,携手上海国展集团重塑数智化会展新生态

摘要: 名片全能王推出“高定名片”体验,携手上海国展集团重塑数智化会展新生态 在商务交往中,递出名片只是连接的开始,如何让这张“名片”承载更多企业价值并转化为真实商机,成为 AI 时代的新课题。近日,合合信息旗下名片全能王焕新升级,将定制化的智能体验融入产品,为数字时代的商务人士打造出专属“高定名片”。 依托此次升级,名片全能王携手上海市国际展览(集团)有限公司(下称“上海国 阅读全文

posted @ 2026-04-17 14:35 合合技术团队 阅读(5) 评论(0) 推荐(0)

2026年4月16日

招投标文件结构化:为什么不要全文直抽?先切块再按模块定义输入输出(附GitHub项目地址)

摘要: 招投标文件结构化:为什么不要全文直抽?先切块再按模块定义输入输出(附GitHub项目地址) ​项目介绍:​这是一个面向投标/评标场景的结构化抽取工具。支持上传 PDF、Word 或 Excel 格式的招标文件,自动提取项目基础信息、投标资格、技术与商务要求、评标办法等关键条款,并还原目录层级与跨页表格。输出结构化 JSON/Excel,适用于招标文件智能生成、AI 辅助评标及招投标知识库建 阅读全文

posted @ 2026-04-16 11:24 合合技术团队 阅读(23) 评论(0) 推荐(0)

财务报告解析避坑指南:为什么三大表提取不该依赖 Prompt?(附GitHub项目地址)

摘要: 财务报告解析避坑指南:为什么三大表提取不该依赖 Prompt?(附GitHub项目地址) ​项目介绍:​这是一个开箱即用的财务报表抽取工具,支持上传 PDF/Excel 格式的年报、审计报告,自动提取资产负债表、利润表、现金流量表三大表结构化数据,输出 JSON 或 Excel。它能够处理跨页表格、合并单元格等复杂排版,并支持结果溯源至原文页码。适用于投融资分析、财务校验及企业知识库建设 阅读全文

posted @ 2026-04-16 11:04 合合技术团队 阅读(20) 评论(0) 推荐(0)

2026年4月10日

信贷审批、投资分析都在用:一份“金融级”财报解析工具,到底能帮你省多少事?

摘要: 信贷审批、投资分析都在用:一份“金融级”财报解析工具,到底能帮你省多少事? 一、每天在做的财报解析,其实是整个决策链条的“第一道工序” 对于银行信贷审批、融资租赁企业评估、投资机构的量化分析来说,财报解析是每天都要面对的基础工作。 一份企业的年度报告,少则几十页,多则上百页。三大表——资产负债表、利润表、现金流量表——藏在海量的文字、附注、表格之中,数据之间相互勾稽,信息需 阅读全文

posted @ 2026-04-10 11:46 合合技术团队 阅读(9) 评论(0) 推荐(0)

2026年4月9日

TextIn xParse+LangChain构建财务审计Agent:自动化合规审核与异常检测

摘要: TextIn xParse+LangChain构建财务审计Agent:自动化合规审核与异常检测 本教程面向财务审计、合规审核等场景,展示如何利用 xParse 作为数据底座,构建能够自动解析财务文档、提取关键信息、进行合规性检查和异常检测的智能 Agent。 场景介绍 业务痛点 在企业财务审计和合规审核场景中,审计人员面临以下挑战: ​文档量大​:需要处理大量财务报表、合同、发票、银行对账单等 阅读全文

posted @ 2026-04-09 11:12 合合技术团队 阅读(15) 评论(0) 推荐(0)

2026年4月2日

TextIn xParse LangChain插件正式上线!为Agent提供高效文档解析能力

摘要: TextIn xParse LangChain插件正式上线!为Agent提供高效文档解析能力 ​使用 xParse LangChain 插件,为 RAG、Agent、信息提取等场景的提供高效文档解析。 LangChain 是一个用于构建基于大语言模型应用的框架,提供了丰富的工具和组件,帮助开发者快速构建 RAG(检索增强生成)、Agent、信息提取等应用。 xParse 是一个端到端文档处理 阅读全文

posted @ 2026-04-02 14:41 合合技术团队 阅读(14) 评论(0) 推荐(0)

下一页
 
博客园  ©  2004-2026
浙公网安备 33010602011771号 浙ICP备2021040463号-3