• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 众包
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录

intsig

合合信息技术团队
  • 博客园
  • 联系
  • 订阅
  • 管理

公告

[置顶] 文本纠错:提升OCR任务准确率的方法理解

摘要: 错字率是OCR任务中的重要指标,文本纠错需要机器具备人类水平相当的语言理解能力。随着人工智能应用的成熟,越来越多的纠错方法被提出。 近年来深度学习在OCR领域取得了巨大的成功,但OCR应用中识别错误时有出现。错误的识别结果不仅难以阅读和理解,同时也降低文本的信息价值。在某些领域,如医疗行业,识别错误可能带来巨大的损失。因此如何降低OCR任务的错字率受到学术界和工业界的广泛关注。合合信息通过本文来讲解文本纠错技术帮助更多人解决业务问题。通常文本纠错的流程可以分为错误文本识别、候选词生成和候选词排序三个步骤。文本纠错方法可包括基于CTC解码和使用模型两种方式,下面分别对这两种纠错方式进行介绍。 阅读全文

posted @ 2023-01-31 11:26 合合技术团队 阅读(601) 评论(0) 推荐(0)

2026年3月5日

Chaterm 重塑故障应急:移动端救火、Agent Skills 与知识库智能运维

摘要: Chaterm 重塑故障应急:移动端救火、Agent Skills 与知识库智能运维 ​【P0 级紧急报警】核心交易系统响应超时,交易成功率骤降,百万用户付款受阻、订单大面积卡顿!值班工程师火速登录服务器,敲遍各种命令,登录一堆系统,在海量的日志中摸索近30分钟,才定位到是服务器问题的根因,等系统修复,完成扩容后,已造成数千笔订单流失,损失难以估量。 这样的突发故障,本身已是噩梦,如 阅读全文

posted @ 2026-03-05 11:55 合合技术团队 阅读(12) 评论(0) 推荐(0)

2026年3月4日

开源文档解析避坑指南:看清“免费”背后的隐形成本

摘要: 开源文档解析避坑指南:看清“免费”背后的隐形成本 ​前言:当“免费”的代价开始显现 在构建AI知识库或文档解析系统时,许多技术团队会遵循一个看似完美的路径:首先拥抱开源。理由充分——零授权成本、源码透明、社区活跃。在概念验证阶段,这一切运转良好。然而,随着项目从试点走向规模化部署,一系列连锁问题开始集中爆发,往往让团队陷入“骑虎难下”的困境。 本文 阅读全文

posted @ 2026-03-04 15:17 合合技术团队 阅读(5) 评论(0) 推荐(0)

2026年2月25日

零代码搭建「招标文件解析智能体」:Coze+TextIn xParse实现PDF上传自动提条款、标风险、出建议

摘要: 零代码搭建「招标文件解析智能体」:Coze+TextIn xParse实现PDF上传自动提条款、标风险、出建议 一、为什么招标文件不能只靠人看,也不能只丢给大模型? 如果你参与过招投标,一定理解这种挑战: 200-500 页起步:包含目录、征文、技术规范、商务条款、复杂表格和各类附件。 时间节点密集:报名、答疑、截止、开标……遗漏一个就是事故。 关键条款分散:保证金、履约、付款、交付、质保、废标条款隐藏在不同 阅读全文

posted @ 2026-02-25 14:21 合合技术团队 阅读(39) 评论(0) 推荐(0)

2026年2月5日

当运维遇上“春运时刻”,Chaterm破解移动远程运维操作难题

摘要: 当运维遇上“春运时刻”,Chaterm破解移动远程运维操作难题 随着AI基础设施布局速度加快,企业运维面临跨终端、全链路管理的新挑战。近日,上海合合信息科技股份有限公司旗下的AI Agent产品Chaterm推出移动端应用,同步在PC端上线“Agent Skills”功能,帮助云计算行业从业者解决移动场景操作受限、运维知识难以复用等难题。通过打通移动端与PC端的 阅读全文

posted @ 2026-02-05 10:58 合合技术团队 阅读(7) 评论(0) 推荐(0)

2026年2月4日

从识别字符到理解结构,“树模型”让AI“看懂”复杂手写数学公式

摘要: 从识别字符到理解结构,“树模型”让AI“看懂”复杂手写数学公式 论文名称:A tree-based model with branch parallel decoding for handwritten mathematical expression recognition 作者:Zhe Li, Wentao Yang, Hengnian Qi, Lianwen 阅读全文

posted @ 2026-02-04 14:22 合合技术团队 阅读(10) 评论(0) 推荐(0)

2026年2月3日

扫描全能王发起“国漫记忆守护计划”,打造“国风灵感素材库”

摘要: 扫描全能王发起“国漫记忆守护计划”,打造“国风灵感素材库” 国漫市场持续升温,2025年国产动画电影票房占比达75.7%,创历史新高。传统文化成为国漫创作的重要源泉,从哪吒到民俗元素,作品唤醒观众文化认同。扫描全能王发起"国漫记忆守护计划",通过AI扫描技术将手稿、非遗纹样转化为数字档案,助力创作素材积累。平台还提供线稿提取功能,降低创作门槛,让传统文化与现代科技融合,为国漫发展注入新活力。 阅读全文

posted @ 2026-02-03 15:26 合合技术团队 阅读(7) 评论(0) 推荐(0)

2026年1月28日

为什么开源OCR在Demo阶段很好,用到项目就开始出问题?

摘要: 为什么开源OCR在Demo阶段很好,用到项目就开始出问题? 1分钟速览 开源 OCR / 文档解析在 demo 阶段表现良好,是因为你验证的是“算法是否可行”; 而在真实项目中出问题,是因为你真正需要的是“一个可长期运行的工程系统”。 这不是你当初判断失误,而是项目进入了必须升级文档底座的阶段。当你开始在解析层遇到不可控问题时,真正要问的已经不是“还能不能再 阅读全文

posted @ 2026-01-28 14:29 合合技术团队 阅读(15) 评论(0) 推荐(0)

2026年1月22日

5分钟自动化财报抽取:基于TextIn+Coze的实践方案

摘要: 5分钟自动化财报抽取:基于TextIn+Coze的实践方案 一、引言:为什么选择TextIn与Coze搭建财报机器人? 面对季度、年度财报堆叠如山的PDF文档,技术团队如何快速、准确地将其中复杂的表格数据转化为结构化信息?本文将介绍一种高效实践方案:利用TextIn的智能文档解析能力,结合Coze的自动化工作流编排,快速构建一个能够处理多格式财报、抽取关键表 阅读全文

posted @ 2026-01-22 14:33 合合技术团队 阅读(33) 评论(0) 推荐(0)

2026年1月16日

论文解读-你的LLM能够稳定推理吗?

摘要: 论文解读-你的LLM能够稳定推理吗? 一、 简要介绍 大型语言模型(LLMs)的迅速发展在复杂推理任务中取得了显著进展。然而,基准测试与实际应用之间仍存在显著差距。论文认为这一差距主要源于当前的评估协议和指标未能全面反映LLM的能力,特别是在复杂推理任务中,准确性和一致性至关重要。本研究做出了两项重要贡献:首先,论文引入了G-Pass@ 阅读全文

posted @ 2026-01-16 14:58 合合技术团队 阅读(23) 评论(0) 推荐(0)

2026年1月14日

跨越AI落地“最后一公里”,合合信息推出多模态文本智能AI产品矩阵

摘要: 跨越AI落地“最后一公里”,合合信息推出多模态文本智能AI产品矩阵 合合信息发布多模态大模型创新产品,推动AI技术在各领域的商业化落地。其"CS-AI文档解决方案"实现文档全周期智能服务;教育领域推出"蜜蜂试卷"等AI学习工具;健康领域发布饮食助手Appediet。企业级市场推出xParse和INTSIGDocflow产品,提升数据处理效率。启信慧眼AI原生应用已应用于多个行业,日均风险扫描超2000万次。公司将持续推进多模态文本智能技术研发,探索AI应用新机遇。 阅读全文

posted @ 2026-01-14 15:30 合合技术团队 阅读(27) 评论(0) 推荐(0)

下一页
 
博客园  ©  2004-2026
浙公网安备 33010602011771号 浙ICP备2021040463号-3