摘要:
之前介绍 IK 字段级别字典 使用的时候,对于字典的更新只是支持词典库的新增,并不支持对存量词典库的修改或者删除。经过这段时间的开发,已经可以兼容词典库的更新,主要通过 IK reload API 来实现。 IK reload API IK reload API 通过对词典库的全量重新加载来实现词典 阅读全文
之前介绍 IK 字段级别字典 使用的时候,对于字典的更新只是支持词典库的新增,并不支持对存量词典库的修改或者删除。经过这段时间的开发,已经可以兼容词典库的更新,主要通过 IK reload API 来实现。 IK reload API IK reload API 通过对词典库的全量重新加载来实现词典 阅读全文
posted @ 2025-08-03 10:19
极限实验室
阅读(11)
评论(0)
推荐(0)
背景知识:词库的作用 IK 分词器是一款基于词典匹配的中文分词器,其准确性和召回率与 IK 使用的词库也有不小的关系。 这里我们先了解一下词典匹配法的作用流程: 预先准备一个大规模的词典,用算法在文本中寻找词典里的最长匹配项。这种方法实现简单且速度快。 但面临歧义切分和未登录词挑战:同一序列可能有不
INFINI Labs 产品更新发布!此次更新主要包括 Coco AI v0.7.0 新增 macOS Spotlight 和 Windows 文件搜索支持、语音输入功能,以及全屏集成模式;Easysearch v1.14.0 引入完整文本嵌入模型、语义检索 API 和搜索管道功能等,全面提升产品性
2025 年 7 月 17 日 在北京召开的 TDBC 2025 可信数据库发展大会·人工智能与数据库融合发展分论坛 上,国内领先的搜索数据库及解决方案提供商 极限科技(INFINI Labs)正式发布其创新产品 —— Coco AI,一款面向企业的 AI 智能搜索与高效协作平台。极限数据(北京)科
2025 年 7 月 17 日 在北京召开的 TDBC 2025 可信数据库发展大会·数据库生态及国际化分论坛 上,全球数据库领域专家、学者与企业代表齐聚。极限数据(北京)科技有限公司联合创始人曾嘉毅发表《搜索型数据库生态建设及展望》主题演讲,剖析技术创新与实践,为行业提供高效数据检索与智能应用方案
2025 年 7 月 16 日,由中国通信标准化协会主办、中国信息通信研究院(以下简称“中国信通院”)承办的“TDBC 2025 可信数据库发展大会”在北京隆重召开。作为我国数据库领域的年度权威盛会,本次大会以“自主·创新·引领”为主题,聚焦数据库技术创新与产业实践,发布了多项前沿研究成果,并深入探
问题背景 社区的一个伙伴想对一个 integer 的字段类型添加一个 keyword 类型的子字段,然后进行精确匹配的查询优化,提高查询的速度。 整个索引数据量不大,并不想进行 reindex 这样的复杂操作,就想到了使用 update_by_query 的存量数据更新。 所以我们测试了下面这套方案
前面介绍过 INFINI Console 纳管 Elasticsearch 9(一),进行指标监控、数据管理、DSL 语句执行,但日志监控功能需要结合 Agent 才能使用。现在来实现一下: Agent 需要和 ES 部署到同一机器上,这里是在我本地电脑上进行安装。 安装 Elastisearch
2025 年 7 月 16-17 日,「TDBC 2025 可信数据库发展大会」将在北京朝阳悠唐皇冠假日酒店隆重召开。大会由中国通信标准化协会主办,中国信息通信研究院、中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)承办。 本次大会 极限科技 再度受邀,创始人兼总经理曾勇、联合创始
2025 年 6 月 28 日,由上海开源信息技术协会主办、上海对外经贸大学承办的“2025 上海开源创新菁英荟”圆满落幕。本届大会以“开源有 AI,智领千行”为主题,汇聚开源社区、科研机构及产业界 200 余位专家,共同探讨开源技术如何赋能千行百业智能化转型。会上揭晓了四大类奖项,极限科技凭借其开
浙公网安备 33010602011771号