左手中倒影

hadoop技术控 大数据解决方案 hanlp研究爱好者
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

自然语言处理工具hanlp 1.7.3版本更新内容一览

Posted on 2019-05-10 09:24  左手中倒影  阅读(149)  评论(0编辑  收藏  举报

 

 HanLP 1.7.3 发布了。HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在提供丰富功能的同时,HanLP 内部模块坚持低耦合、模型坚持惰性加载、服务坚持静态提供、词典坚持明文发布,使用非常方便,同时自带一些语料处理工具,帮助用户训练自己的模型。

 

新版更新内容:

 

1.感知机词法分析器默认使用98年人民日报6个月的大模型

2.优化DoubleArrayTrie fix #1136

3.防止ViterbiSegment.dat不必要的初始化

4.修复词法分析器对动态插入的词条的处理 fix #271 (comment)

5.词法分析器seg接口支持自定义词性覆盖统计词性 fix #1156

6.修订拼音

7.新数据包data-for-1.7.3.zip md5=4e4f3695565a75b56427ba4a40731949

8.Portable版同步升级到v1.7.3

        <dependency>

            <groupId>com.hankcs</groupId>

            <artifactId>hanlp</artifactId>

            <version>portable-1.7.3</version>

        </dependency>