摘要:
本“新词发现”模块基于信息熵和互信息两种算法,可以在无语料的情况下提取一段长文本中的词语,并支持过滤掉系统中已存在的“旧词”,得到新词列表。 阅读全文
posted @ 2019-02-15 14:59 左手中倒影 阅读(544) 评论(0) 推荐(0)
|
|||
|
摘要:
本“新词发现”模块基于信息熵和互信息两种算法,可以在无语料的情况下提取一段长文本中的词语,并支持过滤掉系统中已存在的“旧词”,得到新词列表。 阅读全文
posted @ 2019-02-15 14:59 左手中倒影 阅读(544) 评论(0) 推荐(0)
摘要:
这篇文章主要分享的是hanlp自然语言处理源码的下载,数据集的下载,以及将让源代码中的demo能够跑通。Hanlp安装包的下载以及安装其实之前就已经有过分享了。本篇文章主要还是备忘之用,同时算是给新手朋友的一些参考吧! 阅读全文
posted @ 2019-02-15 09:38 左手中倒影 阅读(151) 评论(0) 推荐(0) |
|||