摘要:
本文旨在介绍如何利用HanLP训练分词模型,包括语料格式、语料预处理、训练接口、输出格式等。 目前HanLP内置的训练接口是针对一阶HMM-NGram设计的,另外附带了通用的语料加载工具,可以通过少量代码导出供其他训练工具使用的特定格式(如CRF++)。 阅读全文
posted @ 2019-02-13 14:52 左手中倒影 阅读(307) 评论(0) 推荐(0)
|
|||
|
摘要:
本文旨在介绍如何利用HanLP训练分词模型,包括语料格式、语料预处理、训练接口、输出格式等。 目前HanLP内置的训练接口是针对一阶HMM-NGram设计的,另外附带了通用的语料加载工具,可以通过少量代码导出供其他训练工具使用的特定格式(如CRF++)。 阅读全文
posted @ 2019-02-13 14:52 左手中倒影 阅读(307) 评论(0) 推荐(0)
摘要:
Hanlp作为一款重要的中文分词工具,在GitHub的用户量已经非常之高,应该可以看得出来大家对于hanlp这款分词工具还是很认可的。本篇继续分享一篇关于hanlp的使用实例即Python调用hanlp进行中文实体识别。 阅读全文
posted @ 2019-02-13 09:15 左手中倒影 阅读(981) 评论(0) 推荐(0) |
|||