会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Herokk
梦是蝴蝶的翅膀,年轻是飞翔的天堂。
博客园
首页
新随笔
联系
订阅
管理
2018年12月16日
Python 自然语言处理(1)中文分词技术
摘要: 中文分词技术 中文自动分词可主要归纳为“规则分词”“统计分词”和“混合分词”,规则分词主要是通过人工设立词库,按照一定方式进行匹配切分,实现简单高效,但对新词很难进行处理,统计分词能够较好应对新词发现能特殊场景,但太过于依赖语料的质量,因此实践中多是采用两者的结合,即混合分词。 1.1 规则分词 基
阅读全文
posted @ 2018-12-16 23:14 Herokk
阅读(4209)
评论(0)
推荐(0)
公告