会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
不哭的女孩
博客园
首页
新随笔
联系
管理
订阅
2017年2月16日
python 自然语言处理(二)____获得文本语料和词汇资源
摘要: 一, 获取文本语料库 一个文本语料库是一大段文本。它通常包含多个单独的文本,但为了处理方便,我们把他们头尾连接起来当做一个文本对待。 1. 古腾堡语料库 nltk包含古腾堡项目(Project Gutenberg)电子文本档案的一小部分文本。要使用该语料库通常需要用Python解释器加载nltk包,
阅读全文
posted @ 2017-02-16 21:38 寒若雪
阅读(8170)
评论(0)
推荐(0)
公告