2017年2月16日
摘要: 一, 获取文本语料库 一个文本语料库是一大段文本。它通常包含多个单独的文本,但为了处理方便,我们把他们头尾连接起来当做一个文本对待。 1. 古腾堡语料库 nltk包含古腾堡项目(Project Gutenberg)电子文本档案的一小部分文本。要使用该语料库通常需要用Python解释器加载nltk包, 阅读全文
posted @ 2017-02-16 21:38 寒若雪 阅读(8170) 评论(0) 推荐(0)