玩转NLP之win下安装nltk

pycharm里面玩nltk之前 肯定要下载好nltk的一些基础包数据

以往大家都是 

import nltk
nltk.download()

安装nltk很简单,直接在 pycharm的 终端处跑下命令

pip install nltk 便可

 

其实第二步要下载一个全面的nltk基础包数据 很大的,大概有600M+

最近也在玩这个,网速不好的情况下全部下载下来非常耗时,且时长跟国外的网站断开连接

后面找了一个网络稍微好点的地方把全部包都下在下来了,打包了一下 放到了自己的百度云盘,

希望对大家有所帮助

链接: https://pan.baidu.com/s/1ih1MPweCURUJqjdw4P5Y5g 提取码: 8kp4 复制这段内容后打开百度网盘手机App,操作更方便哦

用法是,将该zip文件下载下来,直接丢在python的安装目录下

然后便可顺利玩转nltk了

import nltk

#注释
text = 'i love tz, i want to study NLP, i want to imporve myself'

sens = nltk.sent_tokenize(text, language='english')

print(sens)

words=[]
for sen in sens:
    words.append(nltk.word_tokenize(sen))

print(words)

tokens=[]
for word in words:
    tokens.append(nltk.pos_tag(word))

print(tokens)

chinesetext = '我的家,在东北,松花江上,哪里有,漫山遍野,大豆高粱,我爱你,中国'

sens = nltk.sent_tokenize(chinesetext)

print(sens)

words=[]
for sen in sens:
    words.append(nltk.word_tokenize(sen))

print(words)

tokens=[]
for word in words:
    tokens.append(nltk.pos_tag(word))

print(tokens)

  

 

posted @ 2019-06-29 10:52  quyf  阅读(191)  评论(0)    收藏  举报