玩转NLP之win下安装nltk
pycharm里面玩nltk之前 肯定要下载好nltk的一些基础包数据
以往大家都是
import nltk
nltk.download()
安装nltk很简单,直接在 pycharm的 终端处跑下命令
pip install nltk 便可

其实第二步要下载一个全面的nltk基础包数据 很大的,大概有600M+
最近也在玩这个,网速不好的情况下全部下载下来非常耗时,且时长跟国外的网站断开连接
后面找了一个网络稍微好点的地方把全部包都下在下来了,打包了一下 放到了自己的百度云盘,
希望对大家有所帮助
链接: https://pan.baidu.com/s/1ih1MPweCURUJqjdw4P5Y5g 提取码: 8kp4 复制这段内容后打开百度网盘手机App,操作更方便哦
用法是,将该zip文件下载下来,直接丢在python的安装目录下

然后便可顺利玩转nltk了
import nltk
#注释
text = 'i love tz, i want to study NLP, i want to imporve myself'
sens = nltk.sent_tokenize(text, language='english')
print(sens)
words=[]
for sen in sens:
words.append(nltk.word_tokenize(sen))
print(words)
tokens=[]
for word in words:
tokens.append(nltk.pos_tag(word))
print(tokens)
chinesetext = '我的家,在东北,松花江上,哪里有,漫山遍野,大豆高粱,我爱你,中国'
sens = nltk.sent_tokenize(chinesetext)
print(sens)
words=[]
for sen in sens:
words.append(nltk.word_tokenize(sen))
print(words)
tokens=[]
for word in words:
tokens.append(nltk.pos_tag(word))
print(tokens)
人生在勤,不索何获,坚持自有收获
浙公网安备 33010602011771号