nltk(Natural Language Toolkit)离线安装数据集
- 安装nltk:pip install nltk
- python脚本中,打印nltk可以放置数据的目录:print(nltk.data.path)
- github下载地址:https://github.com/nltk/nltk_data/tree/gh-pages ,将下载的文件中的packages重命名为nltk_data,作为放置数据的目录,比如:/Users/<your_name>/nltk_data/
- 也可以只下载需要的数据集,比如下载 https://github.com/nltk/nltk_data/blob/gh-pages/packages/tokenizers/punkt_tab.zip ,放到/Users/<your_name>/nltk_data/tokenizers目录下并解压punkt_tab.zip(目录:/Users/<your_name>/nltk_data,是nltk.data.path输出的其中一个目录,也可以放到nltk.data.path输出的其它目录)
浙公网安备 33010602011771号