nltk(Natural Language Toolkit)离线安装数据集

  1. 安装nltk:pip install nltk
  2. python脚本中,打印nltk可以放置数据的目录:print(nltk.data.path)
  3. github下载地址:https://github.com/nltk/nltk_data/tree/gh-pages ,将下载的文件中的packages重命名为nltk_data,作为放置数据的目录,比如:/Users/<your_name>/nltk_data/
  4. 也可以只下载需要的数据集,比如下载 https://github.com/nltk/nltk_data/blob/gh-pages/packages/tokenizers/punkt_tab.zip ,放到/Users/<your_name>/nltk_data/tokenizers目录下并解压punkt_tab.zip(目录:/Users/<your_name>/nltk_data,是nltk.data.path输出的其中一个目录,也可以放到nltk.data.path输出的其它目录)

posted on 2025-09-06 17:51  cag2050  阅读(115)  评论(0)    收藏  举报

导航