随笔分类 -  NLP

自然语言处理
摘要:1、pyltp简介 pyltp 是哈工大自然语言工作组推出的一款基于Python 封装的自然语言处理工具(轮子),提供了分词,词性标注,命名实体识别,依存句法分析,语义角色标注的功能。 2、pyltp安装方法 安装环境:windows10,python3.6 2.1.安装pyltp库 安装方法一:使 阅读全文
posted @ 2020-04-27 12:11 大明王 阅读(20987) 评论(2) 推荐(2)
摘要:stanfordcorenlp安装教程&简单使用教程 编译环境:python 3.6 、win10 64位、jdk1.8及以上 1、stanfordcorenlp安装依赖环境 下载安装JDK 1.8及以上版本。安装教程:https://blog.csdn.net/qq_40426415/articl 阅读全文
posted @ 2020-04-11 20:21 大明王 阅读(4443) 评论(1) 推荐(0)
摘要:1、问题描述 安装stanfordcorenlp成功,import stanfordcorenlp失败,pycharm中输入import stanfordcorenlp,然后运行,出现错误:importerror-no-module-named-psutil 2、解决方法: 切换psutil的版本, 阅读全文
posted @ 2020-04-11 16:40 大明王 阅读(1835) 评论(0) 推荐(0)
摘要:1、问题描述: pyhanlp成功安装,并且可以正常使用,但是这段时间再去用的时候,发现出问题了,一运行就出现,下面的问题: importerror: cannot import name 'jvmnotfoundexception' 2、原因解释: 因为我胡乱升级了jpype1的版本,造成pyha 阅读全文
posted @ 2020-04-11 16:25 大明王 阅读(1765) 评论(0) 推荐(0)
摘要:2.1 jieba 2.1.1 jieba简介 Jieba中文含义结巴,jieba库是目前做的最好的python分词组件。首先它的安装十分便捷,只需要使用pip安装;其次,它不需要另外下载其它的数据包,在这一点上它比其余五款分词工具都要便捷。另外,jieba库支持的文本编码方式为utf-8。 Jie 阅读全文
posted @ 2020-03-31 13:23 大明王 阅读(5835) 评论(0) 推荐(1)
摘要:1、hanlp简介 HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 Hanlp具有以下功能: 中文分词 词性标注 命名实体识别 依存句法分析 关键词提取新词发现 短语提取 自动摘要 阅读全文
posted @ 2020-03-29 19:59 大明王 阅读(6391) 评论(0) 推荐(0)
摘要:问题:使用pynlpir分词,遇到License过期问题 抛出异常:pynlpir.LicenseError: Your license appears to have expired. Try running "pynlpir update". 解决方法:下载下面链接文件,替换原有的NLPIR.u 阅读全文
posted @ 2020-03-22 15:08 大明王 阅读(1863) 评论(0) 推荐(0)
摘要:问题描述:Nltk下载数据包,安装频繁报错。 import nltk nltk.download() 运行上面的代码,下载nltk的数据包。但是在下载过程中因为各种问题导致网络传输失败,下载不成功。 解决方法:先下载nltk的数据包,安装到上面的目录,点击refresh,即可。 数据包下载地址: 链 阅读全文
posted @ 2020-03-16 18:49 大明王 阅读(1124) 评论(1) 推荐(0)
摘要:1.NLTK简介 Natural Language Toolkit,自然语言处理工具包,在NLP领域中,最常使用的一个Python库。NLTK是一个开源的项目,包含:Python模块,数据集和教程,用于NLP的研究和开发。NLTK由Steven Bird和Edward Loper在宾夕法尼亚大学计算 阅读全文
posted @ 2020-03-05 20:05 大明王 阅读(2405) 评论(0) 推荐(0)