摘要: 词性标注 – 除了语法关系,句中单词的位置(词性)标记也蕴含着信息,词的位置定义了它的用途和功能。宾夕法尼亚大学提供了一个完整的位置标记列表。下方代码则使用了NLTK库来对输入的文本进行词性标注。 from nltk import word_tokenize, pos_tag text = "I a 阅读全文
posted @ 2018-08-23 09:45 danielPan 阅读(3763) 评论(0) 推荐(0) 编辑
摘要: #采集 import urllib.request response = urllib.request.urlopen('http://php.net/') html = response.read() #简单处理 from bs4 import BeautifulSoup soup = Beaut 阅读全文
posted @ 2018-08-23 09:21 danielPan 阅读(727) 评论(0) 推荐(0) 编辑