摘要:
原作者:http://www.cnblogs.com/I-Tegulia/category/706685.html 1.自然语言工具包(NLTK) NLTK 创建于2001 年,最初是宾州大学计算机与信息科学系计算语言学课程的一部分。从那以后,在数十名贡献者的帮助下不断发展壮大。如今,它已被几十所大 阅读全文
posted @ 2017-04-18 22:45 挥辉 阅读(7096) 评论(0) 推荐(1)
|
|||
|
摘要:
原作者:http://www.cnblogs.com/I-Tegulia/category/706685.html 1.自然语言工具包(NLTK) NLTK 创建于2001 年,最初是宾州大学计算机与信息科学系计算语言学课程的一部分。从那以后,在数十名贡献者的帮助下不断发展壮大。如今,它已被几十所大 阅读全文
posted @ 2017-04-18 22:45 挥辉 阅读(7096) 评论(0) 推荐(1)
摘要:
NLTK的内置函数 1. 词语索引 NLTK的内置函数 1. 词语索引 (1) concordance函数 给出一个指定单词每一次出现,连同上下文一起显示。 >>>text1.concordance('monstrous') (2) similar函数 查找文中上下文结构相似的词,如the___pi 阅读全文
posted @ 2017-04-18 22:42 挥辉 阅读(3165) 评论(0) 推荐(0)
摘要:
nltk-data.zip 本文主要是总结最近学习的论文、书籍相关知识,主要是Natural Language Pracessing(自然语言处理,简称NLP)和Python挖掘维基百科Infobox等内容的知识。 此篇文章主要参考书籍《Natural Language Processing wit 阅读全文
posted @ 2017-04-18 22:37 挥辉 阅读(1545) 评论(0) 推荐(0)
摘要:
Python 将pdf转换成txt(不处理图片) 上一篇文章中已经介绍了简单的python爬网页下载文档,但下载后的文档多为doc或pdf,对于数据处理仍然有很多限制,所以将doc/pdf转换成txt显得尤为重要。查找了很多资料,在linux下要将doc转换成txt确实有难度,所以考虑先将pdf转换 阅读全文
posted @ 2017-04-18 10:56 挥辉 阅读(1534) 评论(0) 推荐(0)
摘要:
Python自然语言处理入门 原文链接:http://python.jobbole.com/85094/ 分享到:20 本文由 伯乐在线 - Ree Ray 翻译,renlytime 校稿。未经许可,禁止转载!英文出处:Nitin Madnani。欢迎加入翻译组。 本文从概念和实际操作量方面,从零开 阅读全文
posted @ 2017-04-18 09:41 挥辉 阅读(1738) 评论(0) 推荐(1) |
|||