06 2016 档案

摘要:df查看挂载点使用量 提示空间不足可能是因为旧的内核镜像没有卸载,使用uname -a 查看当前内核版本; dpkg --get-selections |grep linux-image 查看已安装的内核版本; 使用 sudo apt-get remove 卸载不需要的内核版本 阅读全文
posted @ 2016-06-29 09:07 Mscer 阅读(185) 评论(0) 推荐(0)
摘要:Accessing Text Corpora and Lexical Resources(文本语料库和词汇资源) 常用文本预料和词汇资源,如何通过python访问这些资源。 2.1 Accessing Text Corpora 语料:大量的文本资源。 访问语料的三个接口: raw(fileids) 阅读全文
posted @ 2016-06-23 22:02 Mscer 阅读(539) 评论(0) 推荐(0)
摘要:压缩:tar -zcvf 路径+文件名 原始文件路径+文件名 压缩: tar -jcvf 路径+文件名 原始文件路径+文件名 解压缩:tar -zxvf 路径+文件名 解压位置 解压缩:tar -jxvf 路径+文件名 解压位置 命令可选项: 压缩与解压缩 -c :压缩 -x:解压缩 压缩方式: - 阅读全文
posted @ 2016-06-19 20:27 Mscer 阅读(190) 评论(0) 推荐(0)
摘要:Ch1 Language Processing with Python 1.1 Computing with Language: Texts and Words 将文本看作是待处理的原始数据。 Searching Text nltk.text.Text.concordance(self,word): 阅读全文
posted @ 2016-06-19 20:11 Mscer 阅读(473) 评论(0) 推荐(0)
摘要:nltk.text.Text.dispersion_plot函数bug nltk.text.Text.dispersion_plot(self,words) 默认调用nltk.draw.dispersion_plot,进而调用matplotlib完成绘图功能。 但是:检查发现,dispersion_ 阅读全文
posted @ 2016-06-19 14:49 Mscer 阅读(535) 评论(0) 推荐(0)
摘要:Preface 自然语言经过一代又一代的处理,很难依靠明确的规则来表述。简单的NLP:通过比较词频来比较不同的写作风格;复杂的nlp:理解人类语言,并给出相应。 NLP应用:手写字符识别,搜索引擎,机器翻译等; NLP在学术界,又叫做计算语言学; 本书组织 Ch1-3:python处理nlp的简单介 阅读全文
posted @ 2016-06-19 11:19 Mscer 阅读(347) 评论(0) 推荐(0)
摘要:Ubuntu下常用的三种软件安装方式: apt-get deb软件包 源代码安装 1 apt-get 设置好更新源后使用,自动处理依赖关系,无法制定安装路径 安装:sudo apt-get install **; 卸载:sudo apt-get remove ** ; sudo apt-get au 阅读全文
posted @ 2016-06-18 11:38 Mscer 阅读(409) 评论(0) 推荐(0)