上一页 1 ··· 12 13 14 15 16 17 18 19 20 ··· 42 下一页
  2016年10月9日
摘要: 原文地址: http://blog.csdn.net/devil_2009/article/details/7006113 vim多窗口使用技巧 1、打开多个窗口打开多个窗口的命令以下几个:横向切割窗口:new+窗口名(保存后就是文件名) :split+窗口名,也可以简写为:sp+窗口名纵向切割窗口 阅读全文
posted @ 2016-10-09 19:42 细雨微光 阅读(489) 评论(0) 推荐(0)
摘要: 在 linux 系统中没有在 windows 系统中那么方便的点点鼠标就可以操作文件了,对文件的各种操作都必须使用各种命令来完成。比如有时候我们需要在不查看文件内容的情况下需要知道该文件有多少行。这个时候可以通过 linux 的 wc 命令完成我们的想法。下面具体介绍一下 wc 命令的作用以及用法。 阅读全文
posted @ 2016-10-09 19:39 细雨微光 阅读(39834) 评论(0) 推荐(0)
  2016年9月27日
摘要: 利用程序自己编写下载文件挺有意思的。Python中最流行的方法就是通过Http利用urllib或者urllib2模块。当然你也可以利用ftplib从ftp站点下载文件。此外Python还提供了另外一种方法requests。 来看看三种方法是如何来下载zip文件的: 阅读全文
posted @ 2016-09-27 14:28 细雨微光 阅读(644) 评论(0) 推荐(0)
  2016年9月23日
摘要: 文章转载地址:http://www.linuxidc.com/Linux/2015-05/117502.htm 亲测可行,已经自己搭建一个正在使用中,搭建完成后,结合着pycharm +git,就能直接本地编辑了; 注:文章中有在原文修改的部分,会用红色标出 Git是一款免费、开源的分布式版本控制系 阅读全文
posted @ 2016-09-23 16:54 细雨微光 阅读(11872) 评论(3) 推荐(0)
  2016年9月19日
摘要: 当url地址含有中文,或者参数有中文的时候,这个算是很难正常了,但是把这样的url作为参数传递的时候(最常见的callback),需要把一些中文甚至‘/’做一下编码转换。 一、urlencode urllib库里面有个urlencode函数,可以把key-value这样的键值对转换成我们想要的格式, 阅读全文
posted @ 2016-09-19 18:02 细雨微光 阅读(524) 评论(0) 推荐(0)
  2016年8月29日
摘要: 在爬取海词的时候遇到了一个问题,在异步加载的时候,需要一个t值,但是这个t值是js加载出来的,直接拼接的,我们无法从网页中得到; 当在搜索框输入单词的时候:你在干嘛 替换下图中的page的值就能达到翻页的目的: 那么当前的目的就是要能够找到这段js代码,同时获取对应输入的t的值,来重新组合url 真 阅读全文
posted @ 2016-08-29 11:37 细雨微光 阅读(1071) 评论(0) 推荐(0)
  2016年8月18日
摘要: 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。 Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。 re 模块使 Python 语言拥有全部的正则表达式功能。 compile 函数根据一个模式字符串和可选的标志参数生成一个正则表 阅读全文
posted @ 2016-08-18 19:32 细雨微光 阅读(2560) 评论(1) 推荐(0)
  2016年8月17日
摘要: 最近爬取,或者解析网页是总是遇到编码问题(我的版本:python2.7) 一、常见异常:UnicodeEncodeError: 'ascii' codec can't encode character u'\xb4' in position 0: ordinal not in range(128) 阅读全文
posted @ 2016-08-17 15:18 细雨微光 阅读(464) 评论(0) 推荐(0)
  2016年8月11日
摘要: 词干化处理: 在NLP中,我们对一句话或一个文档分词之后,一般要进行词干化处理。词干化处理就是把一些名词的复数去掉,动词的不同时态去掉等等类似的处理。 对于切词得到的英文单词要进行词干化处理,主要包括将名词的复数变为单数和将动词的其他形态变为基本形态。对动词的词干化可以使用 Porter 算法[5] 阅读全文
posted @ 2016-08-11 14:55 细雨微光 阅读(2482) 评论(0) 推荐(0)
摘要: 参考链接:http://www.cnblogs.com/kaituorensheng/p/4445418.html python多进程:multiprocessing python中的多线程其实并不是真正的多线程,如果想要充分使用多核cpu的资源,在python中大部分情况下还是多进程。Python 阅读全文
posted @ 2016-08-11 10:57 细雨微光 阅读(582) 评论(0) 推荐(0)
上一页 1 ··· 12 13 14 15 16 17 18 19 20 ··· 42 下一页