上一页 1 2 3 4 5 6 7 8 9 10 ··· 26 下一页
摘要: python的正则表达式模块是re,替换相关的方法是sub。 例如我们要做如下的替换将所有的 替换为空格,可以通过下面代码实现: 如果要做分组替换需要在替换的字符串中指定分组\1, 反斜杠+数字表示替换第n个分组 例如假定我要把abc此处在&nbsp和;之间的字符串需要保留。这样就需要分组替换了,正 阅读全文
posted @ 2016-07-21 15:49 cphmvp 阅读(437) 评论(0) 推荐(0) 编辑
摘要: 做爬虫经常会有这样的引用场景 ,原始网页存储格式为 url+\t+ html php 有个explode的 拆分文本行方法,比较方便直接接收列值 与之对应的python写法 下面的是备忘 阅读全文
posted @ 2016-07-21 15:34 cphmvp 阅读(304) 评论(0) 推荐(0) 编辑
摘要: python 按行读取文件 ,网上搜集有N种方法,效率有区别,先mark最优答案,下次补充测试数据 阅读全文
posted @ 2016-07-21 15:00 cphmvp 阅读(242) 评论(0) 推荐(0) 编辑
摘要: 自然语言描述 计算两个非负整数p和q的最大公约数: 若q=0,则最大公约数是p。否则,将p除以q得到余数r,p和q的最大公约数即为q和r的最大公约数 java语言描述 阅读全文
posted @ 2016-07-02 13:22 cphmvp 阅读(378) 评论(0) 推荐(0) 编辑
摘要: 整理使用 iTerm 2 过程中得常用快捷键,Mac 原来自带的终端工具 Terminal 不好用是出了名的,虽然最近几个版本苹果稍微做了些优化,功能上,可用性方面增强不少,无奈有个更好用的 Iterm2 摆在那,基本上也就没有多少出场机会了! (iterm 2 快捷键) 标签 新建标签:comma 阅读全文
posted @ 2016-03-21 14:31 cphmvp 阅读(1882) 评论(0) 推荐(0) 编辑
摘要: 前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信 阅读全文
posted @ 2016-02-26 11:47 cphmvp 阅读(191) 评论(0) 推荐(0) 编辑
摘要: 应用场景: 3kw行url+\t+html记录 【网站混合】 需要:按照网站来源分桶输出执行shellcat */*pack.html|awk -F '\t' '{ split($1,arr,"/"); site=arr[3]; print $0 > site }' 阅读全文
posted @ 2016-01-18 17:40 cphmvp 阅读(158) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2016-01-18 14:26 cphmvp 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 1、安装(不说了去 Google 吧)2、基础快捷键:option+space3、打开应用程序:Alfred 几乎是一切程序的入口,你再也不需要找妈妈要开始菜单了。用快捷键呼出Alfred,输入任何一款应用程序的中文或英文名称,即可快速定位程序,回车打开。4、简单查找文件:用快捷键呼出Alfred,... 阅读全文
posted @ 2016-01-11 14:48 cphmvp 阅读(1037) 评论(0) 推荐(0) 编辑
摘要: 使用下例中ssky-keygen和ssh-copy-id,仅需通过3个步骤的简单设置而无需输入密码就能登录远程Linux主机。ssh-keygen 创建公钥和密钥。ssh-copy-id 把本地主机的公钥复制到远程主机的authorized_keys文件上。ssh-copy-id 也会给远程主机的用... 阅读全文
posted @ 2016-01-11 14:01 cphmvp 阅读(146) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 26 下一页
爬虫在线测试小工具: http://tool.haoshuju.cn/