摘要: 系统版本:Red Hat 4.4.6-4 一. 未联网情况下,选择本地安装。 首先安装theano的依赖库,包括:scipy-0.16.1numpy-1.9.2nose-1.3.7 (optional)lapack-3.5.0atlas-3.10.2sklearn-0.16.1 (optional) 阅读全文
posted @ 2016-04-26 18:14 小白菜的BLOG 阅读(1027) 评论(0) 推荐(0) 编辑
摘要: 为当前用户创建定时任务,让程序在特定时间自动执行。 1. 首先 输入 crontab -e 编辑crontab服务文件 例如:文件内容如下 #00 */1 * * * cd /home/work/lihehan/qubuild/extra; sh build.sh 1>>err.log 2>&1 0 阅读全文
posted @ 2016-04-25 17:16 小白菜的BLOG 阅读(142) 评论(0) 推荐(0) 编辑
摘要: python 静态页面爬虫 和 鼠标滑动动态加载页面爬虫, 以及浏览器实例化方法。 阅读全文
posted @ 2016-04-20 11:18 小白菜的BLOG 阅读(552) 评论(0) 推荐(0) 编辑
摘要: 读写文件的时候,由于编码千差万别,出现乱码问题。经研究,把大致的解决思路拿出来共享。我的开发环境是centos 7。 阅读全文
posted @ 2016-03-23 11:11 小白菜的BLOG 阅读(20191) 评论(0) 推荐(0) 编辑
摘要: 经常遇到由于样本巨大,需要sample一部分文件进行案例分析的情况,下面的程序主要为了随机抽取一个大文件中的N行。 阅读全文
posted @ 2016-03-22 14:33 小白菜的BLOG 阅读(1258) 评论(0) 推荐(0) 编辑
摘要: 时隔两年,又来了baidu,发现当年很多linux下常用的命令都记不大清楚了,挨个查找非常繁琐,于是下定决心还是把一些经常碰到的做一做记录好了。 grep: 匹配文件中包含特定字符: grep hello filename | more awk: 输出文件的某一列:awk '{print $1 $2 阅读全文
posted @ 2016-03-22 13:46 小白菜的BLOG 阅读(374) 评论(0) 推荐(0) 编辑
摘要: 安装环境:wondows 64bit Teano安装测试 1. Anaconda 安装 Anaconda是一个科学计算环境,自带的包管理器conda很强大。之所以选择它是因为它内置了python,以及numpy、scipy两个必要库和一些其他库,比起自己安装要省事。 首先下载Anaconda-2.1 阅读全文
posted @ 2016-03-17 17:12 小白菜的BLOG 阅读(11144) 评论(0) 推荐(1) 编辑
摘要: Twitter crawler 与sina 微博类似,使用twitter api之前,首先要有twitter的账号,在twitter developer中创建应用(https://apps.twitter.com/app/new)。创建成功之后可以获得应用的信息,包括Consumer key和Con... 阅读全文
posted @ 2016-01-10 14:03 小白菜的BLOG 阅读(2899) 评论(0) 推荐(0) 编辑
摘要: XVec表示X向量。||XVec||表示向量长度。r表示两点距离。r^2表示r的平方。k(XVec,YVec) = exp(-1/(2*sigma^2)*(r^2))= exp(-gamma*r^2)...... 公式-1这里, gamma=1/(2*sigma^2)是参数, r=||XVec-YV... 阅读全文
posted @ 2015-05-15 22:30 小白菜的BLOG 阅读(10349) 评论(1) 推荐(0) 编辑
摘要: 1. 使用libsvm工具箱时,可以指定使用工具箱自带的一些核函数(-t参数),主要有:-t kernel_type : set type of kernel function (default 2)0 -- linear: u'*v1 -- polynomial: (gamma*u'*v + co... 阅读全文
posted @ 2015-05-15 22:26 小白菜的BLOG 阅读(2309) 评论(2) 推荐(0) 编辑