摘要: sort –k1,2 把第一个第二个字段当成一个字符串排序 cat userstat_test_data.txt sessionquantize_test_data.txt | python SessionUserMap.py | sort -k1,2 cat userstat_test_data.txt sessionquantize_test_data.txt | python S... 阅读全文
posted @ 2014-09-15 10:48 孤魂野鬼hg 阅读(124) 评论(0) 推荐(0) 编辑
摘要: java 内存分配解析 http://blog.csdn.net/shimiso/article/details/8595564 阅读全文
posted @ 2014-09-14 16:45 孤魂野鬼hg 阅读(73) 评论(0) 推荐(0) 编辑
摘要: 1. 日期格式验证 http://blog.csdn.net/zmxj/article/details/3950303 阅读全文
posted @ 2014-09-10 17:10 孤魂野鬼hg 阅读(66) 评论(0) 推荐(0) 编辑
摘要: 1. hadoop streaming原理介绍 http://blog.csdn.net/azhao_dn/article/details/7290762 2. demo http://www.michael-noll.com/tutorials/writing-an-hadoop-mapreduce-program-in-python/ 阅读全文
posted @ 2014-09-04 17:26 孤魂野鬼hg 阅读(132) 评论(0) 推荐(0) 编辑
摘要: http://blog.163.com/jiayouweijiewj@126/blog/static/171232177201081994553310/ 判断文件是否存在 hadoop fs -test -e /hdfs_dir if [ $? -ne 0 ]; then echo "Directory not exists!" fi if [ $? -ne 1 ]; then... 阅读全文
posted @ 2014-09-04 15:48 孤魂野鬼hg 阅读(80) 评论(0) 推荐(0) 编辑
摘要: 1. 匹配[] {}字符串 http://blog.sina.com.cn/s/blog_936a1f0a0101bdv7.html 阅读全文
posted @ 2014-09-02 09:28 孤魂野鬼hg 阅读(104) 评论(0) 推荐(0) 编辑
摘要: ''' Created on 2014-8-29 @author: hg ''' #http://www.cnblogs.com/btchenguang/archive/2012/01/30/2332479.html myList = [[0] * 3] * 4 myList[0][1] = myList[0][1] +2 print 'shallow cop... 阅读全文
posted @ 2014-09-01 10:47 孤魂野鬼hg 阅读(234) 评论(0) 推荐(0) 编辑
摘要: 需要在Tomcat目录下面的 conf/tomcat-user.xml文件下面添加: 改成自己的用户名密码 阅读全文
posted @ 2014-08-29 21:36 孤魂野鬼hg 阅读(110) 评论(0) 推荐(0) 编辑
摘要: http://qindongliang.iteye.com/category/320368 1. 端口有关 netstat -apn|grep 80 找到进程号以后,再使用以下命令查看详细信息: ps -aux|grep 19408 阅读全文
posted @ 2014-08-29 08:38 孤魂野鬼hg 阅读(75) 评论(0) 推荐(0) 编辑
摘要: 1. ipython demo http://nbviewer.ipython.org/github/agconti/kaggle-titanic/blob/master/Titanic.ipynb 阅读全文
posted @ 2014-08-28 09:19 孤魂野鬼hg 阅读(193) 评论(0) 推荐(0) 编辑