09 2013 档案
bash 文件头尾插入字符
摘要:头部插入:sed -i '1i\Insert this line' file.txt尾部插入:echo "hehe" >> tmp.txt 阅读全文
posted @ 2013-09-22 15:30 andy071001 阅读(458) 评论(0) 推荐(1)
vim 精确匹配查找单词【转】
摘要:删除文件中所有的空行:g/^\s*$/d去掉所有的行尾空格::%s/\s\+$//整个文件特定字符串的替换:%s/old_word/new_word/g删除从当前行开始到最后一行的所有内容:.,$d去掉所有的“//”注释::%s!\s*//.*!!(首先可以注意到,这儿分隔符改用了“!”,原因是在模式或字符串部分使用了“/”字符,不换用其他分隔符的话就得在每次使用“/”字符本身时写成“\/”,上面的命令得写成“:%s/\s*\/\/.*//”,可读性较低。命令本身倒是相当简单,用过正则表达式的人估计都知道“.”匹配表示除换行符之外的任何字符吧。 )去掉所有的“/* */”注释::%s!\s*/ 阅读全文
posted @ 2013-09-21 20:12 andy071001 阅读(8996) 评论(1) 推荐(0)
监测正在运行的程序运行结束之后执行脚本
摘要:#!/bin/bashwhile truedocn=`ps aux | grep canopy.py | grep -v grep | wc -l`if [ $cn -lt 1 ];thenpython get_k_center.pypython kmeans.pybreakfisleep 5mdone是遇到了实际的情况,一个聚类脚本跑了两个小时没跑完。。。无奈之举 阅读全文
posted @ 2013-09-18 21:36 andy071001 阅读(180) 评论(0) 推荐(0)
temp
摘要:(1)总体思路:根据Canopy算法产生的Canopies代替初始的K个聚类中心点,由于已经将所有数据点进行Canopies有覆盖划分,在计 算数据离哪个k-center最近时,不必计算其到所有k-centers的距离,只计算和它在同一个Canopy下的k-centers。这样可以提高 效率。 阅读全文
posted @ 2013-09-16 19:21 andy071001 阅读(128) 评论(0) 推荐(0)
好博客
摘要:发现很多好博客,奈何没有很好的rss阅读器,于是就用一个最简单的办法,发现一个就记在这里吧:貌似不错,多看看c++的内容http://blog.csdn.net/Solstice仔细看这里面的boost学习http://blog.csdn.net/u011676589/http://www.aqee.net/archives/http://sobuhu.com/index.htmlhttp://www.cnblogs.com/haippy/http://www.csie.ntnu.edu.tw/~u91029/index.html在线算法学习http://sjjg.js.zwu.edu.cn/ 阅读全文
posted @ 2013-09-16 16:16 andy071001 阅读(231) 评论(0) 推荐(0)
Python Unicode与中文处理(转)
摘要:Python Unicode与中文处理 python中的unicode是让人很困惑、比较难以理解的问题,本文力求彻底解决这些问题;1.unicode、gbk、gb2312、utf-8的关系;http://www.pythonclub.org/python-basic/encode-detail 这篇文章写的比较好,utf-8是unicode的一种实现方式,unicode、gbk、gb2312是编码字符集;2.python中的中文编码问题;2.1 .py文件中的编码 Python 默认脚本文件都是 ANSCII 编码的,当文件 中有非 ANSCII 编码范围内的字符的时候就要使用"编码 阅读全文
posted @ 2013-09-13 11:21 andy071001 阅读(1262) 评论(0) 推荐(0)
leetcode Palindrome Partitioning
摘要:class Solution {public: bool is_pal(string s, int start, int end) { while (start > part(string s, int start, int end) { vector> r; for (int st = end; st >= 0; st--) { vector> ret; if (is_pal(s, st, end)) { s... 阅读全文
posted @ 2013-09-13 00:36 andy071001 阅读(139) 评论(0) 推荐(0)
awk批量处理文件,对第一列去重并,累加第二列数值,打印一二列存入新文件
摘要:awk '{if(NR>1)a[$1]+=$2}END{for(i in a)printf "%s\t %d\n",i,a[i]}' querylog* > total.txt 阅读全文
posted @ 2013-09-12 20:59 andy071001 阅读(880) 评论(0) 推荐(0)
linux批量解压和批量压缩
摘要:ls *.tar.gz | xargs -n1 tar xzvf //批量解压ls | awk '{ print "tar zcvf "$0".tar.gz " $0|"/bin/bash" }' //批量打包ls | awk '{ print "tar zcvf "$0".tar.gz " $0 }'|/bin/bash //批量打包gzip -d *.gz 阅读全文
posted @ 2013-09-12 17:47 andy071001 阅读(1778) 评论(0) 推荐(0)
【转】 C++ 简单的 Tcp 实现[socket] 客户端与客户端通信
摘要:// 服务器端代码// Server.cpp : Defines the entry point for the console application.//#include "stdafx.h"#include "winsock2.h"#pragma comment(lib, "ws2_32.lib")#include using namespace std;int _tmain(int argc, char* argv[]){ const int BUF_SIZE = 64; WSADATA wsd; //WSADATA变量 SO 阅读全文
posted @ 2013-09-11 11:40 andy071001 阅读(417) 评论(0) 推荐(0)
【转】纪录一下最近对分布式的感悟
摘要:纪录一下最近对分布式的感悟分布式存储,主要由2部分组成,1、网络对数据切分。 2、存储。 对 于网络对数据切分需要解决哪些问题?解决数据部署在多台服务器上(一台服务器存储不了,或者计算能力不够或网络流量有限等), 因此3个硬性需求,你要的数据在哪台服务器上如何切片,某台服务器挂了怎么办, 业务扩大需要添加机器怎么办。 对于某台服务器挂了自然是添加备份(涉及到数据同步),和机器管理(如何在主备之间切换)。对于添加机器需要解决数据同步问题。对于非k-v形式(以mysql)为例子mysql 数据一般不会被切分在不同服务器上(也就是说每个服务器上的数据都是完整的)“分库分表是例外”。插入更新等修改数据 阅读全文
posted @ 2013-09-10 10:59 andy071001 阅读(199) 评论(0) 推荐(0)
python遍历两个列表,若长度不等,用None填充
摘要:zip经常会遇到截断问题,如:a = [1,2,3], b = [4,5,6,7],则zip(a,b) = [(1, 4), (2, 5), (3, 6)]可考虑使用map:map(lambda *row: list(row), a,b), 或者:map(None, a,b),得到:[(1, 4), (2, 5), (3, 6), (None, 7)] 阅读全文
posted @ 2013-09-03 11:48 andy071001 阅读(2745) 评论(2) 推荐(0)