随笔档案「2013年9月」 - andy071001

摘要：头部插入：sed -i '1i\Insert this line' file.txt尾部插入：echo "hehe" >> tmp.txt 阅读全文

posted @ 2013-09-22 15:30 andy071001 阅读(458) 评论(0) 推荐(1)

摘要：删除文件中所有的空行:g/^\s*$/d去掉所有的行尾空格：:%s/\s\+$//整个文件特定字符串的替换:%s/old_word/new_word/g删除从当前行开始到最后一行的所有内容:.,$d去掉所有的“//”注释：:%s!\s*//.*!!（首先可以注意到，这儿分隔符改用了“!”，原因是在模式或字符串部分使用了“/”字符，不换用其他分隔符的话就得在每次使用“/”字符本身时写成“\/”，上面的命令得写成“:%s/\s*\/\/.*//”，可读性较低。命令本身倒是相当简单，用过正则表达式的人估计都知道“.”匹配表示除换行符之外的任何字符吧。）去掉所有的“/* */”注释：:%s!\s*/ 阅读全文

posted @ 2013-09-21 20:12 andy071001 阅读(8996) 评论(1) 推荐(0)

监测正在运行的程序运行结束之后执行脚本

摘要：#!/bin/bashwhile truedocn=`ps aux | grep canopy.py | grep -v grep | wc -l`if [ $cn -lt 1 ];thenpython get_k_center.pypython kmeans.pybreakfisleep 5mdone是遇到了实际的情况，一个聚类脚本跑了两个小时没跑完。。。无奈之举阅读全文

posted @ 2013-09-18 21:36 andy071001 阅读(180) 评论(0) 推荐(0)

temp

摘要：（1）总体思路：根据Canopy算法产生的Canopies代替初始的K个聚类中心点，由于已经将所有数据点进行Canopies有覆盖划分，在计算数据离哪个k-center最近时，不必计算其到所有k-centers的距离，只计算和它在同一个Canopy下的k-centers。这样可以提高效率。阅读全文

posted @ 2013-09-16 19:21 andy071001 阅读(128) 评论(0) 推荐(0)

好博客

摘要：发现很多好博客，奈何没有很好的rss阅读器，于是就用一个最简单的办法，发现一个就记在这里吧：貌似不错，多看看c++的内容http://blog.csdn.net/Solstice仔细看这里面的boost学习http://blog.csdn.net/u011676589/http://www.aqee.net/archives/http://sobuhu.com/index.htmlhttp://www.cnblogs.com/haippy/http://www.csie.ntnu.edu.tw/~u91029/index.html在线算法学习http://sjjg.js.zwu.edu.cn/ 阅读全文

posted @ 2013-09-16 16:16 andy071001 阅读(231) 评论(0) 推荐(0)

Python Unicode与中文处理(转)

摘要：Python Unicode与中文处理 python中的unicode是让人很困惑、比较难以理解的问题，本文力求彻底解决这些问题；1.unicode、gbk、gb2312、utf-8的关系；http://www.pythonclub.org/python-basic/encode-detail 这篇文章写的比较好，utf-8是unicode的一种实现方式，unicode、gbk、gb2312是编码字符集；2.python中的中文编码问题；2.1 .py文件中的编码 Python 默认脚本文件都是 ANSCII 编码的，当文件中有非 ANSCII 编码范围内的字符的时候就要使用"编码阅读全文

posted @ 2013-09-13 11:21 andy071001 阅读(1262) 评论(0) 推荐(0)

leetcode Palindrome Partitioning

摘要：class Solution {public: bool is_pal(string s, int start, int end) { while (start > part(string s, int start, int end) { vector> r; for (int st = end; st >= 0; st--) { vector> ret; if (is_pal(s, st, end)) { s... 阅读全文

posted @ 2013-09-13 00:36 andy071001 阅读(139) 评论(0) 推荐(0)

awk批量处理文件，对第一列去重并，累加第二列数值，打印一二列存入新文件

摘要：awk '{if(NR>1)a[$1]+=$2}END{for(i in a)printf "%s\t %d\n",i,a[i]}' querylog* > total.txt 阅读全文

posted @ 2013-09-12 20:59 andy071001 阅读(880) 评论(0) 推荐(0)

linux批量解压和批量压缩

摘要：ls *.tar.gz | xargs -n1 tar xzvf //批量解压ls | awk '{ print "tar zcvf "$0".tar.gz " $0|"/bin/bash" }' //批量打包ls | awk '{ print "tar zcvf "$0".tar.gz " $0 }'|/bin/bash //批量打包gzip -d *.gz 阅读全文

posted @ 2013-09-12 17:47 andy071001 阅读(1778) 评论(0) 推荐(0)

【转】 C++ 简单的 Tcp 实现[socket] 客户端与客户端通信

摘要：// 服务器端代码// Server.cpp : Defines the entry point for the console application.//#include "stdafx.h"#include "winsock2.h"#pragma comment(lib, "ws2_32.lib")#include using namespace std;int _tmain(int argc, char* argv[]){ const int BUF_SIZE = 64; WSADATA wsd; //WSADATA变量 SO 阅读全文

posted @ 2013-09-11 11:40 andy071001 阅读(417) 评论(0) 推荐(0)

【转】纪录一下最近对分布式的感悟

摘要：纪录一下最近对分布式的感悟分布式存储，主要由2部分组成，1、网络对数据切分。 2、存储。对于网络对数据切分需要解决哪些问题？解决数据部署在多台服务器上（一台服务器存储不了，或者计算能力不够或网络流量有限等），因此3个硬性需求，你要的数据在哪台服务器上如何切片，某台服务器挂了怎么办，业务扩大需要添加机器怎么办。对于某台服务器挂了自然是添加备份（涉及到数据同步），和机器管理（如何在主备之间切换）。对于添加机器需要解决数据同步问题。对于非k-v形式（以mysql）为例子mysql 数据一般不会被切分在不同服务器上（也就是说每个服务器上的数据都是完整的）“分库分表是例外”。插入更新等修改数据阅读全文

posted @ 2013-09-10 10:59 andy071001 阅读(199) 评论(0) 推荐(0)

python遍历两个列表，若长度不等，用None填充

摘要：zip经常会遇到截断问题，如：a = [1,2,3], b = [4,5,6,7],则zip(a,b) = [(1, 4), (2, 5), (3, 6)]可考虑使用map：map(lambda *row: list(row), a,b), 或者：map(None, a,b)，得到：[(1, 4), (2, 5), (3, 6), (None, 7)] 阅读全文

posted @ 2013-09-03 11:48 andy071001 阅读(2745) 评论(2) 推荐(0)

公告