10 2013 档案
【转】如何利用多核CPU来加速你的Linux命令 — awk, sed, bzip2, grep, wc等
摘要:如何利用多核CPU来加速你的Linux命令 — awk, sed, bzip2, grep, wc等你是否曾经有过要计算一个非常大的数据(几百GB)的需求?或在里面搜索,或其它操作——一些无法并行的操作。数据专家们,我是在对你们说。你可能有一个4核或更多核的CPU,但我们合适的工具,例如grep,bzip2,wc,awk,sed等等,都是单线程的,只能使用一个CPU内核。借用卡通人物Cartman的话,“如何我能使用这些内核”?要想让Linux命令使用所有的CPU内核,我们需要用到GNU Parallel命令,它让我们所有的CPU内核在单机内做神奇的map-reduce操作,当然,这还要借助很 阅读全文
posted @ 2013-10-30 01:02 andy071001 阅读(309) 评论(0) 推荐(0)
【转】Ubuntu下出现Mysql error(2002)的解决方法
摘要:过了一阵子后,为了写分布式作业,重新使用Mysql时,发现虽然启动成功了,但是连接的时候去出现如下错误ERROR 2002 (HY000): Can't connect to local MySQL server through socket '/var/run/mysqld/mysqld.sock' (2)根据提示是/var/run/mysqld/mysqld.sock文件不存在。为什么会这样呢? 在网上找了找答案,发现每个人说的都不一样,而且mysql.server文件中根本就不存在创建/var/run/mysqld/mysqld.sock文件的语句。1.解决办法: 阅读全文
posted @ 2013-10-28 23:34 andy071001 阅读(428) 评论(0) 推荐(0)
C++ main()函数及其参数
摘要:很多人学习了很久c,c++对其中的argc,argv都很困惑,教科书上都没有好好说明,现在的教育啊!!!悲哀main(int argc,char**argv) argv为指针的指针 argc为整数 char**argv or: char*argv[ ] or: char argv[ ][ ]main()括号内是固定的写法。下面给出一个例子来理解这两个参数的用法:假设程序的名称为prog,1.当只输入prog,则由操作系统传来的参数为: argc=1,表示只有一程序名称。 argc只有一个元素,argv[0]指向输入的程序路径及名称:./prog2.当输入prog para_1,有一个参数,则由 阅读全文
posted @ 2013-10-28 15:56 andy071001 阅读(273) 评论(0) 推荐(0)
standford情感分析代码开源地址
摘要:http://nlp.stanford.edu/sentiment/code.html 阅读全文
posted @ 2013-10-28 13:50 andy071001 阅读(592) 评论(0) 推荐(0)
GDB调试精粹及使用实例
摘要:一:列文件清单 1. List (gdb) list line1,line2 二:执行程序 要想运行准备调试的程序,可使用run命令,在它后面可以跟随发给该程序的任何参数,包括标准输入和标准输出说明符()和外壳通配符(*、?、[、])在内。 如果你使用不带参数的run命令,gdb就再次使用你给予前一条run命令的参数,这是很有用的。 利用set args 命令就可以修改发送给程序的参数,而使用show args 命令就可以查看其缺省参数的列表。 (gdb)set args –b –x (gdb) show args backtrace命令为堆栈提供向后跟踪功能。 Backtrace 命令产生一 阅读全文
posted @ 2013-10-24 11:57 andy071001 阅读(158) 评论(0) 推荐(0)
学会用core dump调试程序错误
摘要:最来在项目中遇到大型程序出现SIGSEGV ,一直不知道用core dump工具来调试程序,花了近一周的时间,才定位问题,老大很生气,后果很严重,呵呵,事后仔细学习了这块的知识,了解一点core dump的知识。 在使用半导体作为内存的材料前,人类是利用线圈当作内存的材料(发明者为王安),线圈就叫作core ,用线圈做的内存就叫作“core memory”。(线圈的单词应该是coil,呵呵)如今,半导体工业澎勃发展,已经没有人用线圈当内存了,不过,在许多情况下,人们还是把内存叫作“core”。 所以注意了:这里的core不是核心,而是内存。不过结合实际来看,好像也有点“内核所占内存”的意思。 阅读全文
posted @ 2013-10-24 11:33 andy071001 阅读(201) 评论(0) 推荐(0)
LNMP一键安装包-CentOS/Ubuntu/Debian自动安装Nginx,MySQL,PHP
摘要:适用环境:系统支持:CentOS、Ubuntu、Debian内存要求:≥128M安装了什么:1、Nginx-1.2.12、MySQL 5.5.253、PHP 5.2.17或PHP 5.3.134、phpmyadmin 3.5.15、ZendOptimizer 3.3.9(可选,支持PHP 5.2.17)或ZendGuardLoader(可选,支持PHP 5.3.x)6、xcache-2.0.0(可选)7、pure-ftpd-1.0.36(可选)安全设置1、使用php-fpm chroot功能使网站与系统完全隔离,起到保护系统及其它虚拟主机的作用(仅支持php-5.3.x)2、修复php-5.2 阅读全文
posted @ 2013-10-22 17:31 andy071001 阅读(394) 评论(0) 推荐(0)
python+OpenCV进行人脸检测【转】
摘要:OpenCV的人脸检测功能在一般场合还是不错的。而ubuntu正好提供了python-opencv这个包,用它可以方便地实现人脸检测的代码。写代码之前应该先安装python-opencv:$ sudo apt-get install python-opencv具体原理就不多说了,可以参考一下这篇文章。直接上源代码。#!/usr/bin/python# -*- coding: UTF-8 -*-# face_detect.py# Face Detection using OpenCV. Based on sample code from:# http://python.pastebin.com. 阅读全文
posted @ 2013-10-22 11:37 andy071001 阅读(897) 评论(0) 推荐(0)
python得到最长递增子串长度及起始位置【转】
摘要:def incSeq(seq): start = 0 for i in xrange(1, len(seq)): if seq[i] y[1] else y, incSeq(seq))得到最长递增子串长度及起始位置,时间复杂度O(n). 阅读全文
posted @ 2013-10-22 10:52 andy071001 阅读(266) 评论(0) 推荐(0)
采用scp命令在Linux系统之间copy文件
摘要:不同的Linux之间copy文件常用有3种方法,第一种就是ftp,也就是其中一台Linux安装ftp Server,这样可以另外一台使用ftp的client程序来进行文件的copy。第二种方法就是采用samba服务,类似Windows文件copy 的方式来操作,比较简洁方便,第三种就是利用scp命令来进行文件复制。 scp是有Security的文件copy,基于ssh登录。操作起来比较方便,比如要把当前一个文件copy到远程另外一台主机上,可以如下命令。scp/home/daisy/full.tar.gzroot@172.19.2.75:/home/root然后会提示你输入另外那台172.19 阅读全文
posted @ 2013-10-12 19:55 andy071001 阅读(176) 评论(0) 推荐(0)
汉字编码标准
摘要:在汉字计算机编码标准中,目前最大的汉字编码是台湾的国家标准CNS11643,目前(4.0)共收录可考证之正简、日、韩语汉字共76,067个,在户政系统等官方机构普遍使用。台湾及港澳地区民间通用的大五码收录繁体汉字13053个。GB 18030是中华人民共和国现时最新的内码字集,总共收录70244个汉字;GBK收录简体、繁体及日语、韩语汉字20912个,而早期的GB 2312收录简体汉字6763个。而Unicode的中日韩统一表意文字基本字集则收录汉字20902个,另有四个扩展区,总数亦高达七万多字。汉字编码汉字的基本字体:篆、隶、楷、行、草。本图还包括了书法和印刷的美术字体,前者如欧体、颜体, 阅读全文
posted @ 2013-10-12 14:24 andy071001 阅读(1212) 评论(0) 推荐(0)
[转] 一句shell命令搞定代码行数统计
摘要:今天面试时,突然被面试官问到怎样用shell命令搞定某个文件夹下java代码行数的统计。想了一下,基本思路就是找到这个文件夹下面的所有java文件,然后每个文件统计一下代码,外层套个for循环,叠加一下结果,就拿到想要的结果了。不过显然面试官希望我用一句shell搞定,当场晕菜了,没搞定。回来想了一下,其实确实不是啥太难的问题。最粗略版Shell代码 find.-name"*.java"|xargswc-l|grep"total"|awk'{print$1}'find.-name"*.java"|xargscat|wc 阅读全文
posted @ 2013-10-09 11:54 andy071001 阅读(305) 评论(0) 推荐(0)
wc递归统计代码行数
摘要:find /path -name '*.cpp' |xargs wc -l 阅读全文
posted @ 2013-10-09 10:34 andy071001 阅读(476) 评论(0) 推荐(0)