07 2014 档案

摘要:系统# uname -a # 查看内核/操作系统/CPU信息# head -n 1 /etc/issue # 查看操作系统版本# cat /proc/cpuinfo # 查看CPU信息# hostname # 查看计算机名# ls... 阅读全文
posted @ 2014-07-31 16:56 曹守鑫 阅读(1275) 评论(0) 推荐(0)
摘要:#!/bin/bash#文件名:checkword.shword=$1grep "^$1$" /usr/share/dict/linux.words -qif [ $? -eq 0 ];then echo $word is a dictionary word;else e... 阅读全文
posted @ 2014-07-30 16:30 曹守鑫 阅读(616) 评论(0) 推荐(0)
摘要:$1,$2,... 特定第几个参数, $0 表示当前执行的进程名,script 本身的名字,或者在正则表达式中表示整行输出$#命令行或者是位置参数的个数$*所有的位置参数,被作为一个单词.$@与$*同义,但是每个参数都是一个独立的""引用字串,这就意味着参数被完整地传递$-传递给脚本的falg$!在... 阅读全文
posted @ 2014-07-30 16:12 曹守鑫 阅读(396) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2014-07-30 16:03 曹守鑫 阅读(139) 评论(0) 推荐(0)
摘要:upload_files=`find ${SOSO_BAIKE_LOCAL_UPLOAD_DIR} -type f -name '*.xml' -mmin +60`压缩命令:tar -czvPf result.tar.gz ${upload_files}解压命令:tar -xzvPf result.... 阅读全文
posted @ 2014-07-30 10:27 曹守鑫 阅读(249) 评论(0) 推荐(0)
摘要:# encoding:utf-8'''Created on 2014年7月14日@author: caoshouxin'''import osimport reimport os.pathfrom lxml import etreefrom sogou import offdb,docidimpor... 阅读全文
posted @ 2014-07-24 15:09 曹守鑫 阅读(342) 评论(0) 推荐(0)
摘要:http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.htmlpython中re.match()与re.search()的区别是前者从字符串开始位置匹配,后者是字符串中匹配在学习中发现某一部分的代码,用法和实验结果不同时,查找相关方法和代码的用... 阅读全文
posted @ 2014-07-24 12:57 曹守鑫 阅读(190) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2014-07-24 11:35 曹守鑫 阅读(117) 评论(0) 推荐(0)
摘要:1.除法运算 1.1 有一个操作数为负数 被除数到除数的距离整除除数,得到的数字加上符号便得到结果。 例如:-27/10 -27到10的距离为37,37/10 = 3,于是-3便是表达式的结果。 27/-10 ... 阅读全文
posted @ 2014-07-22 15:16 曹守鑫 阅读(891) 评论(0) 推荐(0)
摘要:在Java中,比较对象相等时用equals,equals是Object类的一个方法。在默认情况下,这与==的功能是相同的,也就是比较两个对象的引用是否相等。如果要比较对象的值相等,必须重写equals方法。如String的equals方法,就是比较两个串的内容是否一致。在python中也有类似比较,... 阅读全文
posted @ 2014-07-22 14:41 曹守鑫 阅读(577) 评论(0) 推荐(0)
摘要:要考虑到所有可能出现异常的情况,并对异常做处理操作,日志记录,不然程序会终止运行public void downFromCloud(String inputDir, String outputDir) { Configuration conf = new Configuration()... 阅读全文
posted @ 2014-07-22 11:49 曹守鑫 阅读(360) 评论(0) 推荐(0)
摘要:PathhdfsPath=newPath(args[0]);Configurationconf=newConfiguration();FileSystemfs=FileSystem.get(hdfsPath.toUri(),conf);CompressionCodecFactoryfactory=n... 阅读全文
posted @ 2014-07-22 11:04 曹守鑫 阅读(407) 评论(0) 推荐(0)
摘要:首先,我们需要使用linux下另外一个ps命令查找与进程相关的PID号:ps aux | grep program_filter_word&命令:让程序在后台运行 阅读全文
posted @ 2014-07-21 18:57 曹守鑫 阅读(783) 评论(0) 推荐(0)
摘要:当我们给予shell脚本执行的权限后,就可以测试程序了,假设shell脚本文件为hello.sh放在/root目录下。下面介绍几种在终端执行shell脚本的方法:1.切换到shell脚本所在的目录,执行:[root@localhost home]# cd /root/[root@localhost ... 阅读全文
posted @ 2014-07-18 10:37 曹守鑫 阅读(214) 评论(0) 推荐(0)
摘要:java -cp xxx.jar xxx.com.xxxxjava -jar xxx.jarhttp://www.cnblogs.com/lanxuezaipiao/p/3291641.html 阅读全文
posted @ 2014-07-17 15:14 曹守鑫 阅读(294) 评论(0) 推荐(0)
摘要:windows创建的文件是 \n\r结束的, 而linux,mac这种unix类系统是\n结束的。crontab条目举例这里有c r o n t a b文件条目的一些例子:30 21* * * /apps/bin/cleanup.sh上面的例子表示每晚的2 1 : 3 0运行/ a p p s / ... 阅读全文
posted @ 2014-07-17 14:32 曹守鑫 阅读(234) 评论(0) 推荐(0)
摘要:Hadoop操作HDFS命令如下所示:hadoop fs 查看Hadoop HDFS支持的所有命令 hadoop fs –ls 列出目录及文件信息 hadoop fs –lsr 循环列出目录、子目录及文件信息 hadoop fs –put test.txt /user/sunlightcs 将本地文... 阅读全文
posted @ 2014-07-14 16:59 曹守鑫 阅读(914) 评论(0) 推荐(0)
摘要:细节一:同时插入多行记录时,宜采用一条Insert语句细节二:批量插入记录时,建立采用Load Date Infile语句细节三:插入延迟,提高插入操作对系统的不利影响细节四:在插入大量数据之前,可以先将表锁定细节五:插入数据之前先对数据进行排序 阅读全文
posted @ 2014-07-12 09:43 曹守鑫 阅读(229) 评论(0) 推荐(0)
摘要:转载:http://techlife.blog.51cto.com/212583/223704我们在一些著名开源项目的版本库中,通常可以看到trunk, branches, tags等三个目录。由于SVN固有的特点,目录在SVN中并没有特别的意义,但是这三个目录却在大多数开源项目中存在,这是因为这三... 阅读全文
posted @ 2014-07-09 15:40 曹守鑫 阅读(239) 评论(0) 推荐(0)
摘要:基于搜狗语料库,建立的一个新闻分类系统;类别包括:classifierMap.put(0, "IT"); classifierMap.put(1, "体育"); classifierMap.put(2, "健康"); classifierMap.put(3, "军事"); class... 阅读全文
posted @ 2014-07-07 14:54 曹守鑫 阅读(815) 评论(0) 推荐(0)
摘要:转载:http://www.zhizhihu.com/html/y2010/2202.htmlK-Means算法用来聚类,用来判断哪些东西是一个比较相近的类型,而KNN算法是用来做归类的,也就是说,有一个样本空间里的样本分成很几个类型,然后,给定一个待分类的数据,通过计算接近自己最近的K个样本来判断... 阅读全文
posted @ 2014-07-07 14:43 曹守鑫 阅读(220) 评论(0) 推荐(0)
摘要:支持向量机(SVM)是90年代中期发展起来的基于统计学习理论的一种机器学习方法,通过寻求结构化风险最小来提高学习机泛化能力,实现经验风险和置信范围的最小化,从而达到在统计样本量较少的情况下,亦能获得良好统计规律的目的。通俗来讲,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器... 阅读全文
posted @ 2014-07-07 14:11 曹守鑫 阅读(1268) 评论(0) 推荐(0)
摘要:1 如何将高版本的jdk通过Eclipse编译为较低版本的2 当前SAE支持的jdk版本是1.6还有web项目war包不能是3.0版本及以上,必须编译为较低版本3 No context on this server matched or handled this request问题:有的是jdk版本... 阅读全文
posted @ 2014-07-05 13:05 曹守鑫 阅读(225) 评论(0) 推荐(0)
摘要:正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。匹配中文字符的正则表达式: [\u4e00-\u9fa5]评注:匹配中文还真是个头疼的事,有了这个表达式就好办了匹配双字节字符(包括汉字在内):[^\x00-\xff]评注:可以用来计算字符串的长度(一个... 阅读全文
posted @ 2014-07-04 10:10 曹守鑫 阅读(148) 评论(0) 推荐(0)
摘要:转载:http://blog.jobbole.com/70844/写在最前:本文主要描述在网站的不同的并发访问量级下,Mysql架构的演变可扩展性架构的可扩展性往往和并发是息息相关,没有并发的增长,也就没有必要做高可扩展性的架构,这里对可扩展性进行简单介绍一下,常用的扩展手段有以下两种Scale-u... 阅读全文
posted @ 2014-07-02 16:44 曹守鑫 阅读(122) 评论(0) 推荐(0)
摘要:通过在接受端调节窗口大小,来调节发送端的发送速率,每当接受到数据会发送一个ACK确认报文,并包含剩余窗口大小的信息转载:http://blog.jobbole.com/71925/TCP通过滑动窗口机制检测丢包,并在丢包发生时调整数据传输速率。滑动窗口机制利用数据接收端的接收窗口来控制数据流。接收窗... 阅读全文
posted @ 2014-07-02 16:08 曹守鑫 阅读(295) 评论(0) 推荐(0)
摘要:A*搜寻算法,俗称A星算法,作为启发式搜索算法中的一种,这是一种在图形平面上,有多个节点的路径,求出最低通过成本的算法。常用于游戏中的NPC的移动计算,或线上游戏的BOT的移动计算上。该算法像Dijkstra算法一样,可以找到一条最短路径;也像BFS一样,进行启发式的搜索。 A*算法最为核心的部分... 阅读全文
posted @ 2014-07-02 15:55 曹守鑫 阅读(1396) 评论(0) 推荐(0)
摘要:转载:http://blog.sina.com.cn/s/blog_5391f1100101ojzz.html1配置mysql的MYSQL_HOME和PATH2在HOME下面配置my.ini文件,内容如下[mysqld]loose-default-character-set = utf8 based... 阅读全文
posted @ 2014-07-02 11:14 曹守鑫 阅读(508) 评论(0) 推荐(0)

点击右上角即可分享
微信分享提示