2013年9月13日

摘要: 转自:http://www.ibm.com/developerworks/cn/linux/l-cn-screen/index.html你是不是经常需要 SSH 或者 telent 远程登录到 Linux 服务器?你是不是经常为一些长时间运行的任务而头疼,比如系统备份、ftp 传输等等。通常情况下我们都是为每一个这样的任务开一个远程终端窗口,因为他们执行的时间太长了。必须等待它执行完毕,在此期间可不能关掉窗口或者断开连接,否则这个任务就会被杀掉,一切半途而废了。元凶:SIGHUP 信号让我们来看看为什么关掉窗口/断开连接会使得正在运行的程序死掉。在Linux/Unix中,有这样几个概念:进程组 阅读全文
posted @ 2013-09-13 10:02 i活着 阅读(290) 评论(0) 推荐(0) 编辑
摘要: Decision Tree:Analysis大家有没有玩过猜猜看(Twenty Questions)的游戏?我在心里想一件物体,你可以用一些问题来确定我心里想的这个物体;如是不是植物?是否会飞?能游泳不?当你问完这些问题后,你就能得到这个物体的特征,然后猜出我心里想象的那个物体,看是否正确。这个游戏很简单,但是蕴含的思想却是质朴的。每个问题都会将范围减少,直到特征显现,内蕴的思想就是Decision Tree算法。判定树(Decision Tree)算法是机器学习中很重要的一种算法,有文章声称该算法在ML学习中最为常用的算法,你不需要明白高深的知识就能明白算法的运行原理。Decision Tr 阅读全文
posted @ 2013-09-13 10:00 i活着 阅读(5765) 评论(0) 推荐(1) 编辑

2013年8月19日

摘要: 一、逻辑回归1) Classification(分类)分类问题举例:邮件:垃圾邮件/非垃圾邮件?在线交易:是否欺诈(是/否)?肿瘤:恶性/良性?以上问题可以称之为二分类问题,可以用如下形式定义:其中0称之为负例,1称之为正例。对于多分类问题,可以如下定义因变量y:y∈{0,1,2,3,...,n}如果分类器用的是回归模型,并且已经训练好了一个模型,可以设置一个阈值:如果hθ(x)≥0.5,则预测y=1,既y属于正例;如果hθ(x)=,如下图中的S所示:我们当然不可能要求损失下降的长度为S,这里只需要L1−L2大于某个指定的关于S的比例即可,我们这里设置该比例为“容忍度” B(B为0到1之间的值 阅读全文
posted @ 2013-08-19 19:06 i活着 阅读(4759) 评论(0) 推荐(0) 编辑

2013年8月13日

摘要: 在分布式系统中,我们经常遇到多数据副本保持一致的问题,在我们所能找到的资料中该问题讲的很笼统,模模糊糊的,把多个问题或分类糅合在一起,难以理解。在思考和翻阅资料后,通俗地把一致性的问题可分解为2个问题:1、任何一次修改保证数据一致性。2、多次数据修改的一致性。在弱一致性的算法,不要求每次修改的内容在修改后多副本的内容是一致的,对问题1的解决比较宽松,更多解决问题2,该类算法追求每次修改的高度并发性,减少多副本之间修改的关联性,以获得更好的并发性能。例如最终一致性,无所谓每次用户修改后的多副本的一致性及格过,只要求在单调的时间方向上,数据最终保持一致,如此获得了修改极大的并发性能。在强一致性的算 阅读全文
posted @ 2013-08-13 09:25 i活着 阅读(760) 评论(0) 推荐(0) 编辑
摘要: 编者按:由InfoQ主办的全球架构师峰会将于2012年8月10日-12日在深圳举行,为了更好地诠释架构的意义、方法和实践,InfoQ中文站近期会集中发布一批与架构相关的文章,本篇即为其中之一。InfoQ也欢迎读者亲身参与到本次全球架构师峰会中,与来自国内外的顶尖架构师进行面对面的交流。报名参会请点击这里。本文首发于 Computer杂志,由InfoQ和IEEE呈现给您。CAP理论断言任何基于网络的数据共享系统,最多只能满足数据一致性、可用性、分区容忍性三要素中的两个要素。但是通过显式处理分区情形,系统设计师可以做到优化数据一致性和可用性,进而取得三者之间的平衡。自打引入CAP理论的十几年里,设 阅读全文
posted @ 2013-08-13 09:16 i活着 阅读(263) 评论(0) 推荐(0) 编辑
摘要: ACID vs BASE vs CAPCAP:首先Eric Brewer, a professor at the University of California, Berkeley, and cofounder and chief scientist at Inktomi提出了CAP理论:CAP: Consistency, Availability and Tolerance of network Partition。并证明了CAP最多只能同时满足两个。He presented the CAP theorem, which states that of three properties of 阅读全文
posted @ 2013-08-13 09:15 i活着 阅读(305) 评论(0) 推荐(0) 编辑
摘要: 如果简单地比较Redis与Memcached的区别,大多数都会得到以下观点:1 Redis不仅仅支持简单的k/v类型的数据,同时还提供list,set,hash等数据结构的存储。2 Redis支持数据的备份,即master-slave模式的数据备份。3 Redis支持数据的持久化,可以将内存中的数据保持在磁盘中,重启的时候可以再次加载进行使用。在Redis中,并不是所有的数据都一直存储在内存中的。这是和Memcached相比一个最大的区别(我个人是这么认为的)。Redis只会缓存所有的key的信息,如果Redis发现内存的使用量超过了某一个阀值,将触发swap的操作,Redis根据“swapp 阅读全文
posted @ 2013-08-13 09:13 i活着 阅读(328) 评论(0) 推荐(0) 编辑
摘要: 原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处、作者信息和本声明。否则将追究法律责任。http://linuxnx.blog.51cto.com/6676498/1195379LVS负载均衡原理和算法详解 Internet的快速增长使多媒体网络服务器面对的访问数量快速增加,服务器需要具备提供大量并发访问服务的能力,因此对于大负载的服务器来讲,CPU、I/O处理能力很快会成为瓶颈。由于单台服务器的性能总是有限的,简单的提高硬件性能并不能真正解决这个问题。为此,必须采用多服务器和负载均衡技术才能满足大量并发访问的需要。Linux 虚拟服务器(Linux Virtual Servers 阅读全文
posted @ 2013-08-13 09:12 i活着 阅读(372) 评论(0) 推荐(0) 编辑

2013年4月11日

摘要: 转自:http://blog.csdn.net/duanruibupt/article/details/6869431转自:http://blog.163.com/lz_666888/blog/static/1147857262009914112922803/什么是Catalan数说到Catalan数,就不得不提及Catalan序列,Catalan序列是一个整数序列,其通项公式是我们从中取出的就 叫做第n个Catalan数,前几个Catalan数是:1, 1, 2, 5, 14, 42, 132, 429, 1430, 4862, 16796, 58786, 208012, 742900, 2 阅读全文
posted @ 2013-04-11 19:27 i活着 阅读(377) 评论(0) 推荐(0) 编辑

2013年4月2日

摘要: 本文转自:http://database.ctocio.com.cn/analysis/357/9390857.shtml众所周知,索引可以在很大程度上提高数据库的查询效率。但是如果索引使用不当,如在不恰当的地方采用了不恰当的索引,那么反而会起到适得其反的效果。如下图所示的表,该采用什么索引呢?笔者借这个机会,跟大家讨论一下位图索引的使用时机以及注意事项。 一、 B树索引的缺陷。 在实际工作中,B树索引是Oracle数据库中最常用的一种索引。如在使用Create Index语句创建索引的时候,默认采用的就是B树索引。在B树索引中,是通过在索引中保存排序过的索引列以及其对应的Rowid列的值.. 阅读全文
posted @ 2013-04-02 16:43 i活着 阅读(430) 评论(0) 推荐(0) 编辑

导航