摘要:一、逻辑回归1) Classification(分类)分类问题举例:邮件:垃圾邮件/非垃圾邮件?在线交易:是否欺诈(是/否)?肿瘤:恶性/良性?以上问题可以称之为二分类问题,可以用如下形式定义:其中0称之为负例,1称之为正例。对于多分类问题,可以如下定义因变量y:y∈{0,1,2,3,...,n}如果分类器用的是回归模型,并且已经训练好了一个模型,可以设置一个阈值:如果hθ(x)≥0.5,则预测y=1,既y属于正例;如果hθ(x)=,如下图中的S所示:我们当然不可能要求损失下降的长度为S,这里只需要L1−L2大于某个指定的关于S的比例即可,我们这里设置该比例为“容忍度” B(B为0到1之间的值
阅读全文
摘要:在分布式系统中,我们经常遇到多数据副本保持一致的问题,在我们所能找到的资料中该问题讲的很笼统,模模糊糊的,把多个问题或分类糅合在一起,难以理解。在思考和翻阅资料后,通俗地把一致性的问题可分解为2个问题:1、任何一次修改保证数据一致性。2、多次数据修改的一致性。在弱一致性的算法,不要求每次修改的内容在修改后多副本的内容是一致的,对问题1的解决比较宽松,更多解决问题2,该类算法追求每次修改的高度并发性,减少多副本之间修改的关联性,以获得更好的并发性能。例如最终一致性,无所谓每次用户修改后的多副本的一致性及格过,只要求在单调的时间方向上,数据最终保持一致,如此获得了修改极大的并发性能。在强一致性的算
阅读全文
摘要:编者按:由InfoQ主办的全球架构师峰会将于2012年8月10日-12日在深圳举行,为了更好地诠释架构的意义、方法和实践,InfoQ中文站近期会集中发布一批与架构相关的文章,本篇即为其中之一。InfoQ也欢迎读者亲身参与到本次全球架构师峰会中,与来自国内外的顶尖架构师进行面对面的交流。报名参会请点击这里。本文首发于 Computer杂志,由InfoQ和IEEE呈现给您。CAP理论断言任何基于网络的数据共享系统,最多只能满足数据一致性、可用性、分区容忍性三要素中的两个要素。但是通过显式处理分区情形,系统设计师可以做到优化数据一致性和可用性,进而取得三者之间的平衡。自打引入CAP理论的十几年里,设
阅读全文
摘要:ACID vs BASE vs CAPCAP:首先Eric Brewer, a professor at the University of California, Berkeley, and cofounder and chief scientist at Inktomi提出了CAP理论:CAP: Consistency, Availability and Tolerance of network Partition。并证明了CAP最多只能同时满足两个。He presented the CAP theorem, which states that of three properties of
阅读全文
摘要:如果简单地比较Redis与Memcached的区别,大多数都会得到以下观点:1 Redis不仅仅支持简单的k/v类型的数据,同时还提供list,set,hash等数据结构的存储。2 Redis支持数据的备份,即master-slave模式的数据备份。3 Redis支持数据的持久化,可以将内存中的数据保持在磁盘中,重启的时候可以再次加载进行使用。在Redis中,并不是所有的数据都一直存储在内存中的。这是和Memcached相比一个最大的区别(我个人是这么认为的)。Redis只会缓存所有的key的信息,如果Redis发现内存的使用量超过了某一个阀值,将触发swap的操作,Redis根据“swapp
阅读全文
摘要:原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处、作者信息和本声明。否则将追究法律责任。http://linuxnx.blog.51cto.com/6676498/1195379LVS负载均衡原理和算法详解 Internet的快速增长使多媒体网络服务器面对的访问数量快速增加,服务器需要具备提供大量并发访问服务的能力,因此对于大负载的服务器来讲,CPU、I/O处理能力很快会成为瓶颈。由于单台服务器的性能总是有限的,简单的提高硬件性能并不能真正解决这个问题。为此,必须采用多服务器和负载均衡技术才能满足大量并发访问的需要。Linux 虚拟服务器(Linux Virtual Servers
阅读全文