ajian005

2011年11月16日

摘要： [说明：之前的那篇<<分布式系统领域经典论文翻译集>>颇显庞杂，涵盖内容五花八门，也有人提出不知道从哪开始。所以呢，就有了这一篇，主要以组成Hadoop生态系统的各组件为线索，串起了其中相对重要的那些论文，同时基本上也是按照从前往后的顺序由浅入深的，其中也包含了翻译集中所未出现的一些。这些文章中，标为(译)的那些是本人翻译的，标为(zz)的那些是其他人的译文或原创，剩余未标明的部分基本上是英文原文，可能会择其要者而译之。]1.HDFSGFS：google文件系统(译)Case Study GFS: Evolution on Fast-forward(译)The Hado 阅读全文

posted @ 2011-11-16 22:39 ajian005 阅读(228) 评论(0) 推荐(0)

[置顶] 分布式系统领域经典论文翻译集

摘要：分布式领域论文译序sql&nosql年代记SMAQ：海量数据的存储计算和查询一．google论文系列1. google系列论文译序2. The anatomy of a large-scale hypertextual Web search engine3. 面向星球的网络搜索：google集群架构4. GFS：google文件系统5. mapreduce: Simplied Data Processing on Large Clusters6. bigtable: A Distributed Storage System for Structured Data7. Chubby: T 阅读全文

posted @ 2011-11-16 21:27 ajian005 阅读(350) 评论(0) 推荐(0)

JVM内存状况查看方法和分析工具

摘要： Java本身提供了多种丰富的方法和工具来帮助开发人员查看和分析GC及JVM内存的状况，同时开源界和商业界也有一些工具可用于查看、分析GC及JVM内存的状况。通过这些分析，可以排查程序中内存泄露的问题及调优程序的性能。下面介绍几种常用的免费工具，其中知名的有JProfiler 等。 1. 输出GC日志输出GC日志对于跟踪分析GC的状况来说，无疑是最直接地分析内存回收状况的方法，只是GC日志输出后需要人为地进行分析，以判断GC的状况。 JVM支持将日志输出到控制台或指定的文件中，方法有如下几种。输出到控制台在JVM的启动参数中加入-XX:+PrintGC -XX:+PrintGCD... 阅读全文

posted @ 2011-11-16 10:52 ajian005 阅读(315) 评论(0) 推荐(0)

2011年11月14日

一种可以避免数据迁移的分库分表scale-out扩容方式

摘要：种可以避免数据迁移的分库分表scale-out扩容方式目前绝大多数应用采取的两种分库分表规则mod方式dayofweek系列日期方式（所有星期1的数据在一个库/表,或所有?月份的数据在一个库表）这两种方式有个本质的特点，就是离散性加周期性。例如以一个表的主键对3取余数的方式分库或分表：那么随着数据量的增大，每个表或库的数据量都是各自增长。当一个表或库的数据量增长到了一个极限，要加库或加表的时候，介于这种分库分表算法的离散性，必需要做数据迁移才能完成。例如从3个扩展到5个的时候：需要将原先以mod3分类的数据，重新以mod5分类，不可避免的带来数据迁移。每个表的数据都要被重新分配到多个新的表相似阅读全文

posted @ 2011-11-14 18:11 ajian005 阅读(203) 评论(0) 推荐(0)

2011年11月7日

几种负载均衡算法

摘要：几种负载均衡算法本地流量管理技术主要有一下几种负载均衡算法：静态负载均衡算法包括：轮询，比率，优先权动态负载均衡算法包括: 最少连接数,最快响应速度，观察方法，预测法，动态性能分配，动态服务器补充，服务质量，服务类型，规则模式。静态负载均衡算法◆轮询（Round Robin）：顺序循环将请求一次顺序循环地连接每个服务器。当其中某个服务器发生第二到第7 层的故障，BIG-IP 就把其从顺序循环队列中拿出，不参加下一次的轮询，直到其恢复正常。◆比率（Ratio）：给每个服务器分配一个加权值为比例，根椐这个比例，把用户的请求分配到每个服务器。当其中某个服务器发生第二到第7 层的故障，BIG-IP 就阅读全文

posted @ 2011-11-07 15:47 ajian005 阅读(172) 评论(0) 推荐(0)

常用缓存算法简介

摘要：没有人能说清哪种缓存算法优于其他的缓存算法。（以下的几种缓存算法，有的我也理解不好，如果感兴趣，你可以Google一下）Least Frequently Used（LFU）：大家好，我是 LFU，我会计算为每个缓存对象计算他们被使用的频率。我会把最不常用的缓存对象踢走。Least Recently User（LRU）：我是LRU缓存算法，我把最近最少使用的缓存对象给踢走。我总是需要去了解在什么时候，用了哪个缓存对象。如果有人想要了解我为什么总能把最近最少使用的对象踢掉，是非常困难的。浏览器就是使用了我（LRU）作为缓存算法。新的对象会被放在缓存的顶部，当缓存达到了容量极限，我会把底部的对象踢走阅读全文

posted @ 2011-11-07 15:44 ajian005 阅读(159) 评论(0) 推荐(0)

2011年11月3日

Web容量规划的艺术-要点

摘要： twitter上@fire9给我推荐了这本书，花了一些时间把这本书看了两遍，总结性的点评语就是：“书的质量非常的高，一方面这本书中的内容来源于 flickr.com实际的经验，另一方面是作者采用了很多生活中的例子来讲解一些复杂的技术，让人很快就明白了。”下面就具体来看看这本书传达的容量规划该怎么做。容量规划主要分为四个步骤来进行：1、设定容量的目标：例如网站需要在3秒内响应，达到99.99%的可用性。2、收集对应的指标并找出面临的限制这个步骤需要做的为：测量和记录服务器的主要功能，例如数据库的主要功能为插入数据、删除数据、更新数据和获取数据，在这里书中举了个例子是没有油量表的车；测量和记录基础阅读全文

posted @ 2011-11-03 19:24 ajian005 阅读(342) 评论(0) 推荐(0)

java性能调优的基本思路

摘要： java性能调优的基本知识 http://wenku.baidu.com/view/0b5e5b08581b6bd97f19eab3.htmlWeb应用影响性能的集中体现在:网络、CPU、内存、IO、数据库、缓存应用系统的性能测试通常有如下过程： 1) 分析性能需求：了解系统性能需求，建立性能测试数据模型，分析性能需求，确定合理性能目标； 2) 制定性能测试计划：规划性能测试所需的测试环境、测试程序，测试的人员组织，测试日程等； 3) 设计场景：设计性能测试的测试案例； 4) 根据场景编写程序、编写脚本、修改应用系统等； 5) 执行性能测试：建立测试环境、执行测试案例，记录测试时的系统的各个阅读全文

posted @ 2011-11-03 19:22 ajian005 阅读(327) 评论(0) 推荐(0)

2011年11月2日

大型网站架构演变和知识体系

摘要：之前也有一些介绍大型网站架构演变的文章，例如LiveJournal的、ebay的，都是非常值得参考的，不过感觉他们讲的更多的是每次演变的结果，而没有很详细的讲为什么需要做这样的演变，再加上近来感觉有不少同学都很难明白为什么一个网站需要那么复杂的技术，于是有了写这篇文章的想法，在这篇文章中将阐述一个普通的网站发展成大型网站过程中的一种较为典型的架构演变历程和所需掌握的知识体系，希望能给想从事互联网行业的同学一点初步的概念，:)，文中的不对之处也请各位多给点建议，让本文真正起到抛砖引玉的效果。架构演变第一步：物理分离webserver和数据库最开始，由于某些想法，于是在互联网上搭建了一个网站，这个阅读全文

posted @ 2011-11-02 18:11 ajian005 阅读(134) 评论(0) 推荐(0)

常用技术面试题

摘要： java面试题 http://blog.csdn.net/uiop_7890_7890 阅读全文

posted @ 2011-11-02 18:09 ajian005 阅读(147) 评论(0) 推荐(0)

公告