随笔分类 -  架构设计

分布式计算开源框架Hadoop介绍
摘要:── 分布式计算开源框架Hadoop入门实践(一)在SIP项目设计的过程中,对于它庞大的日志在开始时就考虑使用任务分解的多线程处理模式来分析统计,在我从前写的文章《Tiger Concurrent Practice --日志分析并行分解设计与实现》中有所提到。但是由于统计的内容暂时还是十分简单,所以就采用Memcache作为计数器,结合MySQL就完成了访问控制以及统计的工作。然而未来,对于海量日... 阅读全文

posted @ 2010-09-17 08:03 ivanjack 阅读(701) 评论(2) 推荐(0)

大型网站架构:Flickr网站体系结构分析(转)
摘要:Flickr是我个人喜爱的网站之一,也是互联网上最主要的图片共享网站。Flickr网站后台有许多非常复杂的问题需要处理,它们需要处理海量的新增的内容,管理大批的用户,不断保持新的功能特征,与此同时,还要提供一流的性能。它们是如何做到的呢? Flickr网站的网址是:http://www.flickr.com/ 参考文献 Flickr and PHP(一个早期的文档) LAMP容量规划 Flick... 阅读全文

posted @ 2010-09-13 15:33 ivanjack 阅读(715) 评论(0) 推荐(0)

网站架构相关PPT,文章收集
摘要:1、amazonAmazon的分布式key-value存储系统(dynamo)的论文2、ebay(我对于eBay这几个PPT的一些看法和评价:http://www.blogjava.net/BlueDavy/archive/2009/07/24/288055.html)ebay架构演变历程(The eBay Architecture)ebay架构原则(eBay architecture princ... 阅读全文

posted @ 2010-09-10 22:08 ivanjack 阅读(269) 评论(0) 推荐(0)

应用 memcached 提升站点性能
摘要:简介memcached 常被用来加速应用程序的处理,在这里,我们将着重于介绍将它部署于应用程序和环境中的最佳实践。这包括应该存储或不应存储哪些、如何处理数据的灵活分布以及如何调节用来更新 memcached 和所存储数据的方法。我们还将介绍对高可用性的解决方案的支持,比如 IBM WebSphere® eXtreme Scale。所有的应用程序,特别是很多 web 应用程序都需要优化它们访... 阅读全文

posted @ 2010-09-09 18:35 ivanjack 阅读(462) 评论(0) 推荐(0)

大型网站架构演变之路
摘要:这篇文章中将阐述一个普通的网站发展成大型网站过程中的一种较为典型的架构演变历程和所需掌握的知识体系,希望能给想从事互联网行业的同学一点初步的概念,文中的不对之处也请各位多给点建议,让本文真正起到抛砖引玉的效果。架构演变第一步:物理分离webserver和数据库最开始,由于某些想法,于是在互联网上搭建了一个网站,这个时候甚至有可能主机都是租借的,但由于这篇文章我们只关注架构的演变历程,因此就假设这个... 阅读全文

posted @ 2010-09-09 10:02 ivanjack 阅读(636) 评论(0) 推荐(1)

Google App Engine简介
摘要:Google App Engine的介绍由于发布S3和EC2这两个优秀的云服务,使得Amazon已经率先在云计算市场站稳了脚跟,而身为云计算这个浪潮的发起者之一的Google肯定不甘示弱,并在2008年四月份推出了Google App Engine这项PaaS服务,虽然现在无法称其为一个革命性的产品,但肯定是现在市面上最成熟,并且功能最全面的PaaS平台。Google App Engine 提供一... 阅读全文

posted @ 2010-09-09 09:25 ivanjack 阅读(1202) 评论(0) 推荐(0)

Google的整体架构猜想
摘要:在软件工程界,大家有一个共识,那就是"需求决定架构",也就是说,架构的发展是为了更好地支撑应用。那么本文在介绍架构之前,先介绍一下Google所提供的主要产品有哪些?产品对于Google和它几个主要产品,比如搜索和邮件等,大家已经非常熟悉了,但是其提供服务的不只于此,并主要可分为六大类:各种搜索:网页搜索,图片搜索和视频搜索等。 广告系统:AdWords和AdSense。 生产力工具:Gmail和... 阅读全文

posted @ 2010-09-09 09:19 ivanjack 阅读(335) 评论(0) 推荐(0)

google核心技术
摘要:本篇将主要介绍Google的十个核心技术,而且可以分为四大类:分布式基础设施:GFS、Chubby 和 Protocol Buffer。 分布式大规模数据处理:MapReduce 和 Sawzall。 分布式数据库技术:BigTable 和数据库 Sharding。 数据中心优化技术:数据中心高温化、12V电池和服务器整合。 分布式基础设施GFS由于搜索引擎需要处理海量的数据,所以Google的两... 阅读全文

posted @ 2010-09-09 09:14 ivanjack 阅读(387) 评论(0) 推荐(0)

导航