2010 年 9月 9 日随笔档案 - Jonson Li

2010年9月9日

摘要： Tair是由淘宝网自主开发的Key/Value结构数据存储系统，在淘宝网有着大规模的应用。您在登录淘宝、查看商品详情页面或者在淘江湖和好友“捣浆糊”的时候，都在直接或间接地和Tair交互。阅读全文

posted @ 2010-09-09 11:16 Jonson Li 阅读(325) 评论(0) 推荐(0)

摘要：在众多不同的数据模型里，关系数据模型自80年代就处于统治地位，而且有不少实现，如Oracle、MySQL和MSSQL，它们也被称为关系数据库管理系统（RDBMS）。然而，最近随着关系数据库使用案例的不断增加，一些问题也暴露了出来，这主要是因为两个原因：数据建模中的一些缺陷和问题，以及在大数据量和多服务器之上进行水平伸缩的限制。阅读全文

posted @ 2010-09-09 11:14 Jonson Li 阅读(745) 评论(0) 推荐(0)

NoSQL数据库探讨－为什么要用非关系数据库？

摘要：随着互联网web2.0网站的兴起，非关系型的数据库现在成了一个极其热门的新领域，非关系数据库产品的发展非常迅速。而传统的关系数据库在应付web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，暴露了很多难以克服的问题。阅读全文

posted @ 2010-09-09 11:12 Jonson Li 阅读(223) 评论(0) 推荐(0)

Java开源缓存平台Terracotta 3.0版本发布（转载）

摘要： Terracotta公司近日推出了Terracotta 3.0，这是一款开源的Java内存缓冲数据库平台。内存缓冲（In-Memory Caching)技术最近发展迅速，它给基于网络交易的数据库应用程序提供了一种新的方案。阅读全文

posted @ 2010-09-09 11:11 Jonson Li 阅读(300) 评论(0) 推荐(0)

云计算推波助澜非关系数据库蓄势待发（转载）

摘要：摘要：非关系型数据库正在吸引人们的注意，因为它们可以忽略许多的规则，而这些规则正是经验丰富的数据库管理员积累的深刻教训。所有的Web应用程序设计者都梦想构建一个多机运行的应用程序，保存所有用户的所有数据，要想做到这些，有些老的规则需要避开，甚至是打破。阅读全文

posted @ 2010-09-09 11:09 Jonson Li 阅读(193) 评论(0) 推荐(0)

探寻关系数据库和ORM的最佳替代者（转载）

摘要：摘要：本文作者从业专业软件开发多年来，一直认为一个数据库的持久性整体规划通常都是不成套的。近几年来随着云计算开始流行，有很多声音开始质疑关系数据库的末日是否已经来临。在众多备受瞩目的替代品中，Terracotta是比较杰出的一支。阅读全文

posted @ 2010-09-09 11:06 Jonson Li 阅读(275) 评论(0) 推荐(0)

关系数据库的末日是否已经来临（转载）

摘要：摘要：最近,大量新的非关系式数据库如雨后春笋般出现在云里云外。这其中所释放出的一个关键信息是：“如果想获得丰富而随需应变的可伸缩性，你需要一个非关系数据库。”如果这是真的，那么这是不是一个迹象，表明曾经强大的关系式数据库终于在它的盔甲上出现了裂缝？关系数据库的日子是不是到头了？该隐退了？在本文中，我们将检视当前这种在特定情况下摆脱关系数据库的趋势，并分析这对于关系数据库的未来意味着什么。阅读全文

posted @ 2010-09-09 11:03 Jonson Li 阅读(252) 评论(0) 推荐(0)

2009年云数据库的开发和应用前景（转载）

摘要：摘要：数据库厂商微软和甲骨文是在2008年开始重视云数据库。分析师们预计，在2009年数据库厂商会把更多的数据库功能增加到云中。2008年只是云计算开始步入数据库市场。阅读全文

posted @ 2010-09-09 11:01 Jonson Li 阅读(188) 评论(0) 推荐(0)

云计算使关系数据库逐渐落伍（转载）

摘要：摘要：尽管大型关系数据库如甲骨文公司提供的产品，已经被部署在很多数据中心，但云计算需要一种不同的设置来充分发挥其潜力。阅读全文

posted @ 2010-09-09 11:00 Jonson Li 阅读(201) 评论(0) 推荐(0)

对SQL说不！NoSQL的数据库技术革命（转载）

摘要：就像当年波士顿的爱国者为反抗英国重税的行动一样，NoSQL的支持者们从各地涌来，分享他们如何推翻缓慢而昂贵的关系数据库的暴政，怎样使用更有效和更便宜的方法来管理数据，他们开始对SQL说不！阅读全文

posted @ 2010-09-09 10:58 Jonson Li 阅读(193) 评论(0) 推荐(0)

企业中的NoSQL（转载）

摘要：作为企业架构师，我的职业习惯之一，就是不断的探求各种新的有前景的概念和思想，看其是否有潜力为我所服务的来自各行各业的企业客户带来价值。同样出于对这种理念的追求，我对NoSQL领域的关注了也有一段时间了，甚至从这个术语产生(或者错误的产生?)之前就开始了。Google首先在这方面点了一把火，发布了论文Big Table架构，对关系数据库是银弹这种普遍的信念提出了质疑，而Amazon关于Dynamo的论文则紧随其后。过去的一年中我们见证了NoSQL强劲的势头，在这一领域有多达25种产品/解决方案发布，并且NoSQL的触角已经伸向了业界的各个角落。在此前提下，我最近考虑深入这一领域，评估一下我的客户究竟如何才能从这种NoSQL运动中获益。不仅如此，我还想探究对于企业来说，是否是到了该认真考虑采纳NoSQL的合适时机了。阅读全文

posted @ 2010-09-09 10:55 Jonson Li 阅读(268) 评论(0) 推荐(0)

百度技术沙龙（第2期）- 2. 互联网应用服务扩展的一点经验（转载）

摘要：王迪是FreeWheel核心系统的技术总监，从07年FreeWheel创立起，他全程参与到其广告核心系统的架构设计，也见证了FreeWheel从最初的的只有20台广告服务器、日均几十万的访问量、不到1G/天的日志量，发展到现在拥有60台广告服务器、日均广告请求5000万次、日志处理服务器8台、日均4小时处理日志200G这么一个规模。3年之间，流量增长20倍。他主要谈到了以下的一些经验和原则：应用服务扩展无状态应用服务复制与多层次Cache 数据仓库扩展 De-normalization/Pivot Roll up/Data Availability Benchmarking与查询优化 Split-Loading/Sharding 运营原则 50%运行负载上限 & N+1 Data Center 监控和响应多阶段部署很多具体的实践方法，都是针对他们具体的商业模式以及实际工作中摸索出来的，它不一定是“最好”的，但却是最适合的，比如对系统的负载当达到50%的时候，就是一个优化和扩容的信号了；再比如，以自动化回归测试为核心，但并未使用TDD单元测试，等等等等阅读全文

posted @ 2010-09-09 10:47 Jonson Li 阅读(249) 评论(0) 推荐(0)

百度技术沙龙（第2期）- 1. 百度大规模数据处理（转载）

摘要：为Hadoop的发展贡献自己的力量在马如悦的演讲中，他主要介绍了百度的大规模数据存储、数据分析以及数据索引，主要包括以下内容点：大规模数据存储 Lustre和HDFS 系统结构 HDFS优势、不足大规模数据分析 MPI和MapReduce MapReduce概念模型、实现模型 MapReduce-Hadoop实现大规模数据索引 MySQL和HBase对比 HBase详解在以上三方面百度遇到的问题、对策和原则其中，马如悦提到，百度现在要处理的数据量非常庞大：存储20PB+数据，每日新增数据10TB+，每天处理的数据1PB+，每天提交10K+次作业。现在使用的文件系统是HDFS，数据存储是HBase，有超过2K台服务器节点，每个节点为2*4 core。现在遇到的一个棘手问题便是namenode的瓶颈问题：因为要存储大量的（小）文件，使namenode的压力非常大，他们刚刚采购了48GB的内存，但是这48GB的内存，预计只能坚持到今年年底，到时候，可能会采购96GB的内存来紧急应对这个问题。所以百度在namenode的分布式方面，进行了很多研究。马阅读全文

posted @ 2010-09-09 10:44 Jonson Li 阅读(348) 评论(0) 推荐(0)

百度技术沙龙（第1期）- 2. 豆瓣数据存储实践（转载）

摘要：源地址：http://www.infoq.com/cn/presentations/liuhongqing-data-store演讲嘉宾及主题嘉宾简介：黄方荣WEB开发高级工程师，1998年大学毕业，2000年开始从事WEB开发工作。现就职于百度，从事于大型WEB项目（前端）技术架构。用最适合的方案解决WEB开发的各种难题！演讲主题：WEB数据交互的艺术主要演讲的内容：交互数据的格式；几种疑难数据... 阅读全文

posted @ 2010-09-09 10:42 Jonson Li 阅读(330) 评论(0) 推荐(0)

百度技术沙龙（第1期）- 1. WEB数据交互的艺术（转载）

摘要：主要演讲的内容：交互数据的格式；几种疑难数据交互的实现（跨页交互、跨域交互、即时交互等），这些解决方案一部分是已经在现有产品线上实现，还有一部分是正在实施；数据交互的意义等……；WEB发展的源动力是用户的需求，用户的需求又都通过数据的交互来实现，即什么样的交互数据决定着什么样的WEB。本次交流的内容就是从技术上来解析数据交互的实现，让每个解决方案都如同艺术品一样，简洁，优美！阅读全文

posted @ 2010-09-09 10:38 Jonson Li 阅读(322) 评论(0) 推荐(0)

MapReduce 中文版论文（转载）

摘要： MapReduce是一个编程模型，也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于 key/value pair的数据集合，输出中间的基于key/value pair的数据集合；然后再创建一个Reduce函数用来合并所有的具有相同中间key值的中间value值。现实世界中有很多满足上述处理模型的例子，本论文将详细描述这个模型。 MapReduce架构的程序能够在大量的普通配置的计算机上实现并行化处理。这个系统在运行时只关心：如何分割输入数据，在大量计算机组成的集群上的调度，集群中计算机的错误处理，管理集群中计算机之间必要的通信。采用MapReduce架构可以使那些没有并行计算和分布式处理系统开发经验的程序员有效利用分布式系统的丰富资源。我们的MapReduce实现运行在规模可以灵活调整的由普通机器组成的集群上：一个典型的MapReduce计算往往由几千台机器组成、处理以TB计算的数据。程序员发现这个系统非常好用：已经实现了数以百计的MapReduce程序，在Google的集群上，每天都有1000多个 MapReduce程序在执行。阅读全文

posted @ 2010-09-09 09:46 Jonson Li 阅读(545) 评论(0) 推荐(0)

探索Google App Engine背后的奥秘(6)- 总结（转载）

摘要：本篇是本系列的最终章，将总结一下App Engine在使用方面的注意点，最佳实践和适用场景，最后会谈一下我对App Engine的一些期望。阅读全文

posted @ 2010-09-09 09:38 Jonson Li 阅读(149) 评论(0) 推荐(0)

探索Google App Engine背后的奥秘(5)- Datastore的设计（转载）

摘要：本篇会首先会从程序员角度来介绍一下Datastore在使用方面的一些信息，之后会接着介绍Datastore是如何构建的。阅读全文

posted @ 2010-09-09 09:37 Jonson Li 阅读(231) 评论(0) 推荐(0)

探索Google App Engine背后的奥秘(4)- Google App Engine的架构（转载）

摘要：本篇将首先介绍App Engine的一些设计理念，接着将对App Engine的组成部分等进行介绍。阅读全文

posted @ 2010-09-09 09:36 Jonson Li 阅读(208) 评论(0) 推荐(0)

探索Google App Engine背后的奥秘(3)- Google App Engine的简介（转载）

摘要：通过前面两篇介绍，大家应该对Google强大的基础设施有一定的了解。本篇开始介绍构筑在这强大基础设施之上的Google App Engine。 Google App Engine的介绍由于发布S3和EC2这两个优秀的云服务，使得Amazon已经率先在云计算市场站稳了脚跟，而身为云计算这个浪潮的发起者之一的Google肯定不甘示弱，并在2008年四月份推出了Google App Engine这项PaaS服务，虽然现在无法称其为一个革命性的产品，但肯定是现在市面上最成熟，并且功能最全面的PaaS平台。 Google App Engine 提供一整套开发组件来让用户轻松地在本地构建和调试网络应用，之后能让用户在Google强大的基础设施上部署和运行网络应用程序，并自动根据应用所承受的负载来对应用进行扩展，并免去用户对应用和服务器等的维护工作。同时提供大量的免费额度和灵活的资费标准。在开发语言方面，现支持Java和Python这两种语言，并为这两种语言提供基本相同的功能和API。阅读全文

posted @ 2010-09-09 09:35 Jonson Li 阅读(217) 评论(0) 推荐(0)

大数据与人工智能探索

“云”，“大数据”，“人工智能”正在改变着我们的生活，让我们一起来迎接新的变革与挑战吧。

公告