上一页 1 ··· 20 21 22 23 24 25 26 27 28 ··· 41 下一页
摘要: 导读:大数据时代的来临也促使NoSQL数据库迅速崛起,但这并不意味着传统关系数据库即将消亡。近日Google研究院就推出被称为F1的新型数据库,F1作为一种混合型数据库融合了BigTable的高扩展性和SQL数据库的可用性和功能性。F1数据库作者共有12人,清单如下:Jeff Shute、Mircea Oancea、Stephan Ellner、Ben Handy、Eric Rollins、Bart Samwel、Radek Vingralek、Chad Whipkey、Xin Chen、Beat Jegerlehner、Kyle Littlefield、Phoenix Tong。现今云计算的从 阅读全文
posted @ 2012-06-09 19:31 ajian005 阅读(261) 评论(0) 推荐(0)
摘要: 浪潮之巅(On Top of Tides)作者: 吴军近一百多年来,总有一些公司很幸运地、有意识或者无意识地站在技术革命的浪尖之上。一旦处在了那个位置,即使不做任何事,也可以随着波浪顺顺当当地向前漂个十年甚至更长的时间。在这十几年间,它们代表着科技的浪潮,直到下一波浪潮的来临。从一百年前算起,AT&T 公司、IBM 公司、苹果公司 (Apple)、英特尔 (Intel) 公司、微软 (Microsoft) 公司、思科公司 (Cisco) 公司、雅虎 (Yahoo) 公司和谷歌 (Google) 公司都先后被幸运地推到了浪尖。虽然,它们来自不同的领域,中间有些已经衰落或者正在衰落,但是它 阅读全文
posted @ 2012-06-09 18:14 ajian005 阅读(310) 评论(0) 推荐(0)
摘要: 海量数据处理与存储调研1Hadoop发展现状[[1]]ApacheNutch 是 Hadoop 的源头,该项目始于 2002年, 是Apache Lucene的子项目之一。 至 2004年,Google在OSDI上公开发表了题为 “MapReduce: simplified data processing on large clusters”的论文,受到启发的 Doug C 等人 开 始实 现 MapReduce 计算 框 架 并 与 NDFS (Nutch distributed file system) 结合支持 Nutch 的主要算法 。 至2006 年逐渐成为一套完整而独立的软件 ,起 阅读全文
posted @ 2012-06-07 14:27 ajian005 阅读(402) 评论(0) 推荐(0)
摘要: 前言 参考:http://www.cnblogs.com/v-July-v几周前,当我最初听到,以致后来初次接触Hadoop与MapReduce这两个东西,我便稍显兴奋,觉得它们很是神秘,而神秘的东西常能勾起我的兴趣,在看过介绍它们的文章或论文之后,觉得Hadoop是一项富有趣味和挑战性的技术,且它还牵扯到了一个我更加感兴趣的话题:海量数据处理。由此,最近凡是空闲时,便在看“Hadoop”,“MapReduce”“海量数据处理”这方面的论文。但在看论文的过程中,总觉得那些论文都是浅尝辄止,常常看的很不过瘾,总是一个东西刚要讲到紧要处,它便结束了,让我好生“愤懑”。尽管我对这个Hadoop与Ma 阅读全文
posted @ 2012-06-07 14:10 ajian005 阅读(249) 评论(0) 推荐(0)
摘要: 转载自董的博客http://dongxicheng.org/search-engine/log-systems/1.背景介绍许多公司的平台每天会产生大量的日志(一般为流式数据,如,搜索引擎的pv,查询等),处理这些日志需要特定的日志系统,一般而言,这些系统需要具有以下特征:(1)构建应用系统和分析系统的桥梁,并将它们之间的关联解耦;(2)支持近实时的在线分析系统和类似于Hadoop之类的离线分析系统;(3)具有高可扩展性。即:当数据量增加时,可以通过增加节点进行水平扩展。本文从设计架构,负载均衡,可扩展性和容错性等方面对比了当今开源的日志系统,包括facebook的scribe,apache的 阅读全文
posted @ 2012-06-07 13:54 ajian005 阅读(301) 评论(0) 推荐(0)
摘要: 从前,有一个“伤不起”的人(就是我啦)在园子里分享过Google的架构,老是老了点,但对不少新手还是有点帮助的。今天看到几篇有关Google App Engine的技术架构文章,觉得比那个“伤不起”孩子总结得要全得多,索性就全部弄过来,一起分享给大家,没看到过的同学赶紧惊喜一下吧,看到过了的同学也假装惊喜一下嘛,呵呵。全部文章有点长,请耐心看下去,相信程序员都是有耐心的,除了我.......另外文章的作者是吴朱华,要转载的同学别忘了署上他的大名。下面就开始了。一、Google的核心技术在切入Google App Engine之前,首先会对Google的核心技术和其整体架构进行分析,以帮助大家之 阅读全文
posted @ 2012-06-06 15:26 ajian005 阅读(254) 评论(0) 推荐(0)
摘要: Rowid和Rownum对于数据库开发人员来说基本很少用到,因为在企业数据库开发中大多都是进行数据批处理,但是对于其他数据库人员来说还是会用到的。rowid和rownum都是虚列,但含义完全不同。rowid是物理地址,用于定位oracle中具体数据的物理存储位置,而rownum则是sql的输出结果排序。通俗的讲:rowid是相对不变的,rownum会变化,尤其是使用order by的时候。rowid 用于定位数据表中某条数据的位置,是唯一的、也不会改变rownum 表示查询某条记录在整个结果集中的位置,同一条记录查询条件不同对应的rownum是不同的而rowid是不会变的例如有如下一张表:US 阅读全文
posted @ 2012-06-05 11:24 ajian005 阅读(393) 评论(0) 推荐(0)
摘要: ── 分布式计算开源框架Hadoop入门实践(一)在SIP项目设计的过程中,对于它庞大的日志在开始时就考虑使用任务分解的多线程处理模式来分析统计,在我从前写的文章《Tiger Concurrent Practice --日志分析并行分解设计与实现》中有所提到。但是由于统计的内容暂时还是十分简单,所以就采用Memcache作为计数器,结合MySQL就完成了访问控制以及统计的工作。然而未来,对于海量日志分析的工作,还是需要有所准备。现在最火的技术词汇莫过于“云计算”,在Open API日益盛行的今天,互联网应用的数据将会越来越有价值,如何去分析这些数据,挖掘其内在价值,就需要分布式计算来支撑海量数 阅读全文
posted @ 2012-06-02 18:12 ajian005 阅读(404) 评论(0) 推荐(0)
摘要: 1 基于Eclipse和hadoop平台应用开发入门手册 阅读全文
posted @ 2012-06-02 10:21 ajian005 阅读(105) 评论(0) 推荐(0)
摘要: 轻松写出优雅的Java代码之CheckStyle http://www.searchtb.com/2011/01/coding-better-java-with-checkstyle.html 阅读全文
posted @ 2012-06-02 10:16 ajian005 阅读(155) 评论(0) 推荐(0)
上一页 1 ··· 20 21 22 23 24 25 26 27 28 ··· 41 下一页