01 2013 档案

摘要:摘要Bigtable 是设计用来管理那些可能达到很大大小(比如可能是存储在数千台服务器上的数PB的数据)的结构化数据的分布式存储系统。Google的很多项目都将数据存 储在Bigtable中,比如网页索引,google 地球,google金融。这些应用对Bigtable提出了很多不同的要求,无论是数据大小(从单纯的URL到包含图片附件的网页)还是延时需求。尽管存 在这些各种不同的需求,Bigtable成功地为google的所有这些产品提供了一个灵活的,高性能的解决方案。在这篇论文中,我们将描述 Bigtable所提供的允许客户端动态控制数据分布和格式的简单数据模型,此外还会描述Bigtable 阅读全文
posted @ 2013-01-09 21:58 蜗牛123 阅读(387) 评论(0) 推荐(0)
摘要:一、安装准备1、下载zookeeper-3.3.1,地址:http://www.apache.org/dist/hadoop/zookeeper/zookeeper-3.3.1/2、JDK版本:jdk-6u20-linux-i586.bin3、操作系统:Linux4、默认前提是安装完hadoop 0.20.2版本: 192.168.3.131 namenode 192.168.3.132 datanode 192.168.3.133 datanode二、操作步骤(默认在namenode上进行)1、拷贝以上文件到Linux的“/usr/”目录下。同时新建目录“/zookeeper-3.3.1”。 阅读全文
posted @ 2013-01-09 10:42 蜗牛123 阅读(262) 评论(0) 推荐(0)
摘要:通用快捷键 Alt + F1 类似Windows下的Win键,在GNOME中打开"应用程序"菜单(Applications)Alt + F2 类似Windows下的Win + R组合键,在GNOME中运行应用程序Ctrl + Alt + L 类似Windows下的Win + L 组合键,锁定桌面,不同在于同时启动屏幕保护程序Ctrl + Alt + D组合键,显示桌面Ctrl + Alt + → / ← 在不同工作台间切换Ctrl + Alt + Shift + → / ← 移动当前窗口到不同工作台[编辑] Ubuntu通用快捷键 PrintScreen 全屏抓图Alt + 阅读全文
posted @ 2013-01-08 20:50 蜗牛123 阅读(206) 评论(0) 推荐(0)
摘要:什么时候需要HBase 半结构化或非结构化数据,对于数据结构字段不够确定或杂乱无章很难按一个概念去进行抽取的数据适合用HBase。当业务发展需要存储author的email,phone,address信息时RDBMS需要停机维护,而HBase支持动态增加.记录非常稀疏RDBMS的行有多少列是固定的,为null的列浪费了存储空间。而如上文提到的,HBase为null的Column不会被存储,这样既节省了空间又提高了读性能。多版本数据如上文提到的根据Row key和Column key定位到的Value可以有任意数量的版本值,因此对于需要存储变动历史记录的数据,用HBase就非常方便了。比如上例中 阅读全文
posted @ 2013-01-08 16:26 蜗牛123 阅读(453) 评论(0) 推荐(0)