摘要: 在这个激情四射的夏季,在这个充满奇迹的2008. 让咱们全中国人骄傲的奥运会正在北京举行,在大家为中国加油,为奥运健儿加油的同时,博客园正在为大家准备一个以程序设计来展现自己编程水平的仿真机器人足球比赛平台:)  阅读全文
posted @ 2008-08-21 10:16 逖靖寒 阅读(3958) | 评论(48) | 编辑
     摘要: 下载/Files/gpcuster/SmartContact.rarSmart Contacts说明文档V0.1前言前一段时间,自己装在了一个英文的WM6系统,感觉非常不错,但是有一点让我很不满意,原因就是联系人的查找相当不方便。用过中文系统的朋友都知道,联系人的排列方式是按照ABC的顺序排列的,所以查找起来相对来说比较方便,但是英文系统的排列顺序就不是这样了,所以查找相当不方便。然后我又装了一个...  阅读全文
posted @ 2008-02-22 13:40 逖靖寒 阅读(3233) | 评论(52) | 编辑
     摘要: 前一阵子Cassandra-0.7.0-beta1发布了,今天把代码拿下来粗略浏览了一下,发现主要有以下几点变化:1 数据模型中的Keyspace和ColumnFamily可以动态修改:之前的版本中,如果想在Cassandra中修改Keyspace和ColumnFamily,必须先停掉Cassandra,然后修改配置文件,最后再重启Cassandra才能生效。在现在的版本中,我们只需要定义新的Ke...  阅读全文
posted @ 2010-08-20 14:45 逖靖寒 阅读(868) | 评论(1) | 编辑
     摘要: 一个Cassandra集群需要投入时候,绝大多数时候都是会有初始化数据的,比如博客网站中所有的博客数据,数据分析网站中所有的网页信息,电子商务网站中所有的商品信息等等。这些初始化数据往往量的都非常大,不适用直接使用Thrift API的方式(谈谈Cassandra的客户端)直接导入。Facebook曾经使用了叫做BinaryMemTable的方式导入(使用Binary Memtable将大量数据导...  阅读全文
posted @ 2010-07-03 14:19 逖靖寒 阅读(1311) | 评论(1) | 编辑
     摘要: 我们在之前的文章(谈谈Cassandra的客户端)中讲解了如何在Client端查询Cassandra中的数据。为什么要使用RingCacheCassandra的内部读写流程大概是这样的:1 Client端先随机找到Cassandra集群中的一台机器,然后将查询请求发送给这台Cassandra机器。2 接收到查询请求的Cassandra机器会判断需要查询的数据是否在本机中:如果在本机中,直接查询;如...  阅读全文
posted @ 2010-06-23 23:20 逖靖寒 阅读(1378) | 评论(6) | 编辑
     摘要: 大家在使用Cassandra的时候,往往容易忽视Cassandra本身的限制。在Wiki中,我们可以看到Cassandra的限制:CassandraLimitationsCassandra的设计限制这一类限制是在当前的体系架构中无法改变的。每一个key对应的value不能超过磁盘本身的容量限制。这是因为Cassandra是将每一个key对应的value存储在本地磁盘上面的,所以当某一个key对应的...  阅读全文
posted @ 2010-06-19 15:54 逖靖寒 阅读(1543) | 评论(1) | 编辑
     摘要: 在之前的文章中,我们讲解了Cassandra如何安装于配置:如何安装和配置Cassandra在这篇文章中,我们将从svn中下载Cassandra的源代码,完成编译,并执行相应的单元测试。配置环境1 安装jdk6,ant。2 安装Eclipse3.53 在Eclipse中安装http://subclipse.tigris.org/update_1.6.x在Eclipse的菜单选择:Help &nda...  阅读全文
posted @ 2010-06-06 16:29 逖靖寒 阅读(1810) | 评论(11) | 编辑
     摘要: Hadoop基本操作命令在这篇文章中,我们默认认为Hadoop环境已经由运维人员配置好直接可以使用。假设Hadoop的安装目录HADOOP_HOME为/home/admin/hadoop。启动与关闭启动Hadoop1. 进入HADOOP_HOME目录。2. 执行sh bin/start-all.sh关闭Hadoop1. 进入HADOOP_HOME目录。2. 执行sh bin/stop-all.sh...  阅读全文
posted @ 2010-06-04 16:20 逖靖寒 阅读(430) | 评论(0) | 编辑
     摘要: 看到这个标题,大家一定会问了。这个整合如何定义?我个人认为,所谓的整合是指:我们可以编写MapReduce程序,从HDFS中读取数据然后插入到Cassandra中。也可以是直接从Cassandra中读取数据,然后进行相应的计算。从HDFS中读取数据然后插入到Cassandra中对于这种类型,我们可以按照以下几个步骤来操作。1 将需要插入Cassandra的数据上传到HDFS中。2 启动MapRed...  阅读全文
posted @ 2010-06-01 16:06 逖靖寒 阅读(1449) | 评论(0) | 编辑
     摘要: 在《如何安装和配置Cassandra》中,我们可以在DataFileDirectories中配置数据的存放位置。当Cassandra启动后,向其中插入的数据就会放在DataFileDirectories的目录下,如图: 这里有2个Column Family,分别是Standrad1,Super1。大家可以想象,如果没有压缩功能的话,那么随着数据量的增加,DataFileDirectories目录中...  阅读全文
posted @ 2010-05-27 23:09 逖靖寒 阅读(1210) | 评论(1) | 编辑
     摘要: 问题通过前面的文章:《谈谈Cassandra的客户端》和《大话Cassandra数据模型》我们已经了解了Cassandra的数据模型和编程接口的情况。假如我们在实际的应用中我们的数据是这样保存的: 每一个key对应了一些列的Column:port,Version,Service,Status等等。通过某一个key,我们能够找到和这个key相关的所有Column的值。假设我们要找到Column的na...  阅读全文
posted @ 2010-05-26 08:29 逖靖寒 阅读(1296) | 评论(3) | 编辑
     摘要: 在上一篇文章《使 用Binary Memtable将大量数据导入Cassandra》中,讲解了如何使用Binary Memtable将大量数据导入Cassandra。这一周一直在看如果使用Binary Memtable的方式导入大量的数据。今天看下来,我还是觉得在目前这个版本不适合使用这种方式去导入数据。原因如下:在0.6+的版本中,Cassandra集群中取消了UDP通信,完全采用TCP监听固定...  阅读全文
posted @ 2010-05-21 18:56 逖靖寒 阅读(1119) | 评论(0) | 编辑