上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 16 下一页

pydev找不到module解决办法

摘要: 平时做Python开发主要采用vi,由于之前大多开发Java,所以也用pydev。比较熟悉eclipse。但是,在使用pydev的时候,经常出现找不到module的错误,有的提示错误,可以运行,有的干脆真的找不到,无法启动Python程序。如何解决呢?很简单,如下图: 在设置中找到PyDev下的Interpreter Python选项,右边点击New Folder,选择按照的module目录,比如上图高亮的,就是我安装的pymongo的目录。然后“Apply”应用即可。此法屡试不爽。 【完】 阅读全文
posted @ 2012-07-27 23:04 sing1ee 阅读(899) 评论(0) 推荐(0)

Cassandra Compaction的改进

摘要: 有关Cassandra Compaction,我写了好多的博客。这是为什么呢?原因很简单,因为Compaction在实际应用中,影响巨大。而且似乎探讨这方面的文章还比较少。 这篇文章不是翻译的,而是要写我自己的经验,我悲催的发现,凡是写自己总结的经验,文章就会很短。我本来打算Leveled Compaction和SizeTiered Compaction的改进分开些,可是自己掂量了一下,都很少,几句话、甚至一句话就搞定了。所以我不得以把原本两篇文章合到一起写。尽管也不错,但是绝对是我的实践经验,希望对大家有帮助。 SizeTiered Compaction改进 SizeTierd Compac 阅读全文
posted @ 2012-07-11 00:38 sing1ee 阅读(1188) 评论(0) 推荐(0)

理解Hinted Handoff

摘要: Hinted Handoff在读Dynamo论文的时候,对这个名字就不是很理解。现在要深入了解Cassandra,想要翻译这个词,在网上找了一下,大概两种翻 译:1)提示移交;2)永远可写入。我比较倾向于第一个翻译,因为对于Cassandra,永远可写入并不总是成立的。不过,作为专有的名词出现,我在下 文就不进行翻译了。【正文开始】Hinted Handoff作为写操作的可选的一部分,主要目的是当不要求一致性的时候,提高写的高可用性。其次,Hinted Handoff缩短了暂时失败的节点恢复一致的时间。尤其是在一些奇怪的网络问题下,更加有用。(网络短时间不可用之类)Hinted Handoff 阅读全文
posted @ 2012-07-09 22:35 sing1ee 阅读(2824) 评论(0) 推荐(0)

Cassandra三级存储构想

摘要: 这篇博客需要对SSD有一定了解,我这里没有详细讨论SSD相关的问题,某些概念不了解自行google,或者留言讨论。Cassandra最大的特点就是将随机写巧妙的转换为顺序写。memtable达到一定大小之后,flush到磁盘(可以是SSD,通常是HDD)。这个特性,对Cassandra在SSD上的应用,带来了天然的优势。现在Cassandra部署情况,较常用的方式是内存+HDD,或者有钱一些的公司内存+SSD。后者主要是想通过SSD随机读的优异表现提升读的性能(大概是HDD的100倍)。但是,我们知道,根据数据局部性原理,数据的热点是永远存在的。所以,全部数据放在SSD上是比较浪费的。除了数据 阅读全文
posted @ 2012-07-02 17:32 sing1ee 阅读(701) 评论(0) 推荐(0)

有关Cassandra的数据划分【译】

摘要: 当启动一个Cassandra集群的时候,必须选择如何在集群中的不同节点之间划分数据。这是由Cassandra的partitioner来完成的。 在Cassandra中,Cassandra所管理的数据构成了一个环。这个环根据节点的数量划分成相等的区间,这样一个节点就可以负责存储一个区间或者几个区间中的数据。在一个节点能够加入到环中之前,它必须被分配一个token(中文翻译为令牌)。token决定了节点在环中的位置,从而也决定过了节点负责管理的数据范围。 数据根据行键(row key)被划分到不同的节点上。为了确定第一个复本所在的节点,需要在换上顺时针的查找,直到找到一个token的值大于等于行键 阅读全文
posted @ 2012-06-30 09:06 sing1ee 阅读(702) 评论(0) 推荐(0)

Token的生成【译】

摘要: 前些日子有同学问如何生成token,原来做Voldemort的时候,官方提供了一个脚本,自动生成,Voldemort只是一致性hash很方便,考虑的因素也少。而Cassandra考虑的就多了,跨机架,跨数据中心,都有很多需要注意的。上次我说了在同一个数据中心很实用,可控的方法。下面讲讲DataStax推荐的一些方法。 【正文开始】 Token是为数据中心中某一特定节点分配某一范围的数据的依据。 当启动一个Cassandra的集群,必须选择数据在集群中节点是如何分布的。partitioner是根据数据的key来决定这行数据存储在哪个节点上。token是独立与partitioner的。每一个节点都 阅读全文
posted @ 2012-06-29 17:25 sing1ee 阅读(3694) 评论(0) 推荐(0)

Cassandra client的请求详解【译】

摘要: Cassandra的读写请求,主要包括两部分,client端如何找到节点,请求何时成功返回,以及本地的读写是如何完成的,本地的读写,会在后续的博客中不断给出。本文主要解析前面两个问题。 【正文开始】 Cassandra集群中的所有节点都是对等的。客户端的读写请求可能会发送给集群中的任一节点。当客户端连接了某一个节点,并且开始发送读写请求,那个这个节点因为承担了客户端的操作,就被称为“协调者”。 协调者的工作是充当客户端应用和存储实际请求数据的节点之间的代理。协调者根据数据划分、复制的策略来决定,将实际的读写请求发送到确定的节点。 写请求 协调者会将些请求发送到所有应该存储这条数据的节点(也就是 阅读全文
posted @ 2012-06-29 13:44 sing1ee 阅读(894) 评论(0) 推荐(0)

Amazon DynamoDB与Cassandra比较

摘要: 这是一篇Jonathan Ellis写的文章,与DynamoDB进行比较,突出Cassandra的优点,但似乎后面的评论,大家并不那么接收Cassandra,尤其是在云主机的环境下。原文在这儿。这篇文章就不详细的翻译了,因为有很多的废话,捡重要的说吧。 Cassandra和DynamoDB有什么关系呢?按照文章的说法儿,这简直就是一个轮回。Cassandra最初的实现,很大程度上借鉴了Dynamo那篇论文的实现。但是数据存储模型等并没有采用。今年,Amazon推出DynamoDB,除了Dynamo基础之外,更是从Cassandra学习了很多内容。很有意思。以至于作者最后开玩笑说,Cassand 阅读全文
posted @ 2012-06-29 00:15 sing1ee 阅读(1706) 评论(0) 推荐(0)

Cassandra博客更新预告

摘要: 一年的时间很快就过去了,这一年,工作上好像只是围绕这Cassandra。前面也写了不少文章,不过都比较浅,原因种种。从明天开始,我除了翻译一些Cassandra的文章之外,还要把这一年的所得逐渐写出来。和大家分享,讨论,也为Cassandra在国内推广,出点力。尽管不如Hbase那般火热,但是我仍旧十分看好Cassandra。尤其是1.0版本以后的发展,越来越给力。 这篇博客主要列出以后会写的一些点。如果不列出来,不强迫自己,恐怕拖一拖就过去了,对自己对后来搞Cassandra的同学,都不好。所以,我要先列出来:SizeTired Compaction的改进——主要效果会提升读性能【done】 阅读全文
posted @ 2012-06-28 20:51 sing1ee 阅读(373) 评论(0) 推荐(0)

有关Cassandra节点之间的通信:Gossip【译】

摘要: Cassandra使用叫做Gossip的协议发现集群中其他节点的位置和状态信息。Gossip是一个点对点的通信协议,节点之间会周期进行状态信息交换——这些信息包括当前节点本身信息,以及当前节点存储的其他节点的状态信息。 在Cassandra中,gossip进程每秒钟都会和集群中的其他三个节点交换状态消息。状态信息包括节点自身的信息、以及所存储的其他节点的信息,这样集群中的节点,很快就能够互相了解。gossip消息都有一个版本信息,随着交换的进行,旧的信息会逐渐被旧的信息覆盖。 集群成员和种子节点 当节点第一次启动,它会从配置文件中确定所属Cassandra集群的名字,以及确定seeds nod 阅读全文
posted @ 2012-06-27 23:41 sing1ee 阅读(1547) 评论(0) 推荐(0)
上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 16 下一页