上一页 1 ··· 245 246 247 248 249 250 251 252 253 ··· 274 下一页
摘要: 学习lucene索引文件格式的目的是通过对lucene数据结构的理解,从而为lucene索引实现打下基础。 索引文件的整体结构 如下图,这是整个索引文件的整体结构,可以看到,实际上lucene索引保存下了相当多的东西 但是,单从上面的文件罗列,很难看出来一个整体的结构,那么,接下来这张图就向我们展示 阅读全文
posted @ 2017-02-13 15:21 bonelee 阅读(4368) 评论(0) 推荐(0)
摘要: 转自:https://yq.aliyun.com/topic/58?spm=5176.100239.blogcont69354.9.MLtp4T 摘要: Facebook最近开源了beringei时序数据库,其是用来解决其内部监控数据存储和查询需求的数据库,特点是读写速度快。beringei在压缩算 阅读全文
posted @ 2017-02-13 10:35 bonelee 阅读(3169) 评论(0) 推荐(0)
摘要: 转自:http://www.infoq.com/cn/news/2017/02/Facebook-Beringei 2017年2月3日,Facebook宣布将开源他们的高性能时序数据存储引擎Beringer。Beringei是用来解决其内部监控数据存储和查询需求的数据库,其特点是读写速度快,属于内存 阅读全文
posted @ 2017-02-13 10:32 bonelee 阅读(1671) 评论(0) 推荐(1)
摘要: Start the server For a more detailed look, make sure to read the quickstart. $ rethinkdb Import the driver First, start a Python shell: $ python Then, 阅读全文
posted @ 2017-02-13 09:51 bonelee 阅读(1700) 评论(0) 推荐(0)
摘要: RethinkDB是什么? RethinkDB是新一代的面向文档的数据库存储管理系统,原本是MySQL中针对SSD优化的一个存储引擎,后来脱离了MySQL成为了独立的系统。 数据如何存储在磁盘上? 数据组织成B-Tree,且使用为rethinkdb定制的log-structured形式的存储引擎存储 阅读全文
posted @ 2017-02-13 09:36 bonelee 阅读(1355) 评论(0) 推荐(0)
摘要: DB目录总大小:2468MB 所有buckets的meta信息在.bucketManifest文件里: id,path,"raw_size","event_count","host_count","source_count","sourcetype_count","size_on_disk",mod 阅读全文
posted @ 2017-02-09 13:37 bonelee 阅读(478) 评论(0) 推荐(0)
摘要: Poseidon 系统是一个日志搜索平台,可以在百万亿条、100PB 大小的日志数据中快速分析和检索。360 公司是一个安全公司,在追踪 APT(高级持续威胁)事件,经常需要在海量的历史日志数据中检索某些信息,例如某个恶意样本在某个时间段内的活动情况。在 Poseidon 系统出现之前,都是写 Ma 阅读全文
posted @ 2017-02-09 12:11 bonelee 阅读(787) 评论(0) 推荐(0)
摘要: 了解如何解放你内心的自然领袖,从你的内心而非你的自我来领导你自己 获得真正的发自内心的信心,激发忠诚 当你真正实现自我价值的时候,练习自我同情 激发你创造者的本性 真正地享受工作和你给世界带来的价值 Michael Anderson在他的著作《以魂为中心的领导力》一书中介绍了如何通过与灵魂交流,发展 阅读全文
posted @ 2017-02-09 11:54 bonelee 阅读(290) 评论(0) 推荐(0)
摘要: Twitter工程团队近期提供了Twitter核心技术的演进和扩展的详细资料,这些核心技术支撑了Twitter自营数据中心的系统架构,用于提供社会媒体服务。他们分享的关键经验包括:超越原始规格和需求进行系统架构,并在流量趋向设计容量上限时迅速做出大刀阔斧的改进;不存在所谓的“临时更改或变通方案”,因 阅读全文
posted @ 2017-02-09 09:30 bonelee 阅读(410) 评论(0) 推荐(0)
摘要: 分布式流处理是对无边界数据集进行连续不断的处理、聚合和分析。它跟MapReduce一样是一种通用计算,但我们期望延迟在毫秒或者秒级别。这类系统一般采用有向无环图(DAG)。 DAG是任务链的图形化表示,我们用它来描述流处理作业的拓扑。如下图,数据从sources流经处理任务链到sinks。单机可以运 阅读全文
posted @ 2017-02-01 23:55 bonelee 阅读(8865) 评论(0) 推荐(0)
上一页 1 ··· 245 246 247 248 249 250 251 252 253 ··· 274 下一页