MongoDB结构划分

一、基本结构划分

从整体上可以将MongoDB自底向上划分为四部分：

1. 基础数据部分

2. 一般的数据库操作

3. MongoDB提供的操作特性

4. 数据库架构管理

二、各部分简介

1. 基础数据部分

数据库最终的工作就是把数据存储，然后在用户需要的时候以一种方式把数据提出去。因此，所有数据都需要以一种形式保存到内存或者硬盘里。

在MongoDB里面主要有两种数据的存储方式。

BSON：类似于一个有序的JSON。是数据存储的基础，在MongoDB中的大部分数据都是用这种数据结构与用户交互。与一般数据库不同虽然MongoDB也是KV操作读取数据，但是用一Key对应的Value可以是不同类型。

GridFS：BSON只能存储最大4MB的数据，当需要存储大型数据的时候，就需要用GridFS来做存储了。

2. 一般数据库操作

作为数据库应该包含基本的增、删、改、查功能，并且提供加速基本操作的辅助工具，MongoDB同样也提供了这些基本功能。

动态查询：基本的增删改查功能。同时在做这些操作的时候MongoDB为这些操作自动优化，如：考虑可以利用的索引，直接从缓存中读取内容等等。

索引：在MongoDB中为每一条数据创建了一个_id的属性，作为最基本的索引。用户也可以自己创建一个索引来提高查询效率。MongoDB也提供了合并索引的功能，可以用来合并多关键词的索引。

地理位置索引：可以根据距离等位置相关属性来做索引。

预查询：在真正执行一条语句前，测试查询等基本操作的耗时，作为数据库设计或者语句效率的检测。

3. MongoDB提供的操作特性

同一位置插入数据：与其他数据库不同，MongoDB在真正将数据写入本地前，做了缓存处理，在内存中读写数据的速度比每次都写到本地的速度快多了。

Map and Reduce Function：MongoDB的特殊数据结构，决定了他可以有与众不同的特殊数据处理方式。编写这两个函数可以完成很多数据库本身没有提供的自定义功能。

4. 数据库架构管理

数据备份：由于MongoDB的实时读取性和内存中处理数据的特性，单个MongoDB数据库是很容易造成数据丢失的，为保证数据不丢失或少丢失（实际生产中会丢失），MongoDB提供了数据备份和选举运行主机的机制。（在实际生产中不能需要多台MongoDB服务器共同运行）下图简单描述了MongoDB的主从机关系。

自动分片：在实际生产中，当数据量过大超过了一台MongoDB服务器所能支持的时候，需要考虑建立一个MongoDB的数据库集群，每一个集保存整体数据的某一部分。下图简单描述了一个MongoDBs集群的工作情况：

三、源码阅读顺序及要点

了解了MongoDB的集群方式后，我觉得自底向上对MongoDB的源码进行阅读比较好。

原因：

1. 先了解基础的数据结构，对逻辑算法中出现的数据结构有所了解。

2. 算法与运行平台无关，集群等功能与运行平台有关。为了不过早的牵绊与系统功能，理解MongoDB的设计哲学之后对深层次功能的了解更有利。

3. 在生产优化中，底部的数据结构或者算法调整可能更容易产生效果。

因此，列出如下几点阅读顺序：

1. GridFS，BJSON

了解基本数据结构

2. 基本搜索功能

了解对数据的基本处理，输入输出规则

3. 索引，搜索优化

索引的创建和索引是如何提供其强大的辅助搜索功能的。

4. 数据备份

多台服务器的副本是如何保持同步的

当主服务器宕机程序是如何选择副本服务器的

当主服务器恢复后是以什么策略再次同步数据的

5. 自动分片搜索

当创建完分片之后，MongoDB是如何处理多个服务器之间的数据跳转搜索的。

posted @ 2012-10-19 10:59 摇滚诗人阅读(5940) 评论(0) 收藏举报

刷新页面返回顶部

biosli

随性、激情技术区

MongoDB结构划分

二、各部分简介

1. 基础数据部分

2. 一般数据库操作

3. MongoDB提供的操作特性

4. 数据库架构管理

三、源码阅读顺序及要点

公告

biosli

随性、激情技术区

MongoDB结构划分

二、 各部分简介

1. 基础数据部分

2. 一般数据库操作

3. MongoDB提供的操作特性

4. 数据库架构管理

三、 源码阅读顺序及要点

公告

二、各部分简介

三、源码阅读顺序及要点