芒果知识补充(1)mongodb 单机的备份与恢复

 备份与恢复是数据保存的重要技术。本次只是学习记录单机的操作。
    mongodb的备份和恢复提供了两种方式。备份为bson格式和和备份为json和csv格式。

a)导出bson格式
    主要用于单机小数据量的备份、快照等。存储被bson格式,bson(Binary JSON ),
是轻量级的二进制数据格式。

    备份命令mongodump
    参数
              --help                   帮助信息
              -v [ --verbose ]         be more verbose (include multiple times for more
                                       verbosity e.g. -vvvvv)
              -h [ --host ] arg        指定要备份的服务器ip
              --port arg               指定要备份的服务器端口,需要与服务器ip一起使用,格式为ip:port
              --ipv6                   开启ipv6的支持,默认是关闭的
              -u [ --username ] arg    用户名
              -p [ --password ] arg    密码
              --dbpath arg             指定连接数据库后访问数据的位置,但是不能是当前使用的目录
              --directoryperdb         为每一个库建立一个目录。
              -d [ --db ] arg          指定要备份的库名
              -c [ --collection ] arg  指定要导出的collection
              -o [ --out ] arg (=dump) 输出的目录,默认目录为执行命令的路径下创建dump目录
              -q [ --query ] arg       可以json查询,有选择性的导出数据
              --oplog                  使用oplog
              --repair                 尝试修复损坏的数据库
             
        恢复命令mongorestore
        参数
              --help                  帮助信息
              -v [ --verbose ]         be more verbose (include multiple times for more
                                       verbosity e.g. -vvvvv)
              -h [ --host ] arg        指定要导入的服务器ip
              --port arg               指定要导入的服务器端口,需要与服务器ip一起使用,格式为ip:port
              --ipv6                   开启ipv6的支持,默认是关闭的
              -u [ --username ] arg    用户名
              -p [ --password ] arg    密码
              --dbpath arg             指定连接数据库后访问数据的位置,但是不能是当前使用的目录
              --directoryperdb         为每一个库建立一个目录。
              -d [ --db ] arg          指定要备份的库名
              -c [ --collection ] arg  指定要导出的collection
              --objcheck              插入前检测对象的合法性
              --filter arg            插入前的过滤器
              --drop                  在导入前删除要导入的集合
              --oplogReplay           恢复日志时间点

        测试,首先查看要测试的数据库(mytest)文件大写
        > show dbs
        admin    (empty)
        mytest    1.953125GB
        开始备份,将本地mytest库导出到tmp目录下
        # mongodump  -d mytest -o /tmp
        导出结束耗时如下
        real    0m5.412s
        user    0m0.007s
        sys    0m2.039s
        导出后数据存为bson格式体积为577M。mytest库里存的是MP3所以导出数据库压缩的不多。

        开始做恢复测试,首先删除mytest库,在导入
        # mongorestore --directoryperdb -d mytest  /tmp/mytest
        导入结束耗时如下:
        real    0m52.587s
        user    0m0.514s
        sys    0m1.732s
       
        总结:导入时间大约是导出时间的10倍。

b)导出json格式
        虽然导出速度快,但是导出为json,csv可能对某些数据类型不兼容,并且不保证数据可以完整导入。
    所以只简单记录一下,就不是实验了。
    导出命令mongoexport
        参数
              -q [ --query ] arg      query filter, as a JSON string
              --csv                   export to csv instead of json
              --jsonArray             output to a json array rather than one object per
                                      line
       
       
    恢复命令mongoimport
    参数
              --ignoreBlanks          在csv,tsv文件中忽略空域
              --type arg              指定导入文件的类型,默认为json,也可以是csv,tsv
              --drop                  导入前先删除原collection
              --headerline            仅导入CSV,TSV文件的第一行作为头文件
              --upsert                插入或更新已存在的对象
              --upsertFields arg      comma-separated fields for the query part of the
                                      upsert. You should make sure this is indexed
              --stopOnError           当导入出现错误时停止
              --jsonArray             导入json array,目前每个array的限制是4M

posted @ 2011-07-10 20:15  google4y  阅读(503)  评论(0编辑  收藏  举报
不在家,就在公司,不在公司,就在去公司的路上,無家無根,如風如萍,只有漂