打赏

MongoDB数据库详解

第1章 数据库管理系统

1.1 前言

01.数据的定义:文字、图像、地理位置信息(坐标、经纬度)等

02.数据库管理系统的定义:建立、存取和管理数据,保证数据安全和完整性的软件

03.常见的数据库管理系统:

关系型:MySQL、Oracle、SQL Server、Db2等
非关系型:MongoDB、Redis、HBase等

数据库管理系统使用情况排名https://db-engines.com/en/ranking

1.2 NoSQL简介

NoSQL=Not Only SQL,支持类似SQL的功能, 与Relational Database相辅相成

其适用于性能较高,不使用SQL意味着没有结构化的存储要求(SQL为结构化的查询语句),没有约束之后架构更加灵活

1.2.1 NoSQL数据库四大家族

列存储:Hbase

键值(Key-Value)存储:Redis

图像存储:Neo4J

文档存储:MongoDB

1.2.2 NoSQL的优势

高可扩展性、分布式计算、没有复杂的关系、低成本、架构灵活、半结构化数据

 

第2章 MongoDB

2.1 MongoDB特性

即最像关系型数据库的NoSQL

 

MongoDB与RDBMS的最大区别:

没有固定的行列组织数据结构,即无需将不同类的数据放入多张表中建立对应关系并分别存储其数据,而是直接放入一份文档进行存储

2.1.1 数据存储格式

01. JSON

MongoDB使用JSON(JavaScript ObjectNotation)文档存储记录

JSON数据库语句可以容易被解析

Web应用大量使用

NAME-VALUE配对

02. BSON

二进制的JSON,JSON文档的二进制编码存储格式

BSON有JSON没有的Date和BinData

MongoDB中document以BSON形式存放

数据格式灵活-文档里嵌入文档

1 {
2 _id: ObjectID("1"),
3 username: “Silence”,
4 regDate: “10-10-2015”,
5 scores: {
6 math: "80",
7 english: "200"
8   }
9 }

2.2 MongoDB优势

MongoDB是开源产品,On GitHub,Licensed under the AGPL,起源&赞助by MongoDB公司,提供商业版licenses许可

01.功能

JSON文档模型、动态的数据模式、二级索引强大(特有)、查询功能、自动分片、水平扩展、自动复制、高可用、文本搜索、企业级安全、聚合框架MapReduce、大文件存储GridFS、地理位置索引

支持多种存储引擎:

 

02.存储引擎比较

 

MySQL

InnoDB

MongoDB

MAPI

MongoDB

WiredTiger

事务

YES

NO

NO

锁粒度

ROW-level行级锁

Collection-level

Document-level

Geospatial

YES

YES

YES

MVCC

YES

NO

NO

Replication

YES

YES

YES

外键

YES

NO

NO

数据库集群

NO

YES

YES

B-TREE索引

YES

YES

YES

全文检索

YES

YES

YES

数据压缩

YES

NO

YES

存储限制

64TB

NO

NO

表分区

YES

YES(分片)

YES(分片)

03.数据库功能和性能分布图

 

2.3 数据逻辑结构

2.3.1 层次关系

文档(document)、集合(collection)、数据库(database)

2.3.2 层次关系图

 

2.3.3 MongoDB与RDBMS数据结构逻辑对比

MongoDB

VS

RDBMS

集合Collection

->

表Table

文档Document

->

行Row

数据库Database

 

数据库Database

索引值Index

->

索引值Index

嵌入式文件Embedded Document

->

合并Join

引用Reference

->

外键Foreign Key

分片Shard

->

分区Partition

2.4 MongoDB适用场景

1)网站数据:MongoDB 非常适合实时的插入,更新与查询,并具备网站实时数据存储所需的复制及高度伸缩性
2)缓存:由于性能很高,MongoDB 也适合作为信息基础设施的缓存层。在系统重启之后,由 MongoDB 搭建的持久化缓存层可以避免下层的数据源过载
3)大尺寸,低价值的数据:使用传统的关系型数据库存储一些数据时可能会比较昂贵,在此之前,很多时候程序员往往会选择传统的文件进行存储
4)高伸缩性的场景:MongoDB 非常适合由数十或数百台服务器组成的数据库。MongoDB的路线图中已经包含对 MapReduce 引擎的内置支持
5)用于对象及 JSON 数据的存储:MongoDB 的 BSON 数据格式非常适合文档化格式的存储及查询

2.4.1 MongoDB使用场景

1 我的数据量是有亿万级或者需要不断扩容 
2 需要2000-3000以上的读写每秒
3 新应用,需求会变,数据模型无法确定
4 我需要整合多个外部数据源
5 我的系统需要99.999%高可用
6 我的系统需要大量的地理位置查询
7 我的系统需要提供最小的latency
8 我要管理的主要数据对象 <10

说明:以上条件满足一个可以考虑MongoDB,满足两个选择MongoDB不会后悔

 

第3章 MongoDB软件安装

3.1 前提条件

官方下载地址www.mongodb.com

安装文档地址
docs.mongodb.com
mongoing.com

软件所支持的平台(X86_64)

  在3.4版更改:MongoDB不再支持32位的x86平台

 

注意:切记在选择mongodb版本时要确认支持/兼容哪些操作系统及版本信息,如使用3.2版本需安装在CentOS6.2级以上操作系统

3.1.1 安装前准备

01.准备Redhat或Centos6.2以上系统

02.系统开发包完整

03.关闭iptables及Selinux

04.配置IP地址和hosts解析

05.关闭hugepage大页内存

06.创建所需用户mongod(非root用户)

07.创建所需目录,并授权

3.1.1.1  具体步骤

1 [root@mongodb ~]# cat /etc/redhat-release
2 CentOS release 6.9 (Final)
3 
4 [root@mongodb ~]# uname -r
5 2.6.32-696.el6.x86_64
6 
7 [root@mongodb ~]# uname -m
8 x86_64

 

1 /etc/init.d/iptables status
2 getenforce
3 ip a
4 echo "10.0.0.51 mongodb" >>/etc/hosts
5 
6 /etc/init.d/mysqld stop   #若存在mysql程序需提前关闭以防止程序冲突

关闭大页内存机制以提高性能

1 vim /etc/rc.local
2 
3 #以root用户身份在最后一行添加如下代码,重启生效
4 if test -f /sys/kernel/mm/transparent_hugepage/enabled; then
5   echo never > /sys/kernel/mm/transparent_hugepage/enabled
6 fi
7 if test -f /sys/kernel/mm/transparent_hugepage/defrag; then
8    echo never > /sys/kernel/mm/transparent_hugepage/defrag
9 fi

系统关闭参照官方文档https://docs.mongodb.com/manual/tutorial/transparent-huge-pages/

3.2 安装及启动

01.创建所需用户和组

 1 groupadd -g 800 mongod 2 useradd -u 801 -g mongod mongod 3 passwd mongod 

02.创建mongodb所需目录结构

 1 mkdir -p /application/mongodb/{bin,conf,log,data} 

03.上传并解压软件到指定位置

1 cd /application/
2 
3 rz#上传mongodb-linux-x86_64-3.2.8.tgz包
4 
5 tar -zxvf mongodb-linux-x86_64-3.2.8.tgz
6 cd mongodb-linux-x86_64-3.2.8/bin/
7 cp -a * /application/mongodb/bin

04.设置目录结构权限

 1 chown -R mongod:mongod /application/mongodb 

05.设置用户环境变量

1 su - mongod

2

3 vim .bash_profile

4 export PATH=/application/mongodb/bin:$PATH

5

6 source .bash_profile 

06.启动mongodb(无需初始化)

 1 mongod --dbpath=/application/mongodb/data --logpath=/application/mongodb/log/mongodb.log --port=27017 --logappend --fork 

说明:在启动mongodb要指定数据、日志路径及端口号(默认也可以)

06.1成功标识

about to fork child process, waiting until server is ready for connections.
forked process: 1294
child process started successfully, parent exiting

3.2.1 mongodb启动参数详解

mongod参数

参数说明

--dbpath

数据存放路径

--logpath

日志文件路径

--logappend

日志输出方式->以追加模式进行记录,默认覆盖记录

--port

启用端口号

--fork

以后台守护进程的方式启动

--auth

是否需要验证权限登录(用户名和密码)

--bind_ip

限制访问的ip

 

07.编辑配置文件->以读取配置文件的方式来启动数据库

1 vim /application/mongodb/conf/mongod.conf
2 
3 dbpath=/application/mongodb/data
4 logptah=/application/mongodb/log/mongodb.log
5 port=27017
6 logappend=1
7 fork=1

08.指定配置文件启动/关闭mongod

1 mongod -f /application/mongodb/conf/mongod.conf #启动数据库

2 mongod -f /application/mongodb/conf/mongod.conf shutdown #关闭 

09.登录mongodb

1 mongo
2 
3 ###此时已登陆mongodb系统,以下为提示信息###
4 MongoDB shell version: 3.2.8
5 connecting to: test
6 > 

说明:

01.初次登录时默认提示版本号信息及连接数据库test,但是在MongoDB中test数据库默认并不存在

02.对于3.2以上版本默认只有一个admin数据库,且无需提前创建,不存在的库也能够正常use

3.2.2 启动时报错:"WARNING: soft rlimits too low. rlimits set to 1024 processes, 64000 files. Number of processes should be at least 32000 : 0.5 times number of files"的类似错误

报错原因:rlimits设置过小,其设置几乎不能满足MongoDB运行所需的最小条件,会导致它运行缓慢甚至出现不可知的错误

解决思路:

01.查看当前的MongoDB进程信息

1 ps -ef | grep mongod
2 
3 #结果如下
4 mongod     1982      1  0 11:47 ?        00:00:16 mongod --dbpath=/application/mongodb/data --logpath=/application/mongodb/log/mongodb.log --port=27017 --logappend --fork
5 root       2056   1566  0 12:21 pts/1    00:00:00 grep --color=auto mongod

02.查看mongod进程的系统限制

1 cat /proc/1982/limits
2 
3 #结果如下
4 Limit             Soft Limit(软限制->最小值) Hard Limit(硬限制->最大值) Units
5 Max processes      1024                     64000                   processes
6 Max open files      65535                    65535                   files

解决方法:

①方法一

1 vim /etc/security/limits.d/90-nproc.conf

2 * soft nproc 32000 #此为修改后结果,reboot重启生效 

②方法二

1 vim /etc/security/limits.conf
2 
3 # End of file
4 mongod soft nofile 64000
5 mongod hard nofile 64000
6 mongod soft nproc 32000 
7 mongod hard nproc 32000

查看系统限制

 1 ulimit -a 

#也可利用ulimit [-ftvnmu]命令在shell命令行中直接进行设置

#但若要系统启动时在所有窗口生效,需将上面的ulimit添加到/etc/profile

3.2.3 YAML模式编写配置文件

 1 systemLog:
 2    destination: file
 3    path: "/application/mongodb/log/mongod.log"
 4    logAppend: true
 5 storage:
 6    journal:
 7       enabled: true
 8    dbPath: "/application/mongodb/data"
 9 processManagement:
10    fork: true
11 net:
12    port: 27017

此时关闭mongodb重新启动即可

3.2.4 MongoDB的关闭方式

3.2.4.1  kill进程模式(不建议使用)

1 $ kill -2 PID #原理:-2表示向mongod进程发送SIGINT信号

2

3 $ kill -4 PID #原理:-4表示向mognod进程发送SIGTERM信号 

3.2.4.2  自带模式

1 use admin
2 
3 admin> db.adminCommand({shutdown:1})
4 5 $ mongod -f mongodb.conf --shutdown
6 killing process with pid: 1621

注意:

01.mongod进程收到SIGINTSIGTERM信号,会做一些处理

02.切忌使用kill -9

3.2.5 编辑脚本实现SYS-V形式启动mongod

 1 vim /etc/rc.d/init.d/mongod
 2 #!/bin/bash
 3 #
 4 #chkconfig: 2345 80 90
 5 #description:mongodb
 6 MONGODIR=/application/mongodb
 7 MONGOD=$MONGODIR/bin/mongod
 8 MONGOCONF=$MONGODIR/conf/mongod1.conf
 9 start() {
10  su - mongod -c "$MONGOD -f $MONGOCONF"
11 }
12 
13 stop() {
14 su - mongod -c "$MONGOD -f $MONGOCONF --shutdown"
15 }
16 
17 case "$1" in
18   start)
19  start
20  ;;
21   stop)
22  stop
23  ;;
24   restart)
25  stop
26 sleep 2
27  start
28  ;;
29   *)
30  echo $"Usage: $0 {start|stop|restart}"
31  exit 1
32 esac
33 
34 
35 chmod +x /etc/init.d/mongod
mongod.conf

3.3 基本操作及使用

获取帮助

 1 > help 

    db.help()                    help on db methods
    db.mycoll.help()             help on collection methods
    sh.help()                    sharding helpers
    rs.help()                    replica set helpers
    help admin                   administrative help
    help connect                 connecting to a db help
    help keys                    key shortcuts
    help misc                    misc things to know
    help mr                      mapreduce

    show dbs                     show database names
    show collections             show collections in current database
    show users                   show users in current database
    show profile                 show most recent system.profile entries with time >= 1ms
    show logs                    show the accessible logger names
    show log [name]              prints out the last segment of log in memory, 'global' is default
    use <db_name>                set current database
    db.foo.find()                list objects in collection foo
    db.foo.find( { a : 1 } )     list objects in foo where a == 1
    it                           result of the last line evaluated; use to further iterate
    DBQuery.shellBatchSize = x   set default number of items to display on shell
    exit                         quit the mongo shell
help帮助信息

查看当前db版本

1 > db.version()

2 3.2.8 

查看当前使用db

1 > db

2 test

3

4 > db.getName()

5 test 

查询所有数据库

1 > show dbs

2 local 0.000GB 

切库

1 > use test

2 switched to db test 

显示当前数据库状态

 1 > db.stats()
 2 {
 3     "db" : "local",
 4     "collections" : 1,
 5     "objects" : 7,
 6     "avgObjSize" : 1466,
 7     "dataSize" : 10262,
 8     "storageSize" : 36864,
 9     "numExtents" : 0,
10     "indexes" : 1,
11     "indexSize" : 36864,
12     "ok" : 1
13 }

查看当前数据库的连接机器地址

1 > db.getMongo()

2 connection to 127.0.0.1 

创建数据库

当使用use命令时系统会自动创建一个数据库,如果use之后没有创建任何集合,系统就会删除这个数据库

 1 > use banana

2 switched to db banana 

 删除数据库

如果没有选择任何数据库,会删除默认的test数据库

1 > db.dropDatabase()
2 { "ok" : 1 }
3 > show dbs;
4 local  0.000GB

 

创建集合

方法1:

1 > use banana;
2 switched to db banana        #相当于use banana ,不同的是(从mysql关系型数据库角度解释),在mongodb中banana允许未创建情况下use banana,在创建数据表后,即创建了banana,否则banana不会创建
3 > db.createCollection('a'); #创建集合a,a相当于mysql中的数据表
4 { "ok" : 1 }                # 提示创建成功
5 > db.createCollection('b');
6 { "ok" : 1 }
7 > show collections;
8 a
9 b

 方法2:

 1 > db.c.insert({username:"mongodb"})   #向c集合插入数据
 2 WriteResult({ "nInserted" : 1 })   ->成功写入文档
 3 
 4 > show collections
 5 a
 6 b
 7 c
 8 > db.c.find()   #显示数据集合中所有数据,当前仅一条
 9 { "_id" : ObjectId("5743c9a9bf72d9f7b524713d"), "username" : "mongodb" }
10 > db.log.find().pretty();   # 格式化打印结果
11 {
12     "_id" : ObjectId("5743c9a9bf72d9f7b524713d"),
13     "uid" : 0,
14     "name" : "mongodb",
15     "age" : 6,
16     "date" : ISODate("2018-01-03T08:37:00.214Z")
17 }
18 
19 > db.c.drop()   #删除c集合
20 true
21 > db.c.find()   #c集合置空

批量插入数据

1 > for(i=0;i<10000;i++){ db.log.insert({"uid":i,"name":"mongodb","age":6,"date":new Date()}); }   #批量插入10000个数据
2 
3 #查询集合中的记录数
4 > db.log.find()
说明:默认每页显示20条记录,当显示不下的的情况下,可以用it迭代命令查询下一页数据
 1 #设置每页显示数据的大小:每页显示50条记录
 2 > DBQuery.shellBatchSize=50; 
 3 #查看第1条记录
 4 > db.log.findOne() 
 5 #查询总的记录数
 6 > db.log.count()
 7 #删除集合中所有记录
 8 > db.log.remove({})
 9 #集合中数据的原始大小
10 > db.log.dataSize()
11 #集合中索引数据的原始大小
12 > db.log.totalIndexSize()
13 #集合中索引+数据压缩存储之后的大小
14 > db.log.totalSize()
15 #集合中数据压缩存储的大小
16 > db.log.storageSize()

 

此笔记是本人学习摘记整理而成,此为初稿(尚有诸多不完善之处),原创作品允许转载,转载时请务必以超链接形式标明文章原始出处,作者信息和本声明,否则将追究法律责任。

作者:banana童

出处:http://www.cnblogs.com/bananaaa/

 

posted @ 2018-01-05 14:34  banana童  阅读(18846)  评论(0编辑  收藏  举报