MongoDB【基础介绍，find, limit, skip,投影，排序,统计个数，消除重复】

NOSQL的优势

易扩展：NoSQL数据库种类繁多，但是一个共同的特点都是去掉关系数据库的关系型特性。数据之间无关系，这样就非常容易扩展
大数据量，高性能：NoSQL数据库都具有非常高的读写性能，尤其在大数据量下，同样表现优秀。这得益于它的无关系性，数据库的结构简单
灵活的数据模型：NoSQL无需事先为要存储的数据建立字段，随时可以存储自定义的数据格式。而在关系数据库里，增删字段是一件非常麻烦的事情。如果是非常大数据量的表，增加字段简直就是一个噩梦
高可用：NoSQL在不太影响性能的情况，就可以方便的实现高可用的架构

结论

NoSQL数据库的出现，弥补了关系数据（比如MySQL）在某些方面的不足，在某些方面能极大的节省开发成本和维护成本
MySQL和NoSQL都有各自的特点和使用的应用场景，两者的紧密结合将会给数据库发展带来新的思路。让关系数据库关注在关系上，NoSQL关注在存储上

Nosql相关介绍

nosql官网http://nosql-database.org/
为什么使用nosql http://www.infoq.com/cn/news/2011/01/nosql-why/
查看官方文档https://www.mongodb.com/
菜鸟教程http://www.runoob.com/mongodb/nosql.html

专有名词

SQL术语/概念	MongoDB术语/概念	解释/说明
database	database	数据库
table	collection	数据库表/集合
row	document	数据记录行/文档
column	field	数据字段/域
index	index	索引
table joins		表连接,MongoDB不支持
primary key	primary key	主键,MongoDB自动将_id字段设置为主键

MongoDB特点

模式自由 :可以把不同结构的文档存储在同一个数据库里
面向集合的存储：适合存储 JSON风格文件的形式
完整的索引支持：对任何属性可索引
复制和高可用性：支持服务器之间的数据复制，支持主-从模式及服务器之间的相互复制。复制的主要目的是提供冗余及自动故障转移
自动分片：支持云级别的伸缩性：自动分片功能支持水平的数据库集群，可动态添加额外的机器
丰富的查询：支持丰富的查询表达方式，查询指令使用JSON形式的标记，可轻易查询文档中的内嵌的对象及数组
快速就地更新：查询优化器会分析查询表达式，并生成一个高效的查询计划
高效的传统存储方式：支持二进制数据及大型对象（如照片或图片）

MongoDB 三元素

三元素：数据库，集合，文档
数据库：是一个集合的物理容器，一个数据库中可以包含多个文档
集合就是关系数据库中的表
文档对应着关系数据库中的行
文档，就是一个对象，由键值对构成，是json的扩展Bson形式

{'name':'guojing','gender':'男'}

集合：类似于关系数据库中的表，储存多个文档，结构不固定，如可以存储如下文档在一个集合中

{'name':'guojing','gender':'男'}
{'name':'huangrong','age':18}
{'book':'shuihuzhuan','heros':'108'}

安装

下载mongodb的版本，两点注意
- 根据业界规则，偶数为稳定版，如1.6.X，奇数为开发版，如1.7.X
- 32bit的mongodb最大只能存放2G的数据，64bit就没有限制
到官网，选择合适的版本下载
解压

tar -zxvf mongodb-linux-x86_64-ubuntu1604-3.4.0.tgz

sudo mv -r mongodb-linux-x86_64-ubuntu1604-3.4.0/ /usr/local/mongodb

将可执行文件添加到PATH路径中

export PATH=/usr/local/mongodb/bin:$PATH

服务端

服务的命令为mongod，可以通过help查看所有参数

mongod --help

配置文件在/etc/mongod.conf，默认端口为27017

sudo vi /etc/mongod.conf

推荐使用服务的方式管理
启动

sudo service mongod start

停止

sudo service mongod stop

重启

sudo service mongod restart

启动后查看进程，以确定是否启动成功

ps ajx|grep mongod

如果进程中没有mongod的项则没有启动成功，可以通过查看日志来确定错误原因，日志目录为/var/log/mongodb/mongod.log，最新的信息在最下边

客户端

客户端命令为mongo，可以通过help查看所有参数
这个shell即是mongodb的客户端，也是一个js的编译器

mongo --help

终端退出连接

exit
或ctrl+c

GUI：robomongo
将压缩包放到ubuntu中解压

tar zxvf robomongo-0.9.0-linux-x86_64-0786489.tar.gz

进入解压后的目录，在bin目录下找到运行程序

robomongo

数据库命令

连接成功后，默认使用test数据库
查看当前数据库名称

db

查看所有数据库名称，列出所有在物理上存在的数据库

show dbs

切换数据库，如果数据库不存在也并不创建，直到插入数据或创建集合时数据库才被创建

use 数据库名称

删除当前指向的数据库，如果数据库不存在，则什么也不做

db.dropDatabase()

集合命令

创建语法如下
name是要创建的集合的名称
options是一个文档，用于指定集合的配置，选项参数是可选的，所以只需要到指定的集合名称
可以不手动创建集合，向不存在的集合中第一次加入数据时，集合会被创建出来

db.createCollection(name, options)

例1：不限制集合大小

db.createCollection("stu")

例2：限制集合大小，后面学会插入语句后可以查看效果
参数capped：默认值为false表示不设置上限，值为true表示设置上限
参数size：当capped值为true时，需要指定此参数，表示上限大小，当文档达到上限时，会将之前的数据覆盖，单位为字节

db.createCollection("sub", { capped : true, size : 10 } )

查看当前数据库的集合

show collections

删除命令

db.集合名称.drop()

插入

语法

db.集合名称.insert(document)

插入文档时，如果不指定_id参数，MongoDB会为文档分配一个唯一的ObjectId
例1

db.stu.insert({name:'gj',gender:1})

例2

s1={_id:'20160101',name:'hr'}
s1.gender=0
db.stu.insert(s1)

简单查询

语法

db.集合名称.find()

更新

语法

db.集合名称.update(<query>,<update>, {multi: <boolean>})

参数query:查询条件，类似sql语句update中where部分
参数update:更新操作符，类似sql语句update中set部分
参数multi:可选，默认是false，表示只更新找到的第一条记录，值为true表示把满足条件的文档全部更新
例3：全文档更新

db.stu.update({name:'hr'},{name:'mnc'})  # 一般不推荐使用，丢失信息，该文档只留下name一个键

例4：指定属性更新，通过操作符$set

db.stu.insert({name:'hr',gender:0})
db.stu.update({name:'hr'},{$set:{name:'hys'}})

例5：修改多条匹配到的数据

db.stu.update({},{$set:{gender:0}},{multi:true})

保存

语法

db.集合名称.save(document)

如果文档的_id已经存在则修改，如果文档的_id不存在则添加合并了insert的功能
例6

db.stu.save({_id:'20160102','name':'yk',gender:1})

例7

db.stu.save({_id:'20160102','name':'wyk'})

删除

语法

db.集合名称.remove(<query>,{justOne: <boolean>})

参数query:可选，删除的文档的条件
参数justOne:可选，如果设为true或1，则只删除一条，默认false，表示删除多条
例8：只删除匹配到的第一条

db.stu.remove({gender:0},{justOne:true})

例9：全部删除

db.stu.remove({})

关于创建集合参数size的示例

创建集合

db.createCollection('sub',{capped:true,size:10})

插入第一条数据库查询

db.sub.insert({title:'linux',count:10})
db.sub.find()

插入第二条数据库查询

db.sub.insert({title:'web',count:15})
db.sub.find()

插入第三条数据库查询

db.sub.insert({title:'sql',count:8})
db.sub.find()

插入第四条数据库查询

db.sub.insert({title:'django',count:12})
db.sub.find()

插入第五条数据库查询

db.sub.insert({title:'python',count:14})
db.sub.find()   # 插入到这里时   查询时会发现插入的第一条会消失，  如果设置了size的大小，当到达最大值时，则会将最顶部的数据顶出集合

创建示例数据

创建集合stu，文档的属性包含：_id、name、hometown、age、gender
示例数据如下：

db.stu.drop()
db.stu.insert({name:'郭靖',hometown:'蒙古',age:20,gender:true})
db.stu.insert({name:'黄蓉',hometown:'桃花岛',age:18,gender:false})
db.stu.insert({name:'华筝',hometown:'蒙古',age:18,gender:false})
db.stu.insert({name:'黄药师',hometown:'桃花岛',age:40,gender:true})
db.stu.insert({name:'段誉',hometown:'大理',age:16,gender:true})
db.stu.insert({name:'段王爷',hometown:'大理',age:45,gender:true})

数据查询

基本查询

方法find()：查询

db.集合名称.find({条件文档})

方法findOne()：查询，只返回第一个

db.集合名称.findOne({条件文档})

方法pretty()：将结果格式化

db.集合名称.find({条件文档}).pretty()

比较运算符

等于，默认是等于判断，没有运算符
小于$lt
小于或等于$lte
大于$gt
大于或等于$gte
不等于$ne

例1：查询名称等于'郭靖'的学生

db.stu.find({name:'郭靖'})

例2：查询年龄大于或等于18的学生

db.stu.find({age:{$gte:18}})

逻辑运算符

查询时可以有多个条件，多个条件之间需要通过逻辑运算符连接
逻辑与：默认是逻辑与的关系
例3：查询年龄大于或等于18，并且性别为true的学生

db.stu.find({age:{$gte:18},gender:true})
db.stu.find({$and:[{age:{$gt:18}},{gender: true}]})    # 两种写法

逻辑或：使用$or，值为数组，数组中每个元素为json
例4：查询年龄大于18，或性别为false的学生

db.stu.find({$or:[{age:{$gt:18}},{gender:false}]})

and和or一起使用
例5：查询年龄大于18或性别为true的学生，并且学生的姓名为gj

db.stu.find({$or:[{age:{$gte:18}},{gender:true}],name:'gj'})

范围运算符

使用"$in"，"$nin" 判断是否在某个范围内
例6：查询年龄为18、28的学生

db.stu.find({age:{$in:[18,28]}})

支持正则表达式

mongodb提供的终端shell，同时也是一个js的执行器，可以编写js的代码和函数
使用//或$regex编写正则表达式
例7：查询姓黄的学生

db.stu.find({name:/^黄/})
db.stu.find({name:{$regex:'^黄'}}})

自定义查询

使用$where后面写一个函数，返回满足条件的数据
例7：查询年龄大于30的学生

db.stu.find({$where:function(){return this.age>30;}})

Limit

方法limit()：用于读取指定数量的文档
语法：

db.集合名称.find().limit(NUMBER)

参数NUMBER表示要获取文档的条数
如果没有指定参数则显示集合中的所有文档
例1：查询2条学生信息

db.stu.find().limit(2)

skip

方法skip()：用于跳过指定数量的文档
语法：

db.集合名称.find().skip(NUMBER)

参数NUMBER表示跳过的记录条数，默认值为0
例2：查询从第3条开始的学生信息

db.stu.find().skip(2)

一起使用

方法limit()和skip()可以一起使用，不分先后顺序
创建数据集

for(i=0;i<15;i++){
    db.t1.insert({_id:i})
}

查询第5至8条数据

db.t1.find().limit(4).skip(5)
或
db.t1.find().skip(5).limit(4)

投影

在查询到的返回结果中，只选择必要的字段，而不是选择一个文档的整个字段
如：一个文档有5个字段，需要显示只有3个，投影其中3个字段即可
语法：
参数为字段与值，值为1表示显示，值为0不显示

db.集合名称.find({},{字段名称:1,...})

对于需要显示的字段，设置为1即可，不设置即为不显示
特殊：对于_id列默认是显示的，如果不显示需要明确设置为0
例1

db.stu.find({},{name:1,gender:1})

例2

db.stu.find({},{_id:0,name:1,gender:1})

排序

方法sort()，用于对结果集进行排序
语法

db.集合名称.find().sort({字段:1,...})

参数1为升序排列
参数-1为降序排列
例1：根据性别降序，再根据年龄升序

db.stu.find().sort({gender:-1,age:1})

统计个数

方法count()用于统计结果集中文档条数
语法

db.集合名称.find({条件}).count()

也可以与为

db.集合名称.count({条件})

例1：统计男生人数

db.stu.find({gender:true}).count()

例2：统计年龄大于20的男生人数

db.stu.count({age:{$gt:20},gender:true})

消除重复

方法distinct()对数据进行去重
语法

db.集合名称.distinct('去重字段',{条件})

例:查找年龄大于18的学生，来自哪些省份

db.stu.distinct('hometown',{age:{$gt:18}})

例:查看年龄大于18或者男生，来自哪些省份

db.stu.distinct('hometown',{$or:[{age:{$gt:18}},{gender:false}]})

数据类型

下表为MongoDB中常用的几种数据类型：
Object ID：文档ID
String：字符串，最常用，必须是有效的UTF-8
Boolean：存储一个布尔值，true或false
Integer：整数可以是32位或64位，这取决于服务器
Double：存储浮点值
Arrays：数组或列表，多个值存储到一个键
Object：用于嵌入式的文档，即一个值为一个文档
Null：存储Null值
Timestamp：时间戳，表示从1970-1-1到现在的总秒数
Date：存储当前日期或时间的UNIX时间格式
创建日期语句如下
注意：参数的格式为YYYY-MM-DD

new Date('2017-12-20')

object id

每个文档都有一个属性，为_id，保证每个文档的唯一性
可以自己去设置_id插入文档
如果没有提供，那么MongoDB为每个文档提供了一个独特的_id，类型为objectID
objectID是一个12字节的十六进制数
- 前4个字节为当前时间戳
- 接下来3个字节的机器ID
- 接下来的2个字节中MongoDB的服务进程id
- 最后3个字节是简单的增量值

posted @ 2017-08-20 17:08 凯哥吧阅读(984) 评论(0) 收藏举报

刷新页面返回顶部

凯哥吧

MongoDB【基础介绍，find, limit, skip,投影，排序,统计个数，消除重复】

NOSQL的优势

结论

Nosql相关介绍

专有名词

MongoDB特点

MongoDB 三元素

安装

服务端

客户端

数据库命令

集合命令

插入

简单查询

更新

保存

删除

关于创建集合参数size的示例

创建示例数据

数据查询

基本查询

比较运算符

逻辑运算符

范围运算符

支持正则表达式

自定义查询

Limit

skip

一起使用

投影

排序

统计个数

消除重复

数据类型

object id

公告