数据库之MongoDB
安装MongoDB
https://docs.mongodb.com/guides/server/install/
参考 https://www.cnblogs.com/quickcodes/p/5390482.html
基本使用
mongodb数据库的命令
查看当前的数据库:db 查看所有的数据库:show dbs /show databases 切换数据库:use db_name 删除当前的数据库:db.dropDatabase()
mongodb集合的命令
不手动创建集合: 向不存在的集合中第⼀次加⼊数据时, 集合会被创建出来 手动创建结合: db.createCollection(name,options) db.createCollection("stu") db.createCollection("sub", { capped : true, size : 10 } ) 参数capped: 默认值为false表示不设置上限,值为true表示设置上限 参数size: 当capped值为true时, 需要指定此参数, 表示上限⼤⼩,当⽂档达到上 限时, 会将之前的数据覆盖, 单位为字节 查看集合:show collections 删除集合:db.集合名称.drop()
mongodb中常见的数据类型
常见类型 Object ID: ⽂档ID String: 字符串, 最常⽤, 必须是有效的UTF-8 Boolean: 存储⼀个布尔值, true或false Integer: 整数可以是32位或64位, 这取决于服务器 Double: 存储浮点值 Arrays: 数组或列表, 多个值存储到⼀个键 Object: ⽤于嵌⼊式的⽂档, 即⼀个值为⼀个⽂档 Null: 存储Null值 Timestamp: 时间戳, 表示从1970-1-1到现在的总秒数 Date: 存储当前⽇期或时间的UNIX时间格式 注意点 创建日期语句如下 :参数的格式为YYYY-MM-DD new Date('2017-12-20') 每个文档都有一个属性, 为_id, 保证每个文档的唯一性 可以自己去设置_id插入文档,如果没有提供, 那么MongoDB为每个文档提供了一个独特的_id, 类型为objectID objectID是一个12字节的十六进制数,每个字节两位,一共是24 位的字符串: 前4个字节为当前时间戳 接下来3个字节的机器ID 接下来的2个字节中MongoDB的服务进程id 最后3个字节是简单的增量值
mongodb的增删改查
mongodb的插入 db.集合名称.insert(document) db.stu.insert({name:'gj',gender:1}) db.stu.insert({_id:"20170101",name:'gj',gender:1}) 插入文档时, 如果不指定_id参数, MongoDB会为文档分配一个唯一的ObjectId mongodb的保存 命令:db.集合名称.save(document) 如果文档的_id已经存在则修改, 如果文档的_id不存在则添加 mongodb的简单查询 命令:db.集合名称.find() mongodb的更新 命令:db.集合名称.update(<query> ,<update>,{multi: <boolean>}) 参数query:查询条件 参数update:更新操作符 参数multi:可选, 默认是false,表示只更新找到的第⼀条记录, 值为true表示把满⾜条件的⽂档全部更新 db.stu.update({name:'hr'},{name:'mnc'}) 更新一条 db.stu.update({name:'hr'},{$set:{name:'hys'}}) 更新一条 db.stu.update({},{$set:{gender:0}},{multi:true}) 更新全部 注意:"multi update only works with $ operators" mongodb的删除 命令:db.集合名称.remove(<query>,{justOne: <boolean>}) 参数query:可选,删除的⽂档的条件 参数justOne:可选, 如果设为true或1, 则只删除⼀条, 默认false, 表示删除多条
mongodb的高级查询
数据查询 方法find(): 查询 db.集合名称.find({条件⽂档}) 方法findOne():查询,只返回第⼀个 db.集合名称.findOne({条件⽂档}) 方法pretty(): 将结果格式化 db.集合名称.find({条件⽂档}).pretty() 比较运算符 {"name" : "郭靖", "hometown" : "蒙古", "age" : 20, "gender" : true } {"name" : "⻩蓉", "hometown" : "桃花岛", "age" : 18, "gender" : false } {"name" : "华筝", "hometown" : "蒙古", "age" : 18, "gender" : false } {"name" : "⻩药师", "hometown" : "桃花岛", "age" : 40, "gender" : true } {"name" : "段誉", "hometown" : "⼤理", "age" : 16, "gender" : true } {"name" : "段王爷", "hometown" : "⼤理", "age" : 45, "gender" : true } {"name" : "洪七公", "hometown" : "华⼭", "age" : 18, "gender" : true } 等于: 默认是等于判断, 没有运算符 小于:$lt (less than) 小于等于:$lte (less than equal) 大于:$gt (greater than) 大于等于:$gte 不等于:$ne 逻辑运算符 逻辑运算符主要指与、或逻辑 and:在json中写多个条件即可 查询年龄⼤于或等于18, 并且性别为true的学生 db.stu.find({age:{$gte:18},gender:true}) or:使⽤$or, 值为数组, 数组中每个元素为json 查询年龄⼤于18, 或性别为false的学⽣ db.stu.find({$or:[{age:{$gt:18}},{gender:false}]}) 查询年龄⼤于18或性别为男⽣, 并且姓名是郭靖 db.stu.find({$or:[{age:{$gte:18}},{gender:true}],name:'gj'}) 范围运算符 使⽤$in, $nin 判断数据是否在某个数组内 查询年龄为18、 28的学⽣ db.stu.find({age:{$in:[18,28,38]}}) 支持正则表达式 使用//或$regex编写正则表达式 查询sku以abc开头的数据 db.products.find({sku:/^abc/}) 查询sku以789结尾的数据 db.products.find({sku:{$regex:'789$'}}) skip和limit 方法limit(): 用于读取指定数量的文档 db.集合名称.find().limit(NUMBER) 查询2条学⽣信息 db.stu.find().limit(2) 方法skip(): 用于跳过指定数量的文档 db.集合名称.find().skip(NUMBER) db.stu.find().skip(2) 同时使用 db.stu.find().limit(4).skip(5) 或 db.stu.find().skip(5).limit(4) 注意:先使用skip在使用limit的效率要高于前者 自定义查询* 由于mongo的shell是一个js的执行环境 使⽤$where后⾯写⼀个函数, 返回满⾜条件的数据 查询年龄⼤于30的学⽣ db.stu.find({ $where:function() { return this.age>30;} }) 投影 在查询到的返回结果中, 只选择必要的字段 命令:db.集合名称.find({},{字段名称:1,...}) 参数为字段与值, 值为1表示显示, 值为0不显 特别注意: 对于_id列默认是显示的, 如果不显示需要明确设置为0 db.stu.find({},{_id:0,name:1,gender:1}) 排序 方法sort(),用于对集合进行排序 命令:db.集合名称.find().sort({字段:1,...}) 参数1为升序排列 参数-1为降序排列 根据性别降序, 再根据年龄升序 db.stu.find().sort({gender:-1,age:1}) 统计个数 方法count()用于统计结果集中⽂档条数 命令:db.集合名称.find({条件}).count() 命令:db.集合名称.count({条件}) db.stu.find({gender:true}).count() db.stu.count({age:{$gt:20},gender:true}) 消除重复 方法distinct()对数据进⾏去重 命令:db.集合名称.distinct('去重字段',{条件}) db.stu.distinct('hometown',{age:{$gt:18}})
聚合操作
1. mongodb的聚合是什么
聚合(aggregate)是基于数据处理的聚合管道,每个文档通过一个由多个阶段(stage)组成的管道,可以对每个阶段的管道进行分组、过滤等功能,然后经过一系列的处理,输出相应的结果。
语法:db.集合名称.aggregate({管道:{表达式}})
mongodb的常用管道和表达式
常用管道命令 在mongodb中,文档处理完毕后, 通过管道进⾏下⼀次处理 常用管道命令如下: $group: 将集合中的文档分组, 可⽤于统计结果 $match: 过滤数据, 只输出符合条件的文档 $project: 修改输⼊文档的结构, 如重命名、 增加、 删除字段、 创建计算结果 $sort: 将输⼊文档排序后输出 $limit: 限制聚合管道返回的文档数 $skip: 跳过指定数量的文档, 并返回余下的文档 常用表达式 表达式:处理输入文档并输出 语法:表达式:'$列名' 常⽤表达式: $sum: 计算总和, $sum:1 表示以⼀倍计数 $avg: 计算平均值 $min: 获取最小值 $max: 获取最大值 $push: 在结果文档中插入值到一个数组中 管道命令之$group 按照某个字段进行分组 $group是所有聚合命令中用的最多的一个命令,用来将集合中的文档分组,可用于统计结果 使用示例如下 db.stu.aggregate( {$group: { _id:"$gender", counter:{$sum:1} } } ) 其中注意点: db.db_name.aggregate是语法,所有的管道命令都需要写在其中 _id 表示分组的依据,按照哪个字段进行分组,需要使用$gender表示选择这个字段进行分组 $sum:1 表示把每条数据作为1进行统计,统计的是该分组下面数据的条数 group by null 当我们需要统计整个文档的时候,$group 的另一种用途就是把整个文档分为一组进行统计 使用实例如下: db.stu.aggregate( {$group: { _id:null, counter:{$sum:1} } } ) 其中注意点:_id:null 表示不指定分组的字段,即统计整个文档,此时获取的counter表示整个文档的个数 数据透视 正常情况在统计的不同性别的数据的时候,需要知道所有的name,需要逐条观察,如果通过某种方式把所有的name放到一起,那么此时就可以理解为数据透视 使用示例如下: 统计不同性别的学生 db.stu.aggregate( {$group: { _id:null, name:{$push:"$name"} } } ) 使用$$ROOT可以将整个文档放入数组中 db.stu.aggregate( {$group: { _id:null, name:{$push:"$$ROOT"} } } ) 管道命令之$match match用于进行数据的过滤,是在能够在聚合操作中使用的命令,和find区别在于$match 操作可以把结果交给下一个管道处理,而find不行 使用示例如下: 查询年龄大于20的学生 db.stu.aggregate( {$match:{age:{$gt:20}} ) 查询年龄大于20的男女学生的人数 db.stu.aggregate( {$match:{age:{$gt:20}} {$group:{_id:"$gender",counter:{$sum:1}}} ) 管道命令之$project $project用于修改文档的输入输出结构,例如重命名,增加,删除字段 使用示例如下: 查询学生的年龄、姓名,仅输出年龄姓名 db.stu.aggregate( {$project:{_id:0,name:1,age:1}} ) 查询男女生人生,输出人数 db.stu.aggregate( {$group:{_id:"$gender",counter:{$sum:1}}} {$project:{_id:0,counter:1}} ) 管道命令之$sort $sort用于将输入的文档排序后输出 使用示例如下: 查询学生信息,按照年龄升序 db.stu.aggregate({$sort:{age:1}}) 查询男女人数,按照人数降序 db.stu.aggregate( {$group:{_id:"$gender",counter:{$sum:1}}}, {$sort:{counter:-1}} ) 管道命令之$skip 和 $limit $limit限制返回数据的条数 $skip 跳过指定的文档数,并返回剩下的文档数 同时使用时先使用skip在使用limit 使用示例如下: 查询2条学生信息 db.stu.aggregate( {$limit:2} ) 查询从第三条开始的学生信息 db.stu.aggregate( {$skip:3} ) 统计男女生人数,按照人数升序,返回第二条数据 db.stu.aggregate( {$group:{_id:"$gender",counter:{$sum:1}}}, {$sort:{counter:-1}}, {$skip:1}, {$limit:1} )
索引
为什么mongdb需要创建索引 加快查询速度 进行数据的去重 创建简单的索引方法 语法: db.集合.ensureIndex({属性:1}),1表示升序, -1表示降序 db.集合.createIndex({属性:1}) 上面两个命令效果等价 例子: db.t1.find({name:'test10000'}) db.t1.find({name:'test10000'}).explain('executionStats') 索引的查看 默认情况下_id是集合的索引 查看方式:db.collection_name.getIndexes() 创建唯一索引 在默认情况下mongdb的索引字段的值是可以相同的,仅仅能够提高查询速度 语法: db.collection_name.ensureIndex({"name":1},{"unique":true}) 删除索引 语法:db.t1.dropIndex({'索引名称':1}) 创建复合索引 在进行数据去重的时候,可能用多个字段来保证数据的唯一性,这个时候可以考虑建立复合索引来实现。 语法: db.collection_name.ensureIndex({字段1:1,字段2:1}) 建立索引注意点 根据需要选择是否需要建立唯一索引 索引字段是升序还是降序在单个索引的情况下不影响查询效率,但是带复合索引的条件下会有影响
备份与恢复
备份 备份的语法:mongodump -h dbhost -d dbname -o dbdirectory -h: 服务器地址, 也可以指定端⼝号 -d: 需要备份的数据库名称 -o: 备份的数据存放位置, 此目录中存放着备份出来的数据 示例:mongodump -h 127.0.0.1:27017 -d test01 -o ~/Desktop/test1bak 恢复 恢复语法:mongorestore -h dbhost -d dbname --dir dbdirectory -h: 服务器地址 -d: 需要恢复的数据库实例 --dir: 备份数据所在位置 示例:mongorestore -h 127.0.0.1:27017 -d test2 --dir ~/Desktop/test1bak/test1
谢谢