monodb学习笔记(一)

1、MongoDB安装

建议安装 mongodb5.0，这样就不需要太多的手动配置，直接安装

配置环境变量，把安装目录下的bin添加到环境变量中

net start MongoDB  // 启动服务
net stop MongoDB  // 停止服务

注意：如果提示拒绝服务，那么cmd需要以管理的身份进行启动，mongodb的服务端口是27017

mongod --verson    //查看版本
mongo              // 启动mongo命令行管理界面

2、MongoDB的curd操作

创建数据库

use  DATABASE_NAME

如果数据库不存在，则创建数据库，否则切换到指定数据库

show dbs           //查看所有数据库，不包含空数据库
db                //显示当前数据库
show collections  //查看所有集合

在数据库中创建集合

db.createCollection(name, options)

这里的name表示集合的名称， options表示配置

创建集合

db.createCollection('user')  // 创建user的集合

在mongodb不需要去创建集合，当插入数据的时候会自动创建

插入数据

注意：在插入数据的时候，_id表示主键id，如果指定了则以指定的写入，如果不指定，系统会生成一个唯一的主键id

db.COLLECTION_NAME.insertOne({...data})  //插入一条数据

执行插入成功后返回, 相当于是上一语句的返回值

{
        "acknowledged" : true,
        "insertedId" : ObjectId("60fa07d62c50f9abe5c866c8")  //自动生成的id
}

插入多条数据

db.COLLECTION_NAME.insertMany(
    [...data], 
    {
         ordered: <boolean>  // 表示是否以乱序写入，默认是true
    }
)

注意：如果将ordered参数设置为false，mongoDB可以打乱文档的写入的顺序，以便优化写入操作的性能，在以顺序写入时一旦遇到错误，操作就会退出，余下的文档无论正确与否都不会被写入，如果以乱序写入文档，即使某些文档造成了错误，余下的正确文档仍然会被写入

创建多个文档或单个文档

db.COLLECTION_NAME.insert(
    data | [...data],
    {
         ordered: <boolean>
    }
)

注意：这条语句执行成功后，返回的是插入成功的条数，但是如果执行失败，那么将和insertMany的失败结果是一样的

insertOne, insertMany与Insert的区别

三个命令的返回的结果文件格式不一样
insertOne与insertMany不支持db.collection.explain()命令，而insert支持db.collection.explain()命令

当用db.COLLECTION_NAME.save()处理一个新文档的时候，它会调用insert命令，所以返回的结果与Insert一致

ObjectId函数

通常来讲，可以使用ObjectId()来获得一个新的id，也可以使用该方法得到相应的创建时间

ObjectId()    --得到一个新的id
ObjectId('6101d4e05a1ac41c41809c73')  --得到以指定id的ObjectId
ObjectId('6101d4e05a1ac41c41809c73').getTimestamp()  --获得创建的时间

读取数据

命令

db.COLLECTION_NAME.find(query, projection)
-- query 文档定义了读取操作时筛选文档的条件
-- projection 文档定义了对读取结果进行的投射即需要输出的字段

读取全部文档，即不筛选也不投射

db.COLLECTION_NAME.find()  加上.pretty()可以使文档在命令行中显示的更清楚

匹配查询

db.user.find({name: 'abc'})   --表示查询名字为abc的数据
db.user.find({age: {$gt: 15}})  --表示查询年龄大于15的所有数据
db.user.find({name: {$lt: 'f'}})  --表示查询的姓名首字母在f之前的所有数据

比较操作符

$in 匹配字符值与任一查询值相等的文档

$nin 匹配字符值与任一查询值都不相等的文档

db.user.find({name: {$in: ['aaa', 'bbb']}})  --表示读取名字是其中一项的所有组合
db.user.find({name: {$nin:［'aaa', 'bbb']}}) --表示读取的名字不是其中一项的所有组合

逻辑操作符

$not 匹配筛选条件不成立的文档

$and 匹配多个筛选条件全部成立的文档

$or 匹配至少一个筛选条件成立的文档

$nor 匹配多个筛选条件全部不成立的文档

db.user.find({age: {$not: {$gt：12}}})  --表示筛选的数据的年龄小于等于12
db.user.find({$and: [{name: {$eq: 'aaa'}}, {age: {$gt: 5}}]})  --查找所有名字为aaa并且年龄大于5的所有数据
db.user.find({name: 'aaa', age: {$gt: 5}})  --与上面的效果一致
db.user.find({age: {$gt: 2, $lt: 30}}) --表示查找年龄大于2小于30的所有数据

db.user.find({$or: [{name: 'aaa'}, {name: 'bbb'}]})  --查找所有名字等于aaa或bbb的数据
db.user.find({name: {$in: ['aaa', 'bbb']}})  --与上面效果一样，但是命令简洁

db.user.find({$nor: [{name: 'aaa'}, {name: 'bbb'}]})  --表示查询名字即不等于aaa也不等于bbb的所有数据

字段操作符

$exists 匹配包含查询字段的文档，值是true或false

$type 匹配字段类型符合查询值的文档

db.user.find({'age': {$exists: true}})  --表示读取所有含有age字段的所有数据
db.user.find({_id: {$type: “string”}})  --表示读取文档主键是字符串的所有值
db.user.find({_id: {$type: [“string”, “number”]}}) --表示读取文档主键是字符串或数据值
db.user.find({_id: {$type: ["objectId",  "object"]}}) --表示读取文档主键是ObjectId或都是复合主键的情况
db.user.find({name: {$type: “null”}})  --找到所有name的值是null的文档

数组操作符

$all 匹配数组字段中包含所有查询值的文档

$elemMatch 匹配数组字段中至少存在一个值满足筛选条件的文档

--数据：{_id: ***, name: 'aaa', age: '12', addr: ["fujian", 'jiangxi']}

db.user.find('addr': {$all: ['fujian', 'jiangxi']})  --表示匹配到addr这个字段数组里的值，不论顺序，全部匹配即可

db.user.find({addr: {$elemMatch: {$eq: "fujian"}}})  --表示在addr数组字段中包含了fujian这个条件和筛选

db.user.find({addr: {$all: [{$elemMatch: {$eq:'fujian'}}, {$elemMatch: {$eq:'jiangxi'}}]}})  --表示在addr这个数组字段中全部满足匹配指定值

正则操作符

$regex 匹配满足正则表达式的文档

语法

{<field>: { : /pattern/, : '<options>' }}
{<field>: { : /pattern/<options> }}

使用

--在和$in操作符一起使用时，只能使用/prattern/<options>的方式
db.user.find({name: {$in: [/^a/, /^b/]}})  --表示查询name以a或者以b开头的所有字段
db.user.find({name: {$in: [/i/i, /A/i]}})  --表示查询name中包含i与A的所有数据，不区分大小写

--平时推荐使用{<field>: {: /pattern/, : '<options>'}}
db.user.find({name: {$regex: /A/, $options: 'i'}}) --表示查询姓名里包含A的所有数据，不区分大小写

文档游标操作

db.COLLECTION_NAME.find()返回的是一个文档集合游标, 在不迭代游标的情况下，只列出前20个文档

var mycursor = db.user.find()  --可以获得文档游标

注意：当遍历完游标中所有的文档后，或者在10分钟后，游标就会自动关闭

可以使用noCursorTimeout()函数来取消10分钟后游标自动关闭的操作

var mycursor = db.user.find().noCursorTimeout()   --取消游标自动关闭

mycursor.close()  --手动关闭游标

在这之后，在不遍历游标的情况下，需要手动进行关闭，但是如果遍历完游标，游标也会自动关闭

游标函数

mycursor.hasNext()                --判断是否有下一个
mycursor.next()                   --取出下一个数据

while(mycursor.hasNext()) {
    printjson(mycursor.next())
}

mycursor.forEach()
mycursor.forEach(printjson)       --打印出所有的文档

mycursor.limit()                  --相同于mysql里的limit表示返回指定数量的文档
mycursor.skip()                   --相当于mysql里的offset表示跳过指定数据的文档
mycursor.skip(2).limit(2)         --表示从第2条开始打印，打印出两条数据

mycursor.count(<applySkipLimit>) 
--默认情况下， <applySkipLimit>为false, 即mycursor.count()不会考虑mycursor.skip()和mycursor.limit()的效果， 但是如果传入true那么就会受影响
--在数据库分布式结构比较复杂时，元数据中的文档数量可能不准确，在这种情况下，应该避免应用不提供筛选条件的mycursor.count()函数，而使用聚合管道来计算文档数量

mycursor.sort(<document>)
--这里的document定义了排序要求
--1表示由小到大的排列，-1表示由大到小的排列
例如
mycursor.sort({age: -1, score: 1})  --表示年龄小大到小，成绩由小到大的排列

注意：执行顺序 sort > skip > limit

文档投影

db.COLLECTION_NAME.find(<query>, <projection>) --不使用投影的时候，返回的是筛选条件的完整字段文档
projection语法  {field：inclusion}  --1表示返回字段 0表示不返回字段

db.user.find({}， {name: 1, _id: 0})  --那么就只返回name字段，默认文档_id是会被返回的

注意：除了文档主键之外，我们不可以在投影文档中混合使用包含和不包含这两种投影操作，即要么就列出所有想要的字段，要么就列出所有不想要的字段

db.user.find({}, {name: 1, _id: 0})  --可以被允许，因为_id是文档主键
db.user.find({}, {name: 1, age：0}) --不可以执行，因为两者都不是文档主键，并且同时存在
db.user.find({}, {name: 0})  --表示打印除了name字段以外的所有字段

--对数组进行文档投影
db.user.find({}, {name:1, _id:0, addr:{$elemMatch:{$eq: 'fujian'}}})  --表示如果addr中含有fujian的值，那么就显示，否则这个字段不显示

更新文档

db.COLLECTION_NAME.update()

db.COLLECTION_NAME.update(<query>, <update>, <options>)
--<query>文档定义了更新操作时筛选文档的条件， 与find里的筛选条件相同
--<update>文档提供了更新的内容
--<options>文档声明了一些更新操作的参数  {multi: <boolean>}表示是否更新多个文档即把所有匹配到的内容进行全量更新 {upsert: <boolean>}决定是去更新还是创建记录，配置该字段后，如果
没有匹配到文件就会创建一个对应文档 {arrayFilters: [...]}表示操作数组的过滤
--_id字段是不能被改变的

db.user.update({name: 'even'}, {name: 'even', age: 32})  --注意更新的时候需要把没有变化的字段写上去，否则系统会认为是删除字段的操作， 如果原来没有的字段，那么就视为添加字段
--默认只更新匹配到的第一条数据

文档更新操作符

$set 更新或新增字段（不会删除字段）

db.user.update({name: 'even'}, {$set: {sex: "man"}})  --会添加sex字段，但是不会删除没有写入的原有字段
db.user.update({name: 'even'}, {$set: {'info.fav': 'football'}})  --前提是info是个对象，那么更新对象用info.fav，需要加引号

--更新数组
db.user.update({name: 'bill'}, {$set: {'addr.1': "beijing"}})  --这里的’addr.1‘是表示原有数组的第一项， 如果是添加那么则可以把下标往后添加

$unset 删除字段

db.user.update({name: 'even'}, {$unset: {'like.test': ''}})  --会删除like对象下的test字段
db.user.update({name: 'even'}, {$unset: {'addr.0': ''}})  --会把add数组中的第一项删除，但是这里的删除是指把值设为null而不改变长度

$rename 重命名字段 --如果rename的字段不存在，那么文档将不会被改变，如果新的字段在原来文档中就有，那么系统会先删除原有字段，然后再赋值新的字段

--可以利用$rename更把对象中的值放到外面一层，或者把外面一层的数据放到内嵌的对象中

 db.user.update({name: 'even'}, {$rename: {info: "like.info"}})  --把外面的info字段放到like对象中

--注意：类似的操作对数组不能操作

$inc 加减字段值

$mul 相乘字段值

db.user.update({name: 'aaa'},{$inc: {age: 1}})   --age在原有的基础上加1，如果是负数，那么就是减1
db.user.update({name: 'aaa'},{$mul: {age: 2}})  --age在原有的基础出乘于2，如果是小数，那么就是除于

注意：以上方法只能使用在数值上，如果操作的是不存在的字段，那么会创建对应的字段，并且赋值为0

$min 比较减小字段值

$max 比较增大字段值

db.user.update({name: 'aaa'}, {$min: {age: 13}})  --表示找到指定的记录，比对age的值，取原本的值与当前的13进行比较，把值赋值为较小的值，如果原本的值比较小，那么数据不改变
db.user.update({name: 'aaa'}, {$max: {age: 33}})  --表示找到指定的记录，比对age的值，取原本的值与当前的33进行比较，把值赋值为较大的值，如果原本的值比较大，那么数据不改变

注意：如果比较不存在的值，那么系统默认会添加字段，并把值赋值给新添加的字段，如果比较的数据类型不一致，那么会比较BSON数据类型的排序规则进行比较

数组更新操作符

$addToSet 向数组增添元素

db.user.update({name: 'yes'}, {$addToSet: {fav: {$each: ['football', 'computer']}}})  
--表示把【football, computer】中的每一项添加到fav中，而不是把总的数组添加到fav字段中
--$addToSet是表示字符串，布尔值，数值型添加不重复的值，如果重复的值则不添加，如果是数组或object那么要顺序值全部相等时视为相等

$pop 从数组删除元素

db.user.update({name: 'yes'}, {$pop: {fav: 1}})  --表示删除fav数组中的最后一项
db.user.update({name: 'yes'}, {$pop: {fav: -1}}) --表示删除fav数组中的第一项
db.user.update({name: 'yes'}, {$pop: {fav.3: -1}}) --表示删除fav数组中第四个数组的第一项

$pull 从数组中有选择性的移除元素

db.user.update({name: 'yes'}, {$pull: {fav: {$regex: /ea/, $options: 'i'}}})  --表示删除掉fav数组中包含有ea字符的所有项
db.user.update({name: 'yes'}, {$pull: {fav: {$elemMatch: {$regex: /ea/, $options: 'i'}}}})  --表示删除fav数组中所有含有ea字符串的子数组

$pullAll 从数组中有选择性的移除元素相当于{$put: {<field>: $in: [<value1>, <value2>] }}}

语法： { $pullAll: {<field>: [<value1>, <value2>] }}}

$push 向数组中增添元素

向数组中添加元素，$push与$addToSet命令相似，但是$push命令的功能更强大，和$addToSet命令一样，如果$push中指定的数组字段不存在，这个字段会被添加到原文档中，也可以与$each搭配使用

db.user.update({name: 'yes'}, {$push: {fav: {$each: ['eee', 'fff']}}})  --表示把【eee, fff】插入到fav数组的最后
db.user.update({name: 'yes'}, {$push: {fav: {$each: ['eee', 'fff'], $position: 0}}})  --表示把【eee, fff】插入到fav数组的第一位

$sort 对数据中的元素进行排序需要与$push, $each搭配使用

db.user.update({name: 'yes'}, {$push: {fav: {$each: ['eee', 'fff']， $sort: 1}}})  --表示把【eee, fff】插入到fav数组,并且进行由小到大的排序

$slice 从数组截取指定长度的数组，并且赋值给数组

数组中修改数据的操作

db.COLLECTION_NAME.update({<array>: <query selector>}, {<update operator>: {"array.$": value}})
--更新数组中的特定元素
--$是数组中第一个符合筛选条件的数组元素的点位符

> db.user.find({name:"yes"})

--{ "_id" : ObjectId("6105d6fe38ed539a9de23601"), "name" : "yes", "age" : 12, "fav" : [ "fff", "aaa", "bbb", "ccc", "ddd", "fff" ] }
> db.user.update({name: 'yes', fav: 'fff'}, {$set: {"fav.$": 'haha'}})
--WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 })
> db.user.find({name:"yes"})
--{ "_id" : ObjectId("6105d6fe38ed539a9de23601"), "name" : "yes", "age" : 12, "fav" : [ "haha", "aaa", "bbb", "ccc", "ddd", "fff" ] }

> db.user.find()
--{ "_id" : ObjectId("6113031aa9a15f04e8fac55c"), "name" : "even", "json" : [ { "name" : "aaa", "age" : 1 }, { "name" : "bbb", "age" : 2 }, { "name" : "ccc", "age" : 3 } ] }
> db.user.update({name:"even", "json.name": "bbb"}, {$set: {"json.$.age":18}})
--WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 })
> db.user.find()
--{ "_id" : ObjectId("6113031aa9a15f04e8fac55c"), "name" : "even", "json" : [ { "name" : "aaa", "age" : 1 }, { "name" : "bbb", "age" : 18 }, { "name" : "ccc", "age" : 3 } ] }

注意：只是更改符合条件的第一个元素

db.user.find()
--{ "_id" : ObjectId("6111ab9f4ddd3fd50dd2c37a"), "name" : "test", "age" : 12, "fav" : [ "bbb", "ccc", "ddd", "fff", [ "111", "222" ] ] }
db.user.update({name: "test"}, {$set: {"fav.$[]": 'test'}})
--WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 })
db.user.find()
--{ "_id" : ObjectId("6111ab9f4ddd3fd50dd2c37a"), "name" : "test", "age" : 12, "fav" : [ "test", "test", "test", "test", "test" ] }

注意：以上代码会把所以值都替换成指定的值

db.COLLECTION_NAME.save(<document>): 如果document文档中包含了_id字段， save()命令将会调用db.COLLECTION_NAME.update()命令{upsert: true}

如果需要更改数组中的多个值，可以使用arrayFilters进行修改

> db.user.find({name: "even"})
--{ "_id" : ObjectId("6113031aa9a15f04e8fac55c"), "name" : "even", "json" : [ { "name" : "aaa", "age" : 3 }, { "name" : "aaa", "age" : 3 }] }
> db.user.update({name:"even"}, {$set: {"json.$[elem].age": 12}}, {arrayFilters: [{"elem.name": "aaa"}]})
--WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 })
> db.user.find({name: "even"})
--{ "_id" : ObjectId("6113031aa9a15f04e8fac55c"), "name" : "even", "json" : [{ "name" : "aaa", "age" : 12 }, { "name" : "aaa", "age" : 12 }]}
>

注意：这里的elem是指arrayFilters匹配到的元素，具体可以参看官网 https://docs.mongodb.com/manual/reference/method/db.collection.update/#std-label-update-arrayFilters

删除文档

使用语句

db.collection.remove(<query>,<justOne>)  --默认是删除所有满足条件的所有文档，如果只需要删除满足条件的第一篇文档，那么justOne可以设置为true
db.collection.remove({})  --删除所有文档
db.collection.drop()  --表示除了删除文档，并且也把集合和索引都删除

注意：如果文档很多时，使用remove有的时候效率不高，这个时候推荐使用drop再创建集合，这样效率更高

3、mongodb的聚合操作

语法

db.COLLECTION_NAME.aggregate(<pipeline>, <options>)
--pipeline文档定义了操作中使用的聚合管道阶段和聚合操作符
--文档声明了一些聚合操作的参数

常见的聚合表达式

--字段路径表达式
$<field>  --使用$来指示字段路径
$<field>.<sub-field> --使用$和. 来指示内嵌文档字段路径

--系统变量表达式
$$<variable> --使用$$来指示系统变量
如$$CURRENT --指示管道中当前操作的文档（相当于this）, $$CURRENT.<field>和$<field>是等效的


--常量表达式
$literal: <value> --指示常量<value>
$literal: "$name" --指示常量字符串“$name”

$project --对输入文档进行再次投影
$match --对输入文档进行再次筛选
$limit --筛选出管道内前N篇文档
$skip --跳过管道内第N篇文档
$unwind --展开输入文档中的数组字段
$sort --对输入的文档进行排序
$lookup --对输入的文档进行查询操作
$group --对输入的文档进行分组
$out --将管道中的文档进行输出

注意：以下的操作使用的数据如下

{ "_id" : ObjectId("6115afe39526539ff7a05d9f"), "name" : { "first" : "bill", "last" : "yu" }, "age" : 28 }
{ "_id" : ObjectId("6115afe39526539ff7a05da0"), "name" : { "first" : "ven", "last" : "yu" }, "age" : 30 }
{ "_id" : ObjectId("6115afe39526539ff7a05da1"), "name" : { "first" : "even", "last" : "yu" }, "age" : 29 }

$project --对输入文档进行再次投影

> db.user.aggregate([{$project: {_id: 0, name: "$name.first", age: 1 }}])

--输出
--{ "name" : "bill", "age" : 28 }
--{ "name" : "ven", "age" : 30 }
--{ "name" : "even", "age" : 29 }

> db.user.aggregate([{$project: {_id: 0, age: 1, name:["$name.first", "$name.middle", "$name.last"]}}])

--输出，如果是没有的字段，那么会输出null
--{ "age" : 28, "name" : [ "bill", null, "yu" ] }
--{ "age" : 30, "name" : [ "ven", null, "yu" ] }
--{ "age" : 29, "name" : [ "even", null, "yu" ] }

$match --对输入文档进行再次筛选

$match中使用的文档筛选语法，和读取文档时的筛选语法相同，与find时的筛选用法是一样的

> db.user.aggregate([{$match: {"name.first": "even"}}])
--{ "_id" : ObjectId("6115afe39526539ff7a05da1"), "name" : { "first" : "even", "last" : "yu" }, "age" : 29 }

> db.user.aggregate([{$match: {$and: [{age: {$gte: 29}}, {age: {$lte: 30}}]}}])
--{ "_id" : ObjectId("6115afe39526539ff7a05da0"), "name" : { "first" : "ven", "last" : "yu" }, "age" : 30 }
--{ "_id" : ObjectId("6115afe39526539ff7a05da1"), "name" : { "first" : "even", "last" : "yu" }, "age" : 29 }

--$match与$project进行配合使用
> db.user.aggregate([{$match: {$and: [{age: {$gte: 29}}, {age: {$lte: 30}}]}}, {$project: {_id: 0, age: 1, name: "$name.first"}}])
--{ "age" : 30, "name" : "ven" }
--{ "age" : 29, "name" : "even" }

注意: $match是一个很常用的聚合阶段，应该尽量在聚合管道的开始阶段应用$match，这样可以减少后续阶段中需要处理的文档数量，优化聚合操作的性能

$limit --筛选出管道内前N篇文档

$skip --跳过管道内第N篇文档

> db.user.find()
--{ "_id" : ObjectId("6115afe39526539ff7a05d9f"), "name" : { "first" : "bill", "last" : "yu" }, "age" : 28 }
--{ "_id" : ObjectId("6115afe39526539ff7a05da0"), "name" : { "first" : "ven", "last" : "yu" }, "age" : 30 }
--{ "_id" : ObjectId("6115afe39526539ff7a05da1"), "name" : { "first" : "even", "last" : "yu" }, "age" : 29 }

> db.user.aggregate([{$skip: 1}, {$limit: 1}])
--{ "_id" : ObjectId("6115afe39526539ff7a05da0"), "name" : { "first" : "ven", "last" : "yu" }, "age" : 30 }

$unwind --展开输入文档中的数组字段

为了方便演示对原始数据做些调整

{ "_id" : ObjectId("6115afe39526539ff7a05d9f"), "name" : { "first" : "bill", "last" : "yu" }, "age" : 28 }
{ "_id" : ObjectId("6115afe39526539ff7a05da0"), "name" : { "first" : "ven", "last" : "yu" }, "age" : 30, "param" : [ ] }
{ "_id" : ObjectId("6115afe39526539ff7a05da1"), "name" : { "first" : "even", "last" : "yu" }, "age" : 29, "param" : [ "aaa", "bbb" ] }

> db.user.aggregate([{$unwind: {path: "$param"}}])
--{ "_id" : ObjectId("6115afe39526539ff7a05da1"), "name" : { "first" : "even", "last" : "yu" }, "age" : 29, "param" : "aaa" }
--{ "_id" : ObjectId("6115afe39526539ff7a05da1"), "name" : { "first" : "even", "last" : "yu" }, "age" : 29, "param" : "bbb" }

注意：这个方法会把对应的数据拆开展示，但是不展示param为null [], 或者不存在的情况

> db.user.aggregate([{$unwind: {path: "$param", includeArrayIndex: "index"}}])
--{ "_id" : ObjectId("6115afe39526539ff7a05da1"), "name" : { "first" : "even", "last" : "yu" }, "age" : 29, "param" : "aaa", "index" : NumberLong(0) }
--{ "_id" : ObjectId("6115afe39526539ff7a05da1"), "name" : { "first" : "even", "last" : "yu" }, "age" : 29, "param" : "bbb", "index" : NumberLong(1) }

添加索引字段

> db.user.aggregate([{$unwind: {path: "$param", includeArrayIndex: "index", preserveNullAndEmptyArrays: true}}])
--{ "_id" : ObjectId("6115afe39526539ff7a05d9f"), "name" : { "first" : "bill", "last" : "yu" }, "age" : 28, "index" : null }
--{ "_id" : ObjectId("6115afe39526539ff7a05da0"), "name" : { "first" : "ven", "last" : "yu" }, "age" : 30, "index" : null }
--{ "_id" : ObjectId("6115afe39526539ff7a05da1"), "name" : { "first" : "even", "last" : "yu" }, "age" : 29, "param" : "aaa", "index" : NumberLong(0) }
--{ "_id" : ObjectId("6115afe39526539ff7a05da1"), "name" : { "first" : "even", "last" : "yu" }, "age" : 29, "param" : "bbb", "index" : NumberLong(1) }

把没有该字段的数据也进行一次展开

$sort --对输入的文档进行排序

> db.user.aggregate([{$sort: {age: 1}}])
--{ "_id" : ObjectId("6115afe39526539ff7a05d9f"), "name" : { "first" : "bill", "last" : "yu" }, "age" : 28 }
--{ "_id" : ObjectId("6115afe39526539ff7a05da1"), "name" : { "first" : "even", "last" : "yu" }, "age" : 29, "param" : [ "aaa", "bbb" ] }
--{ "_id" : ObjectId("6115afe39526539ff7a05da0"), "name" : { "first" : "ven", "last" : "yu" }, "age" : 30, "param" : [ ] }

注意：用法与上面写的sort的用法一样，1表示升序， -1表示降序

$lookup --对输入的文档进行查询操作

使用单一字段进行查询

$lookup: {
    from : <collection to join>,   
    localField：<field from the input documents>,
    foreignField: <field from the documents of the "from" collection>,
    as: <output array field>
}

--同一数据库中的另一个查询集合

注意：这个语法相当于mysql中的leftjoin的用法

当前的演示案例的数据

> db.user.find()
--{ "_id" : ObjectId("6115afe39526539ff7a05d9f"), "name" : { "first" : "bill", "last" : "yu" }, "age" : 28 }
--{ "_id" : ObjectId("6115afe39526539ff7a05da0"), "name" : { "first" : "ven", "last" : "yu" }, "age" : 30 }
--{ "_id" : ObjectId("6115afe39526539ff7a05da1"), "name" : { "first" : "even", "last" : "yu" }, "age" : 29 }

> db.info.find()
--{ "_id" : ObjectId("6118cb10f70c4e8e186d8a65"), "name" : "ven", "desc" : "this is ven desc" }
--{ "_id" : ObjectId("6118cb10f70c4e8e186d8a66"), "name" : "even", "desc" : "this even desc" }
--{ "_id" : ObjectId("6118cb10f70c4e8e186d8a67"), "name" : "bill", "desc" : "this is bill desc" }

使用$lookup

> db.user.aggregate([{$lookup:{from: "info", localField: "name.first", foreignField: "name", as: "info"}}])

--{ "_id" : ObjectId("6115afe39526539ff7a05d9f"), "name" : { "first" : "bill", "last" : "yu" }, "age" : 28, "info" : [ { "_id" : ObjectId("6118cb10f70c4e8e186d8a67"), "name" : "bill", "desc" : "this is bill desc" } ] }
--{ "_id" : ObjectId("6115afe39526539ff7a05da0"), "name" : { "first" : "ven", "last" : "yu" }, "age" : 30, "info" : [ { "_id" : ObjectId("6118cb10f70c4e8e186d8a65"), "name" : "ven", "desc" : "this is ven desc" } ] }
--{ "_id" : ObjectId("6115afe39526539ff7a05da1"), "name" : { "first" : "even", "last" : "yu" }, "age" : 29, "info" : [ { "_id" : ObjectId("6118cb10f70c4e8e186d8a66"), "name" : "even", "desc" : "this even desc" } ] }

注意：如果localField是一个数组，那么info出来的数据也会是一一对应的数组，那就可以配合$unwind进行使用，如果匹配不到，那么返回的是一个空数组

对字段进行筛选可以使用关键字pipeline

> db.user.aggregate([{$lookup: {from: "info", localField: "name.first", foreignField: "name", pipeline: [{$project: {_id: 0, desc: 1}}], as: "info"}}])
--{ "_id" : ObjectId("6115afe39526539ff7a05d9f"), "name" : { "first" : "bill", "last" : "yu" }, "age" : 28, "info" : [ { "desc" : "this is bill desc" } ] }
--{ "_id" : ObjectId("6115afe39526539ff7a05da0"), "name" : { "first" : "ven", "last" : "yu" }, "age" : 30, "info" : [ { "desc" : "this is ven desc" } ] }
--{ "_id" : ObjectId("6115afe39526539ff7a05da1"), "name" : { "first" : "even", "last" : "yu" }, "age" : 29, "info" : [ { "desc" : "this even desc" } ] }
--{ "_id" : ObjectId("6118ceb2f70c4e8e186d8a68"), "name" : { "first" : "ctbu", "last" : "yu" }, "age" : 23, "info" : [ ] }

$lookup的复杂运用

$lookup: {
    from: <collection to join>,
    let: {<var_1>: <expression>, ..., <var_n>: <expression>},
    pipeline: [<pipeline to execute on the collection to join>],
    as: <output array field>  
}

--对查询集合中的文档使用聚合阶段进行处理， 这里的let是可选参数

对查询集合中的文档使用聚合阶段进行处理时，如果需要参考管道文档中的字段，则必须使用let参数对字段进行声明

> db.user.aggregate([{$lookup:{from: "info", pipeline: [{$project: {_id: 0, desc: 1}}], as: "info"}}])

--{ "_id" : ObjectId("6115afe39526539ff7a05d9f"), "name" : { "first" : "bill", "last" : "yu" }, "age" : 28, "info" : [ { "desc" : "this is ven desc" }, { "desc" : "this even desc" }, { "desc" : "this is bill desc" } ] }
--{ "_id" : ObjectId("6115afe39526539ff7a05da0"), "name" : { "first" : "ven", "last" : "yu" }, "age" : 30, "info" : [ { "desc" : "this is ven desc" }, { "desc" : "this even desc" }, { "desc" : "this is bill desc" } ] }
--{ "_id" : ObjectId("6115afe39526539ff7a05da1"), "name" : { "first" : "even", "last" : "yu" }, "age" : 29, "info" : [ { "desc" : "this is ven desc" }, { "desc" : "this even desc" }, { "desc" : "this is bill desc" } ] }
--{ "_id" : ObjectId("6118ceb2f70c4e8e186d8a68"), "name" : { "first" : "ctbu", "last" : "yu" }, "age" : 23, "info" : [ { "desc" : "this is ven desc" }, { "desc" : "this even desc" }, { "desc" : "this is bill desc" } ] }

上面没有对条件做限定，只做了字段展示，所以会全部显示出来

> db.user.aggregate([{$lookup: {from: "info", let: {n: "$name.first"}, pipeline: [{$match: {$expr: {$eq: ["$name", "$$n"]}}}, {$project: {_id: 0, desc: 1}}], as: "info"}}])
--{ "_id" : ObjectId("6115afe39526539ff7a05d9f"), "name" : { "first" : "bill", "last" : "yu" }, "age" : 28, "info" : [ { "desc" : "this is bill desc" } ] }
--{ "_id" : ObjectId("6115afe39526539ff7a05da0"), "name" : { "first" : "ven", "last" : "yu" }, "age" : 30, "info" : [ { "desc" : "this is ven desc" } ] }
--{ "_id" : ObjectId("6115afe39526539ff7a05da1"), "name" : { "first" : "even", "last" : "yu" }, "age" : 29, "info" : [ { "desc" : "this even desc" } ] }
--{ "_id" : ObjectId("6118ceb2f70c4e8e186d8a68"), "name" : { "first" : "ctbu", "last" : "yu" }, "age" : 23, "info" : [ ] }

注意： 在上面的表达式中，let中的n是表示对user中的字段引用，而match中需要对两个字段的值进行比较，有用到$$n，所以要用表达式$expr，但是$eq的写法区别于上面的写法，因为这里要对两个表的值进行引用，所以采用的数组的写法，在引用定义的变量时需要用$$进行修饰， $name.first表示的是当前表的字段， pipeline表示的是连接表的信息

> db.user.aggregate([{$project: {_id: 0, name: "$name.first", age: 1}},{$lookup: {from: "info", let: {n: "$name.first", a: "$age"}, pipeline: [{$project: {_id: 0, name: 1, desc: 1}}, {$match: {$expr: {$and: [{$eq: ["$name", "$$n"]}]}}}], as: "info"}}])
--{ "age" : 28, "name" : "bill", "info" : [ { "name" : "bill", "desc" : "this is bill desc" } ] }
--{ "age" : 30, "name" : "ven", "info" : [ { "name" : "ven", "desc" : "this is ven desc" } ] }
--{ "age" : 29, "name" : "even", "info" : [ { "name" : "even", "desc" : "this even desc" } ] }
--{ "age" : 23, "name" : "ctbu", "info" : [ ] }

注意：以上写法有点失误，在pipeline里面需要先match再project，不然很容易所匹配的字段被project后，match找不到，所以建议先match, 再project

$group --对输入的文档进行分组

$group: {
    _id: <expression>,
   <field1>: { <accumulartor1> : <expression1> },
   ...
}

注意：这里的_id表示用于分组的字段, 暂时没有发现可以其他字段进行操作

> db.goods.find()
--{ "_id" : ObjectId("611b3fd0ab556f9418ed89c6"), "name" : "apple", "price" : 12, "count" : 5 }
--{ "_id" : ObjectId("611b3fd0ab556f9418ed89c7"), "name" : "pear", "price" : 11, "count" : 20 }
--{ "_id" : ObjectId("611b3fd0ab556f9418ed89c8"), "name" : "banana", "price" : 16, "count" : 5 }
--{ "_id" : ObjectId("611b3fd0ab556f9418ed89c9"), "name" : "grape", "price" : 9.8, "count" : 63 }
--{ "_id" : ObjectId("611b4026ab556f9418ed89ca"), "name" : "apple", "price" : 12, "count" : 1 }
--{ "_id" : ObjectId("611b4026ab556f9418ed89cb"), "name" : "banana", "price" : 16, "count" : 80 }
--{ "_id" : ObjectId("611b4026ab556f9418ed89cc"), "name" : "grape", "price" : 9.8, "count" : 12 }
--{ "_id" : ObjectId("611b4046ab556f9418ed89cd"), "name" : "apple", "price" : 12, "count" : 1 }
--{ "_id" : ObjectId("611b4046ab556f9418ed89ce"), "name" : "banana", "price" : 16, "count" : 80 }
--{ "_id" : ObjectId("611b4046ab556f9418ed89cf"), "name" : "grape", "price" : 9.8, "count" : 12 }

> db.goods.aggregate([{$group: {_id: "$name", sum: {$sum: {$multiply: ["$price", "$count"]}}, avg: {$avg: "$price"}, max: {$max: "$count"}, min: {$min: "$count"}}}])
--{ "_id" : "pear", "sum" : 220, "avg" : 11, "max" : 20, "min" : 20 }
--{ "_id" : "apple", "sum" : 84, "avg" : 12, "max" : 5, "min" : 1 }
--{ "_id" : "banana", "sum" : 2640, "avg" : 16, "max" : 80, "min" : 5 }
--{ "_id" : "grape", "sum" : 852.6000000000001, "avg" : 9.8, "max" : 63, "min" : 12 }

注意：这里的$sum表示求和， $multiply表示求积， $avg表示求平均数, $max表示求最大值 , $min表示求最小值， 如果是$sum：1则是表示求文档的数量

> db.goods.aggregate([{$group: {_id: "$name", count: {$sum: 1}}}])
--{ "_id" : "banana", "count" : 3 }
--{ "_id" : "apple", "count" : 3 }
--{ "_id" : "grape", "count" : 3 }
--{ "_id" : "pear", "count" : 1 }

使用聚合函数求所有的文档的聚合值（把_id设置为null）

> db.goods.aggregate([{$group: {_id: null, count: {$sum: 1}, sum: {$sum: {$multiply: ["$price", "$count"]}}}}])
--{ "_id" : null, "count" : 10, "sum" : 3796.6 }

--把所有名称都放到一个数组里
> db.goods.aggregate([{$group: {_id: null, count: {$sum: 1}, sum: {$sum: {$multiply: ["$price", "$count"]}}, collect: {$push: "$name"}}}])
--{ "_id" : null, "count" : 10, "sum" : 3796.6, "collect" : [ "apple", "pear", "banana", "grape", "apple", "banana", "grape", "apple", "banana", "grape" ] }

--把所有名称都放到一个数组里，并且不重复
> db.goods.aggregate([{$group: {_id: null, count: {$sum: 1}, sum: --{$sum: {$multiply: ["$price", "$count"]}}, collect: {$addToSet: "$name"}}}])
{ "_id" : null, "count" : 10, "sum" : 3796.6, "collect" : [ "banana", "pear", "apple", "grape" ] }

$out --将管道中的文档进行输出

> db.goods.aggregate([{$group: {_id: null, count: {$sum: 1}, sum: {$sum: {$multiply: ["$price", "$count"]}}, collect: {$addToSet: "$name"}}}, {$out: "output"}])

注意：该操作会把数据结果写入到output这个新的文档中

通常来讲，每个聚合管道阶段使用的内存不能超过100MB，如果超过了就会报错，为了让程序执行下去可以添加 allowDiskUse: true配置，当内存不足时，会将操作数据写入临时文件中，这个临时文件会被写入dbPath下的_tmp文件夹下，默认值是/data/db

> db.goods.aggregate([{$group: {_id: "$name"}}],{allowDiskUse: true})
{ "_id" : "banana" }
{ "_id" : "pear" }
{ "_id" : "apple" }
{ "_id" : "grape" }

注意：对数组值的引用常见于 $project, $unwind, $lookup, $group

复杂例子操作

数据库

> show collections
--bag
--goods
--user
> db.bag.find()
--{ "_id" : ObjectId("612c140a2958f075bfdde1a8"), "name" : "bill", "goods" : "apply", "count" : 3 }
--{ "_id" : ObjectId("612c140a2958f075bfdde1a9"), "name" : "even", "goods" : "pear", "count" : 2 }
--{ "_id" : ObjectId("612c140a2958f075bfdde1aa"), "name" : "ven", "goods" : "grape", "count" : 6 }
--{ "_id" : ObjectId("612c140a2958f075bfdde1ab"), "name" : "bill", "goods" : "orange", "count" : 12 }
> db.goods.find()
--{ "_id" : ObjectId("612c113f2958f075bfdde1a1"), "name" : "apply", "price" : 11 }
--{ "_id" : ObjectId("612c113f2958f075bfdde1a2"), "name" : "pear", "price" : 12 }
--{ "_id" : ObjectId("612c113f2958f075bfdde1a3"), "price" : 13, "name" : "grape" }
--{ "_id" : ObjectId("612c113f2958f075bfdde1a4"), "name" : "orange", "price" : 10 }
> db.user.find()
--{ "_id" : ObjectId("612c144a2958f075bfdde1ac"), "name" : "bill", "age" : 18 }
--{ "_id" : ObjectId("612c144a2958f075bfdde1ad"), "name" : "ven", "age" : 12 }
--{ "_id" : ObjectId("612c144a2958f075bfdde1ae"), "name" : "even", "age" : 28 }

进行嵌套查询

db.bag.aggregate([
    {$project: {_id: 0, name: 1, goods: 1, count: 1}},
    {
        $lookup: {
            from: "goods", 
            let: {g: '$goods', c: '$count'}, 
            pipeline: [{$match: {$expr: {$eq: ["$name", "$$g"]}}}, {$project: {_id: 0, price: 1, sum: {$multiply: ['$$c', '$price']}}}], 
            as: "msg"
        }
    },
    {
        $lookup: {
            from: "user", 
            let: {n: "$name"}, 
            pipeline: [{$match: {$expr: {$eq: ["$name", "$$n"]}}}, {$project: {_id: 0, age: 1}}], 
            as: "user"
        }
    },
])

结果：

--{ "name" : "bill", "goods" : "apply", "count" : 3, "msg" : [ { "price" : 11, "sum" : 33 } ], "user" : [ { "age" : 18 } ] }
--{ "name" : "even", "goods" : "pear", "count" : 2, "msg" : [ { "price" : 12, "sum" : 24 } ], "user" : [ { "age" : 28 } ] }
--{ "name" : "ven", "goods" : "grape", "count" : 6, "msg" : [ { "price" : 13, "sum" : 78 } ], "user" : [ { "age" : 12 } ] }
--{ "name" : "bill", "goods" : "orange", "count" : 12, "msg" : [ { "price" : 10, "sum" : 120 } ], "user" : [ { "age" : 18 } ] }

posted @ 2024-04-08 14:14 小学弟- 阅读(88) 评论(0) 收藏举报

刷新页面返回顶部