文档操作

MongoDB 不同的连接方式

首先启动服务（bin 目录下执行 mongodb）

使用 MongoDB shell 连接服务器

标准URL连接语法

mongodb://[username:password@]host1[:port1][,host2[:port2],...[,hostN[:portN]]][/[database][?options]]

mongodb：固定格式，必须指定
username:password@：可选项，设置后在连接后会尝试登陆数据库
host1：必须置顶至少一个 host ；如果要连接复制集，需要指定多个地址
portX ：可选的指定端口，默认是27017
/database ：如果指定账号密码，连接验证登陆指定数据库；否则打开 test 数据库
?options ：连接选项，所有连接选项都是键值对 name=value，键值对之间通过“ & ”或 “ ；”隔开

连接选项 options：

选项	描述
replicaSet=name	验证replica set的名称。 Impliesconnect=replicaSet.
slaveOk=true\|false	true:在connect=direct模式下，驱动会连接第一台机器，即使这台服务器不是主。在connect=replicaSet模式下，驱动会发送所有的写请求到主并且把读取操作分布在其他从服务器。false: 在 connect=direct模式下，驱动会自动找寻主服务器. 在connect=replicaSet 模式下，驱动仅仅连接主服务器，并且所有的读写命令都连接到主服务器。
safe=true\|false	true: 在执行更新操作之后，驱动都会发送getLastError命令来确保更新成功。(还要参考 wtimeoutMS).false: 在每次更新之后，驱动不会发送getLastError来确保更新成功。
w=n	驱动添加 { w : n } 到getLastError命令. 应用于safe=true。
wtimeoutMS=ms	驱动添加 { wtimeout : ms } 到 getlasterror 命令. 应用于 safe=true.
fsync=true\|false	true: 驱动添加 { fsync : true } 到 getlasterror 命令.应用于 safe=true.false: 驱动不会添加到getLastError命令中。
journal=true\|false	如果设置为 true, 同步到 journal (在提交到数据库前写入到实体中). 应用于 safe=true
connectTimeoutMS=ms	可以打开连接的时间。
socketTimeoutMS=ms	发送和接受sockets的时间。

实例

使用默认端口连接服务

mongodb://localhost

通过 shell 连接服务

./mongo

# 使用账号密码连接到本地服务
mongodb://admin:123456@localhost/
# 使用账号密码连接登陆到指定数据库
mongodb://admin:123456@localhost/test

其他连接实例

mongodb://localhost
mongodb://fred:foobar@localhost
mongodb://fred:foobar@localhost/baz

# 连接 replica pair 服务器 1 为 example1.com，2 为 example2.com
mongodb://example1.com:27017,example2.com:27017
# 连接 replica set 三台服务器 (端口 27017, 27018, 和27019)
mongodb://localhost,localhost:27018,localhost:27019
# 连接 replica set 三台服务器, 写入操作应用在主服务器 并且分布查询到从服务器。
mongodb://host1,host2,host3/?slaveOk=true
# 直接连接第一个服务器，无论是replica set一部分或者主服务器或者从服务器。
mongodb://host1,host2,host3/?connect=direct;slaveOk=true
# 安全模式连接到localhost:
mongodb://localhost/?safe=true
# 以安全模式连接到replica set，并且等待至少两个复制服务器成功写入，超时时间设置为2秒。
mongodb://host1,host2,host3/?safe=true;w=2;wtimeoutMS=2000

数据库操作

创建数据库

在 MongoDB 中，集合只有在内容插入后才会创建

就是说，创建集合(数据表)后要再插入一个文档(记录)，集合才会真正创建。

# 如果数据库不存在则创建，否则切换到这个数据库
use DATABASE_NAME
use newtest

# 查看当前数据库，新创建的数据库未在列表中显示
show dbs

# 插入数据后再次查询即可显示
db.newtest.insert({"name":"测试"})
show dbs

删除数据库

# 删除当前数据库，默认为 test
db.dropDatabase()

集合操作

创建集合

如果在不存在的集合中直接插入文档，则集合会自动被创建

# 语法
db.createCollection(name,options)

# 例子
# 指定大小为 6142800 字节，文档最大数量 10000，建立 _id 索引
db.createCollection("mycol",{capped:true,autoIndexId:true,size:6142800,max:10000})

name：要创建的集合名称
options：可选参数，制定有关内存大小及索引的选项

options 可选项

字段	类型	描述
capped	布尔	（可选）如果为 true，则创建固定集合。固定集合是指有着固定大小的集合，当达到最大值时，它会自动覆盖最早的文档。当该值为 true 时，必须指定 size 参数。
autoIndexId	布尔	3.2 之后不再支持该参数。（可选）如为 true，自动在 _id 字段创建索引。默认为 false。
size	数值	（可选）为固定集合指定一个最大值，即字节数。如果 capped 为 true，也需要指定该字段。
max	数值	（可选）指定固定集合中包含文档的最大数量。

删除集合

# 语法
db.<集合>.drop()

# 查看是否删除
show collections

文档操作

插入文档

语法

使用 insert() 或 save() 方法向集合中插入文档，语法如下：

# 语法
db.<collection>.insert(<document>)
db.<collection>.save(<document>)

save()：如果 _id 主键存在则更新数据，如果不存在就插入数据。该方法新版本中已废弃，可以使用 db.collection.insertOne() 或 db.collection.replaceOne() 来代替。
insert(): 若插入的数据主键已经存在，则会抛 org.springframework.dao.DuplicateKeyException 异常，提示主键重复，不保存当前数据。

# 新版语法
# 单插
db.<collection>.insertOne(
   <document>,
   {
      writeConcern: <document>
   }
)
# 多插
db.<collection>.insertMany(
   [ <document 1> , <document 2>, ... ],
   {
      writeConcern: <document>,
      ordered: <boolean>
   }
)

document：要写入的文档。
writeConcern：写入策略，默认为 1，即要求确认写操作，0 是不要求。
ordered：指定是否按顺序写入，默认 true，按顺序写入。

实例

# 向 col 集合插入一个文档
>db.col.insert({title: 'MongoDB 教程', 
    description: 'MongoDB 是一个 Nosql 数据库',
    by: '菜鸟教程',
    url: 'http://www.runoob.com',
    tags: ['mongodb', 'database', 'NoSQL'],
    likes: 100
})
# 查看
> db.col.find()
{ "_id" : ObjectId("56064886ade2f21f36b03134"), "title" : "MongoDB 教程", "description" : "MongoDB 是一个 Nosql 数据库", "by" : "菜鸟教程", "url" : "http://www.runoob.com", "tags" : [ "mongodb", "database", "NoSQL" ], "likes" : 100 }
> 
---
# 先定义变量法
> document=({title: 'MongoDB 教程', 
    description: 'MongoDB 是一个 Nosql 数据库',
    by: '菜鸟教程',
    url: 'http://www.runoob.com',
    tags: ['mongodb', 'database', 'NoSQL'],
    likes: 100
});
# 插入变量
> db.col.insert(document)
WriteResult({ "nInserted" : 1 })

更新文档

语法

db.collection.update(
   <query>,
   <update>,
   {
     upsert: <boolean>,
     multi: <boolean>,
     writeConcern: <document>
   }
)

query : update的查询条件，类似sql update查询内where后面的。
update : update的对象和一些更新的操作符（如$,$inc...）等，也可以理解为sql update查询内set后面的
upsert : 可选，这个参数的意思是，如果不存在update的记录，是否插入objNew,true为插入，默认是false，不插入。
multi : 可选，mongodb 默认是false,只更新找到的第一条记录，如果这个参数为true,就把按条件查出来多条记录全部更新。
writeConcern :可选，抛出异常的级别。

实例

# 插入数据
>db.col.insert({
    title: 'MongoDB 教程', 
    description: 'MongoDB 是一个 Nosql 数据库',
    by: '菜鸟教程',
    url: 'http://www.runoob.com',
    tags: ['mongodb', 'database', 'NoSQL'],
    likes: 100
})
# 更新数据，更新标题
>db.col.update({'title':'MongoDB 教程'},{$set:{'title':'MongoDB'}})
WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 })   # 输出信息
# 查看
> db.col.find().pretty()
{
        "_id" : ObjectId("56064f89ade2f21f36b03136"),
        "title" : "MongoDB",
        "description" : "MongoDB 是一个 Nosql 数据库",
        "by" : "菜鸟教程",
        "url" : "http://www.runoob.com",
        "tags" : [
                "mongodb",
                "database",
                "NoSQL"
        ],
        "likes" : 100
}
>

删除文档

语法

db.collection.remove(
   <query>,
   {
     justOne: <boolean>,
     writeConcern: <document>
   }
)

query :（可选）删除的文档的条件。
justOne : （可选）如果设为 true 或 1，则只删除一个文档，如果不设置该参数，或使用默认值 false，则删除所有匹配条件的文档。
writeConcern :（可选）抛出异常的级别。

实例

# 删除符合条件的文档
>db.col.remove({'title':'MongoDB 教程'})
WriteResult({ "nRemoved" : 2 })           # 删除了两条数据

# 删除全部
>db.col.remove({})

查询文档

语法

MongoDB 使用 find() 方法以非结构化的方式来显示文档

# 查询
db.collection.find(query, projection)
db.collection.findOne(query, projection)
# 如果你需要以易读的方式来读取数据，可以使用 pretty() 方法，语法格式如下：
db.col.find().pretty()
db.col.findOne().pretty()

query ：可选，使用查询操作符指定查询条件
projection ：可选，使用投影操作符指定返回的键。查询时返回文档中所有键值，只需省略该参数即可（默认省略）。

条件语句

操作	格式	范例	RDBMS中的类似语句
等于	`{<key>:<value>`}	`db.col.find({"by":"菜鸟教程"}).pretty()`	`where by = '菜鸟教程'`
小于	`{<key>:{$lt:<value>}}`	`db.col.find({"likes":{$lt:50}}).pretty()`	`where likes < 50`
小于或等于	`{<key>:{$lte:<value>}}`	`db.col.find({"likes":{$lte:50}}).pretty()`	`where likes <= 50`
大于	`{<key>:{$gt:<value>}}`	`db.col.find({"likes":{$gt:50}}).pretty()`	`where likes > 50`
大于或等于	`{<key>:{$gte:<value>}}`	`db.col.find({"likes":{$gte:50}}).pretty()`	`where likes >= 50`
不等于	`{<key>:{$ne:<value>}}`	`db.col.find({"likes":{$ne:50}}).pretty()`	`where likes != 50`

and 条件

# 多个条件以逗号隔开
db.col.find({key1:value1, key2:value2}).pretty()
# 例如
db.col.find({"by":"菜鸟教程", "title":"MongoDB 教程"}).pretty()

or 条件

# 使用 $or 关键字
db.col.find({$or: [{key1: value1}, {key2:value2}]}).pretty()
# 例如
db.col.find({$or:[{"by":"菜鸟教程"},{"title": "MongoDB 教程"}]}).pretty()

组合使用实例

db.col.find({"likes": {$gt:50}, $or: [{"by": "菜鸟教程"},{"title": "MongoDB 教程"}]}).pretty()

条件操作符

(>) 大于 - $gt
(<) 小于 - $lt
(>=) 大于等于 - $gte
(<= ) 小于等于 - $lte
$type，指定查询的数据类型

指定数量：Limit() 和 Skip()

# limit 指定读取的条数
db.COLLECTION_NAME.find().limit(NUMBER)

# skip 跳过指定数量的数据
db.COLLECTION_NAME.find().limit(NUMBER).skip(NUMBER)

排序 sort()

# 指定排序的字段， 1 是升序排列，-1 是降序排列
db.COLLECTION_NAME.find().sort({KEY:1})

索引

索引可以极大的提高查询效率

索引是一种特殊的数据结构，存储在一个易于遍历读取的数据集合中，是对数据库表中一列或多列的值进行排序的一种结构

createIndex() 方法

# 创建 key 的索引
db.collection.createIndex(key,options)
# 例 1，给 title 字段升序创建索引
db.col.createIndex({"title":1})
# 例 2，按 title 字段升序，description 字段降序，创建索引
db.col.createIndex({"title":1,"description":-1})
# 例 3，使用 background 参数在后台建立索引
db.values.createIndex({open: 1, close: 1}, {background: true})

Parameter	Type	Description
background	Boolean	建索引过程会阻塞其它数据库操作，background可指定以后台方式创建索引，即增加 "background" 可选参数。 "background" 默认值为false。
unique	Boolean	建立的索引是否唯一。指定为true创建唯一索引。默认值为false.
name	string	索引的名称。如果未指定，MongoDB的通过连接索引的字段名和排序顺序生成一个索引名称。
dropDups	Boolean	3.0+版本已废弃。在建立唯一索引时是否删除重复记录,指定 true 创建唯一索引。默认值为 false.
sparse	Boolean	对文档中不存在的字段数据不启用索引；这个参数需要特别注意，如果设置为true的话，在索引字段中不会查询出不包含对应字段的文档.。默认值为 false.
expireAfterSeconds	integer	指定一个以秒为单位的数值，完成 TTL设定，设定集合的生存时间。
v	index version	索引的版本号。默认的索引版本取决于mongod创建索引时运行的版本。
weights	document	索引权重值，数值在 1 到 99,999 之间，表示该索引相对于其他索引字段的得分权重。
default_language	string	对于文本索引，该参数决定了停用词及词干和词器的规则的列表。默认为英语
language_override	string	对于文本索引，该参数指定了包含在文档中的字段名，语言覆盖默认的language，默认值为 language.

其他索引方法

# 查看集合索引
db.col.getIndexes()

# 查看集合索引大小
db.col.totalIndexSize()

# 删除集合所有索引
db.col.dropIndexes()

# 删除集合指定索引
db.col.dropIndex("索引名称")

聚合方法

用于处理数据，如统计平均值，求和等操作，类似 SQL 语句中的 count(*)

aggregate() 方法

db.col.aggregate(AGGREGATE_OPERATION)
# 其中 AGGREGATE_OPERATION

# 例1 求和
db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : 1}}}])
# 类似于 SQL 的： select by_user, count(*) from mycol group by by_user

# 例1 格式处理后
db.mycol.aggregate(
	[
		{
			$group : {
				_id : "$by_user", num_tutorial : {$sum : 1}
			}
		}
	]
)

聚合表达式

表达式	描述	实例
$sum	计算总和。	db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}])
$avg	计算平均值	db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}])
$min	获取集合中所有文档对应值得最小值。	db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}])
$max	获取集合中所有文档对应值得最大值。	db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}])
$push	将值加入一个数组中，不会判断是否有重复的值。	db.mycol.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}])
$addToSet	将值加入一个数组中，会判断是否有重复的值，若相同的值在数组中已经存在了，则不加入。	db.mycol.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}])
$first	根据资源文档的排序获取第一个文档数据。	db.mycol.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}])
$last	根据资源文档的排序获取最后一个文档数据	db.mycol.aggregate([{$group : {_id : "$by_user", last_url : {$last : "$url"}}}])

管道

管道在 Unix 和 Linux 中用于将当前命令的输出结果作为下一个命令的参数

MongoDB 的聚合管道将文档在一个管道处理完毕后，将结果传递给下一个管道处理，管道操作是可以重复的

表达式：处理输入文档并输出。是无状态的，只能用于计算按当前聚合管道的文档，不能处理其他的文档

聚合框架的常用操作：

$project：修改输入文档的结构。可以用来重命名、增加或删除域，也可以用于创建计算结果以及嵌套文档。
$match：用于过滤数据，只输出符合条件的文档。$match使用MongoDB的标准查询操作。
$limit：用来限制MongoDB聚合管道返回的文档数。
$skip：在聚合管道中跳过指定数量的文档，并返回余下的文档。
$unwind：将文档中的某一个数组类型字段拆分成多条，每条包含数组中的一个值。
$group：将集合中的文档分组，可用于统计结果。
$sort：将输入文档排序后输出。
$geoNear：输出接近某一地理位置的有序文档。

# 两个管道的例子
# 先处理 $match 管道，获取分数在70~90之间的记录，然后处理 $group 管道，计算和数
db.articles.aggregate( [
                        { $match : { score : { $gt : 70, $lte : 90 } } },
                        { $group: { _id: null, count: { $sum: 1 } } }
                       ] );

posted @ 2021-11-04 14:26 景北斗阅读(1075) 评论(0) 收藏举报

刷新页面返回顶部

吕杰的博客