MongDB
MongDB:非关系型数据库(强大、灵活且易于扩展的通用型)

非关系型:也需要建库,也需要建表(但是不叫表,叫做集合,不一定是一一对应关系的)
两表要建立关系,不需要外键,而是用存档解决。
1、易用性
MongoDB是一个面向文档(document-oriented)的数据库,而不是关系型数据库。 不采用关系型主要是为了获得更好得扩展性。当然还有一些其他好处,与关系数据库相比,面向文档的数据库不再有“行“(row)的概念取而代之的是更为灵活的“文档”(document)模型。 通过在文档中嵌入文档和数组,面向文档的方法能够仅使用一条记录来表现复杂的层级关系,这与现代的面向对象语言的开发者对数据的看法一致。
2、易扩展性
应用程序数据集的大小正在以不可思议的速度增长。随着可用带宽的增长和存储器价格的下降,即使是一个小规模的应用程序,需要存储的数据量也可能大的惊人,甚至超出了很多数据库的处理能力。过去非常罕见的T级数据,现在已经是司空见惯了。
3、丰富的功能
MongoDB作为一款通用型数据库,除了能够创建、读取、更新和删除数据之外,还提供了一系列不断扩展的独特功能。- 索引
通用二级索引,允许多种快速查询,且提供唯一索引、复合索引、地理空间索引、全文索引。 - 聚合
支持聚合管道,用户能通过简单的片段创建复杂的集合,并通过数据库自动优化。 - 特殊的集合类型
支持存在时间有限的集合,适用于那些将在某个时刻过期的数据,如会话session。类似地,MongoDB也支持固定大小的集合,用于保存近期数据,如日志等... - 文件存储
支持一种非常易用的协议,用于存储大文件和文件元数据。MongoDB并不具备一些在关系型数据库中很普遍的功能,如链接join和复杂的多行事务。省略这些的功能是处于架构上的考虑,或者说为了得到更好的扩展性,因为在分布式系统中这两个功能难以高效地实现。
4、卓越的性能

二 MongoDB基础知识
集合就是一对大括号,在python中就是用字典展示的
1、文档
文档是MongoDB的核心概念。文档就是键值对的一个有序集{'msg': 'hello', 'name': 'tank'}。类似于python中的有序字典。
'''
需要注意的是:
1、文档中的键/值对是有序的。
2、文档中的值不仅可以是在双引号里面的字符串,还可以是其他几种数据类型(甚至可以是整个嵌入的文档)。
3、MongoDB区分类型和大小写。
4、MongoDB的文档不能有重复的键。
5、文档中的值可以是多种不同的数据类型,也可以是一个完整的内嵌文档。文档的键是字符串。除了少数例外情况,键可以使用任意UTF-8字符。
文档键命名规范:
1、键不能含有\0 (空字符)。这个字符用来表示键的结尾。
2、.和$有特别的意义,只有在特定环境下才能使用。
3、以下划线"_"开头的键是保留的(不是严格要求的)
2、集合
集合就是一组文档。如果将MongoDB中的一个文档比喻为关系型数据的一行,那么一个集合相当于一张表。
'''
1、集合存在于数据库中,通常情况下为了方便管理,不同格式和类型的数据应该插入到不同的集合,但其实集合没有固定的结构,这意味着我们完全可以把不同格式和类型的数据统统插入一个集合中。
2、组织子集合的方式就是使用“.”,分隔不同命名空间的子集合。
比如一个具有博客功能的应用可能包含两个集合,分别是blog.posts和blog.authors,这是为了使组织结构更清晰,这里的blog集合(这个集合甚至不需要存在)跟它的两个子集合没有任何关系。在MongoDB中,使用子集合来组织数据非常高效,值得推荐!
3、当第一个文档插入时,集合就会被创建。合法的集合名:
集合名不能是空字符串""。
集合名不能含有\0字符(空字符),这个字符表示集合名的结尾。
集合名不能以"system."开头,这是为系统集合保留的前缀。
注意: 用户创建的集合名字不能含有保留字符。有些驱动程序的确支持在集合名里面包含,这是因为某些系统生成的集合中包含该字符。除非你要访问这种系统创建的集合,否则千万不要在名字里出现$。
'''
3、数据库
4、强调
'''
把数据库名添加到集合名前,得到集合的完全限定名,即名称空间。
例如:
如果要使用cms数据库中的blog.posts集合,这个集合的命名空间就是cmd.blog.posts。命名空间的长度不得超过121个字节,且在实际使用中应该小于100个字节。
'''

三 安装
1、安装
下载地址:
#1、安装路径为D:\MongoDB,将D:\MongoDB\bin目录加入环境变量 #2、新建目录与文件(用于数据存放) D:\MongoDB\data\db D:\MongoDB\log\mongod.log #3、新建配置文件mongod.cfg,参考:https://docs.mongodb.com/manual/reference/configuration-options/ systemLog: destination: file path: "D:\MongoDB\log\mongod.log" logAppend: true storage: journal: enabled: true dbPath: "D:\MongoDB\data\db" net: bindIp: 0.0.0.0 port: 27017 setParameter: enableLocalhostAuthBypass: false
注意:若不想配置文件,则将data\db 文件夹建立在c盘根目录下
#4、制作系统服务
mongod --config "D:\MongoDB\mongod.cfg" --bind_ip 0.0.0.0 --install 或者直接在命令行指定配置 mongod --bind_ip 0.0.0.0 --port 27017 --logpath D:\MongoDB\log\mongod.log --logappend --dbpath D:\MongoDB\data\db --serviceName "MongoDB" --serviceDisplayName "MongoDB" --install #5、启动\关闭 net start MongoDB net stop MongoDB
以管理员身份登录命令提示符,输入mongod启动mongoDB服务(不要关闭,临时服务使用)
#6、登录 mongo 链接:http://www.runoob.com/mongodb/mongodb-window-install.html 安装配置
重新打开另一个cmd(原来一个临时服务器不要关闭) ,输入mongo,进入mongo
2、账号管理
#账号管理:https://docs.mongodb.com/master/tutorial/enable-authentication/
# 1、创建账号
use admin
db.createUser(
{
user: "root",
pwd: "123",
roles: [ { role: "root", db: "admin" } ]
}
)
use test
db.createUser(
{
user: "tank",
pwd: "123",
roles: [ { role: "readWrite", db: "test" },
{ role: "read", db: "db1" } ]
}
)
# 2、重启数据库
mongod --remove
mongod --config "C:\mongodb\mongod.cfg" --bind_ip 0.0.0.0 --install --auth
# 3、登录:注意使用双引号而非单引号
mongo --port 27017 -u "root" -p "123" --authenticationDatabase "admin"
也可以在登录之后用db.auth("账号","密码")登录
mongo
use admin
db.auth("root","123")
# 推荐博客:https://www.cnblogs.com/zhoujinyi/p/4610050.html
创建账号密码+开启认证机制
mongo -u "root" -p "123" --authenticationDatabase "admin"
mysql -u root -p 123
3、命令行shell
1、mongo 127.0.0.1:27017/config #连接到任何数据库config
2、mongo --nodb #不连接到任何数据库
3、启动之后,在需要时运行new Mongo(hostname)命令就可以连接到想要的mongod了:
> conn=new Mongo('127.0.0.1:27017')
connection to 127.0.0.1:27017
> db=conn.getDB('admin')
admin
4、help查看帮助
5、mongo时一个简化的JavaScript shell,是可以执行JavaScript脚本的
shell命令行
shell命令行
四 基本数据类型
1、在概念上,MongoDB的文档与Javascript的对象相近,因而可以认为它类似于JSON。JSON(http://www.json.org)是一种简单的数据表示方式:其规范仅用一段文字就能描述清楚(其官网证明了这点),且仅包含六种数据类型。
2、这样有很多好处:易于理解、易于解析、易于记忆。然而从另一方面说,因为只有null、布尔、数字、字符串、数字和对象这几种数据类型,所以JSON的表达能力有一定的局限。
3、虽然JSON具备的这些类型已经具有很强的表现力,但绝大数应用(尤其是在于数据库打交道时)都还需要其他一些重要的类型。例如,JSON没有日期类型,这使得原本容易日期处理变得烦人。另外,JSON只有一种数字类型,无法区分浮点数和整数,更别区分32位和64位了。再者JSON无法表示其他一些通用类型,如正则表达式或函数。
4、MongoDB在保留了JSON基本键/值对特性的基础上,添加了其他一些数据类型。在不同的编程语言下,这些类型的确切表示有些许差异。下面说明了MongoDB支持的其他通用类型,以及如何正在文档中使用它们
#1、null:用于表示空或不存在的字段
d={'x':null}
#2、布尔型:true和false
d={'x':true,'y':false}
#3、数值
d={'x':3,'y':3.1415926}
#4、字符串
d={'x':'kermit'}
#5、日期
d={'x':new Date()}
d.x.getHours()
#6、正则表达式
d={'pattern':/^kermit.*?nb$/i}
正则写在//内,后面的i代表:
i 忽略大小写
m 多行匹配模式
x 忽略非转义的空白字符
s 单行匹配模式
#7、数组
d={'x':[1,'a','v']}
#8、内嵌文档
user={'name':'tank','addr':{'country':'China','city':'YT'}}
user.addr.country
#9、对象id:是一个12字节的ID,是文档的唯一标识,不可变
d={'x':ObjectId()}
5、_id 和 ObjectId
MongoDB中存储的文档必须有一个"_id"键。这个键的值可以是任意类型,默认是个ObjectId对象。
在一个集合里,每个文档都有唯一的“_id”,确保集合里每个文档都能被唯一标识。
不同集合"_id"的值可以重复,但同一集合内"_id"的值必须唯一
#1、ObjectId
ObjectId是"_id"的默认类型。因为设计MongoDb的初衷就是用作分布式数据库,所以能够在分片环境中生成
唯一的标识符非常重要,而常规的做法:在多个服务器上同步自动增加主键既费时又费力,这就是MongoDB采用
ObjectId的原因。
ObjectId采用12字节的存储空间,是一个由24个十六进制数字组成的字符串
0|1|2|3| 4|5|6| 7|8 9|10|11
时间戳 机器 PID 计数器
如果快速创建多个ObjectId,会发现每次只有最后几位有变化。另外,中间的几位数字也会变化(要是在创建过程中停顿几秒)。
这是ObjectId的创建方式导致的,如上图
时间戳单位为秒,与随后5个字节组合起来,提供了秒级的唯一性。这个4个字节隐藏了文档的创建时间,绝大多数驱动程序都会提供
一个方法,用于从ObjectId中获取这些信息。
因为使用的是当前时间,很多用户担心要对服务器进行时钟同步。其实没必要,因为时间戳的实际值并不重要,只要它总是不停增加就好。
接下来3个字节是所在主机的唯一标识符。通常是机器主机名的散列值。这样就可以保证不同主机生成不同的ObjectId,不产生冲突
接下来连个字节确保了在同一台机器上并发的多个进程产生的ObjectId是唯一的
前9个字节确保了同一秒钟不同机器不同进程产生的ObjectId是唯一的。最后3个字节是一个自动增加的 计数器。确保相同进程的同一秒产生的
ObjectId也是不一样的。
#2、自动生成_id
如果插入文档时没有"_id"键,系统会自帮你创建 一个。可以由MongoDb服务器来做这件事。
但通常会在客户端由驱动程序完成。这一做法非常好地体现了MongoDb的哲学:能交给客户端驱动程序来做的事情就不要交给服务器来做。
这种理念背后的原因是:即便是像MongoDB这样扩展性非常好的数据库,扩展应用层也要比扩展数据库层容易的多。将工作交给客户端做就
减轻了数据库扩展的负担。
4.相关命令:
>db
test //用于查看当前的数据库
> use tank ;(有则切换,无则新建,并切换到tank库中)
>show dbs //用于查看当前的数据库
admin 0.0000GB
local 0.00000GB
说明:show dbs只显示有数据的数据库,若数据库无数据则不显示,如上面的test无数据,则不显示。
五 CRUD操作 (create、read、update、delete)
1、数据库操作
#1、增
use config #如果数据库不存在,则创建数据库,否则切换到指定数据库。
#2、查
show dbs #查看所有
可以看到,我们刚创建的数据库config并不在数据库的列表中, 要显示它,我们需要向config数据库插入一些数据。
db.table1.insert({'a':1})
#3、删
use config #先切换到要删的库下
db.dropDatabase() #删除当前库
2、集合操作(对应关系型的表)
#1、增
当第一个文档插入时,集合就会被创建
> use database1
switched to db database1
> db.table1.insert({'a':1})
WriteResult({ "nInserted" : 1 })
> db.table2.insert({'b':2})
WriteResult({ "nInserted" : 1 })
#2、查
> show tables
table1
table2
#3、删
> db.table1.drop()
true
> show tables
table2
先创建库或者使用已有的库
>use yyy //其中,yyy 为数据库名
再新建一个集合(文档)
>db.student //建立集合student,...其中,db代表当前数据库
插入数据:
>db.student.insert({"name":"tank"}) //插入一条记录:即mongoDB的一条键值对
结果:WriteResult({ "nInserted" : 1 })
> db.studnet.insert([({"name1":"tank1"},({"name1":"tank2"}]) //插入多条
查数据:
> db.student.find({}) //用于查看当前集合的所有键值对
结果:{ "_id" : ObjectId("5d0b36f600b55578ed2d3bd4"), "name" : "tank" }
>db.studenrt.find({"name":"tank"}) //查找一条记录
3、文档操作
增:
# 1、没有指定_id则默认ObjectId,_id不能重复,且在插入后不可变
#2、插入单条
user0={
"name":"tank",
"age":10,
'hobbies':['music','read','dancing'],
'addr':{
'country':'China',
'city':'GD'
}
}
db.test.insert(user0)
db.test.find()
#3、插入多条
user1={
"_id":1,
"name":"tank",
"age":10,
'hobbies':['music','read','dancing'],
'addr':{
'country':'China',
'city':'GuangZhou'
}
}
user2={
"_id":2,
"name":"egon",
"age":20,
'hobbies':['music','read','run'],
'addr':{
'country':'China',
'city':'ShanDong'
}
}
user3={
"_id":3,
"name":"jason",
"age":30,
'hobbies':['music','drink'],
'addr':{
'country':'China',
'city':'AnHui'
}
}
user4={
"_id":4,
"name":"kevin",
"age":40,
'hobbies':['music','read','dancing','tea'],
'addr':{
'country':'China',
'city':'ShanDong'
}
}
user5={
"_id":5,
"name":"nick",
"age":50,
'hobbies':['music','read',],
'addr':{
'country':'China',
'city':'SH'
}
}
db.user.insertMany([user1,user2,user3,user4,user5])
插入单条与插入多条
查
# SQL:=,!=,>,<,>=,<=
# MongoDB:{key:value}代表什么等于什么,"$ne","$gt","$lt","gte","lte",其中"$ne"能用于所有数据类型
#1、select * from db1.user where name = "tank";
db.user.find({'name':'tank'})
#2、select * from db1.user where name != "tank";
db.user.find({'name':{"$ne":'tank'}})
#3、select * from db1.user where id > 2;
db.user.find({'_id':{'$gt':2}})
#4、select * from db1.user where id < 3;
db.user.find({'_id':{'$lt':3}})
#5、select * from db1.user where id >= 2;
db.user.find({"_id":{"$gte":2,}})
#6、select * from db1.user where id <= 2;
db.user.find({"_id":{"$lte":2}})
比较运算
比较运算
# SQL:and,or,not
# MongoDB:字典中逗号分隔的多个条件是and关系,"$or"的条件放到[]内,"$not"
#1、select * from db1.user where id >= 2 and id < 4;
db.user.find({'_id':{"$gte":2,"$lt":4}})
#2、select * from db1.user where id >= 2 and age < 40;
db.user.find({"_id":{"$gte":2},"age":{"$lt":40}})
#3、select * from db1.user where id >= 5 or name = "tank";
db.user.find({
"$or":[
{'_id':{"$gte":5}},
{"name":"tank"}
]
})
#4、select * from db1.user where id % 2=1;
db.user.find({'_id':{"$mod":[2,1]}})
#5、上题,取反
db.user.find({'_id':{"$not":{"$mod":[2,1]}}})
逻辑运算
# SQL:in,not in
# MongoDB:"$in","$nin"
#1、select * from db1.user where age in (20,30,31);
db.user.find({"age":{"$in":[20,30,31]}})
#2、select * from db1.user where name not in ('tank','egon');
db.user.find({"name":{"$nin":['tank','egon']}})
成员运算
正则匹配
取指定的字段
查询数组
排序
分页
获取数量
杂项
class_demo
改
update() 方法用于更新已存在的文档。语法格式如下:
db.collection.update(
<query>,
<update>,
{
upsert: <boolean>,
multi: <boolean>,
writeConcern: <document>
}
)
参数说明:对比update db1.t1 set name='KERMIT',sex='Male' where name='kermit' and age=18;
query : 相当于where条件。
update : update的对象和一些更新的操作符(如$,$inc...等,相当于set后面的
upsert : 可选,默认为false,代表如果不存在update的记录不更新也不插入,设置为true代表插入。
multi : 可选,默认为false,代表只更新找到的第一条记录,设为true,代表更新找到的全部记录。
writeConcern :可选,抛出异常的级别。
更新操作是不可分割的:若两个更新同时发送,先到达服务器的先执行,然后执行另外一个,不会破坏文档。
覆盖式
设置:$set
增加和减少:$inc
添加删除数组内元素:$push,$pop,$pull
避免添加重复:"$addToSet"
其他
class_demo
删
View Code
# 删除条件
删除 id >= 3 的一条记录,只会删除一条
删除所有 id >= 3的记录
删除所有记录
4、聚合
'''
如果你有数据存储在MongoDB中,你想做的可能就不仅仅是将数据提取出来那么简单了;你可能希望对数据进行分析并加以利用。MongoDB提供了以下 聚合工具:
1、聚合框架
2、MapReduce(详见MongoDB权威指南)
3、几个简单聚合命令:count、distinct和group。(详见MongoDB权威指南)
聚合框架:
可以使用多个构件创建一个管道,上一个构件的结果传给下一个构件。这些构件包括(括号内为构件对应的操作符):筛选($match)、投射($project)、分组($group)、排序($sort)、限制($limit)、跳过($skip)。不同的管道操作符可以任意组合,重复使用。
'''
from pymongo import MongoClient
import datetime
client=MongoClient('mongodb://root:123@localhost:27017')
table=client['db1']['emp']
# table.drop()
l=[
('kermit','male',18,'20170301','老男孩驻沙河办事处外交大使',7300.33,401,1), #以下是教学部
('alex','male',78,'20150302','teacher',1000000.31,401,1),
('wupeiqi','male',81,'20130305','teacher',8300,401,1),
('yuanhao','male',73,'20140701','teacher',3500,401,1),
('liwenzhou','male',28,'20121101','teacher',2100,401,1),
('jingliyang','female',18,'20110211','teacher',9000,401,1),
('jinxin','male',18,'19000301','teacher',30000,401,1),
('成龙','male',48,'20101111','teacher',10000,401,1),
('歪歪','female',48,'20150311','sale',3000.13,402,2),#以下是销售部门
('丫丫','female',38,'20101101','sale',2000.35,402,2),
('丁丁','female',18,'20110312','sale',1000.37,402,2),
('星星','female',18,'20160513','sale',3000.29,402,2),
('格格','female',28,'20170127','sale',4000.33,402,2),
('张野','male',28,'20160311','operation',10000.13,403,3), #以下是运营部门
('程咬金','male',18,'19970312','operation',20000,403,3),
('程咬银','female',18,'20130311','operation',19000,403,3),
('程咬铜','male',18,'20150411','operation',18000,403,3),
('程咬铁','female',18,'20140512','operation',17000,403,3)
]
for n,item in enumerate(l):
d={
"_id":n,
'name':item[0],
'sex':item[1],
'age':item[2],
'hire_date':datetime.datetime.strptime(item[3],'%Y%m%d'),
'post':item[4],
'salary':item[5]
}
table.save(d)
筛选:$match
投射:$project
分组:$group
排序:$sort、限制:$limit、跳过:$skip
随机选取n个:$sample
练习题:
''' 1. 查询岗位名以及各岗位内的员工姓名 2. 查询岗位名以及各岗位内包含的员工个数 3. 查询公司内男员工和女员工的个数 4. 查询岗位名以及各岗位的平均薪资、最高薪资、最低薪资 5. 查询男员工与男员工的平均薪资,女员工与女员工的平均薪资 6. 查询各岗位内包含的员工个数小于2的岗位名、岗位内包含员工名字、个数 7. 查询各岗位平均薪资大于10000的岗位名、平均工资 8. 查询各岗位平均薪资大于10000且小于20000的岗位名、平均工资 9. 查询所有员工信息,先按照age升序排序,如果age相同则按照hire_date降序排序 10. 查询各岗位平均薪资大于10000的岗位名、平均工资,结果按平均薪资升序排列 11. 查询各岗位平均薪资大于10000的岗位名、平均工资,结果按平均薪资降序排列,取前1个 '''
View Code六 可视化工具
七 pymongo
官网:http://api.mongodb.com/python/current/tutorial.html
View Code


浙公网安备 33010602011771号