爬取大规模数据并且保存在mongoDB
为了使用mongoDB,首先得安装一下三个软件:
1、安装MongoDB
2、安装第三方库 pymongo
3、安装pycharm的MongoDB插件
启动:net start MongoDB
在Python中使用mongodb:
1、导入Python和mongodb连接用到一个库import pymongo
2、激活安装在本地电脑的mongodb客户端:client = pymongo.MongoClient('localhost', 27017)
3、给数据库取名称:welden = client['welden']
4、创建一个表名:sheet_line = welden['sheet_line']
5、往数据表中添加数据:sheet_tab.insert_one(data)
$lt、 $lte 、$gt、 $gte、 $ ne 依次等于<、 <=、 > 、 >= 、 !=
6、数据库的操作:
for item in sheet_tab.find({'word': {'$lt': 1}}):
print(item)