摘要: 网络爬虫也称为网络蜘蛛、网络机器人,抓取网络的数据。其实就是用Python程序模仿人点击浏览器并访问网站,而且模仿的越逼真越好。一般爬取数据的目的主要是用来做数据分析,或者公司项目做数据测试,公司业务所需数据。而数据来源可以来自于公司内部数据,第三方平台购买的数据,还可以通过网络爬虫爬取数据。pyt 阅读全文
posted @ 2019-09-03 10:15 凌逆战 阅读(662) 评论(0) 推荐(0) 编辑
摘要: 字符串常用方法 csv模块 作用:将爬取的数据存放到本地的csv文件中 使用流程 Windows中使用csv模块默认会在每行后面添加一个空行,使用newline=''可解决 with open('xxx.csv','w',newline='') as f: 猫眼电影top100抓取案例 确定URL网 阅读全文
posted @ 2019-09-03 09:35 凌逆战 阅读(1439) 评论(0) 推荐(0) 编辑