摘要:
爬取网站:第一PPT(http://www.1ppt.com/) 此网站真的良心 老样子,先上最后成功的源码(在D盘创建一个"D:\PPT"文件夹,直接将代码执行就可获取到PPT): import requests import urllib import os from bs4 import Be 阅读全文
posted @ 2020-03-16 12:50
塔克拉玛攻城狮
阅读(6641)
评论(1)
推荐(0)
摘要:
经过上一期爬取豆瓣影评成功后,感觉爬虫还不错,于是想爬点图片来玩玩... 搜狗图片地址:https://pic.sogou.com/?from=category 先上最后成功的源码(在D盘下创建souGouImg文件夹,直接直接代码即可获取): import requests import urll 阅读全文
posted @ 2020-03-16 12:42
塔克拉玛攻城狮
阅读(2402)
评论(0)
推荐(0)
摘要:
豆瓣网站:https://movie.douban.com/chart 先上最后的代码: from bs4 import BeautifulSoup from lxml import html import xml import requests from fake_useragent import 阅读全文
posted @ 2020-03-16 12:35
塔克拉玛攻城狮
阅读(1503)
评论(0)
推荐(0)
摘要:
1、requests库 http协议中,最常用的就是GET方法: import requests response = requests.get('http://www.baidu.com') print(response.status_code) # 打印状态码 print(response.ur 阅读全文
posted @ 2020-03-16 12:02
塔克拉玛攻城狮
阅读(3934)
评论(0)
推荐(1)

浙公网安备 33010602011771号