07 2019 档案

初识python 之 爬虫:爬取双色球中奖号码信息
摘要:#!/user/bin env python # author:Simple-Sir # time:2019/7/29 16:32 # 爬取双色球中奖号码数据 # 1、获取双色球网页中,中奖号码信息数据 # 2、将数据放入excle(学习使用python将数据写入excel) # 3、分别将红球中奖 阅读全文

posted @ 2019-07-30 16:53 Simple-Sir 阅读(4258) 评论(0) 推荐(1)

初识python 之 爬虫:BeautifulSoup 的 find、find_all、select 方法
摘要:from bs4 import BeautifulSoup lxml 以lxml形式解析html,例:BeautifulSoup(html,'lxml') # 注:html5lib 容错率最高find 返回找到的第一个标签find_all 以list的形式返回找到的所有标签limit 指定返回的标签 阅读全文

posted @ 2019-07-26 22:39 Simple-Sir 阅读(21005) 评论(0) 推荐(2)

初识python 之 爬虫:爬取中国天气网数据
摘要:用到模块: 获取网页并解析:import requests,html5lib from bs4 import BeautifulSoup 使用pyecharts的Bar可视化工具“绘制图表”,写入HTML文件,附pyecharts官方中文API地址:https://pyecharts.org/#/f 阅读全文

posted @ 2019-07-26 17:21 Simple-Sir 阅读(2904) 评论(0) 推荐(0)

初识python 之 爬虫:爬取豆瓣电影最热评论
摘要:主要用到lxml的etree解析网页代码,xpath获取HTML标签。 代码如下: 1 #!/user/bin env python 2 # author:Simple-Sir 3 # time:2019/7/17 22:08 4 # 获取豆瓣网正在上映电影最热评论 5 import request 阅读全文

posted @ 2019-07-20 22:24 Simple-Sir 阅读(1805) 评论(0) 推荐(0)

初识python 之 爬虫:爬取某电影网站信息
摘要:注:此代码仅用于个人爱好学习使用,不涉及任何商业行为! 话不多说,直接上代码: 1 #!/user/bin env python 2 # author:Simple-Sir 3 # time:2019/7/20 20:36 4 # 获取电影天堂详细信息 5 import requests 6 fro 阅读全文

posted @ 2019-07-20 22:07 Simple-Sir 阅读(1396) 评论(0) 推荐(0)

初识python 之 爬虫:爬取某网站的壁纸图片
摘要:用到的主要知识点:requests.get 获取网页HTMLetree.HTML 使用lxml解析器解析网页xpath 使用xpath获取网页标签信息、图片地址request.urlretrieve 下载图片(注:该网站使用urlretrieve下载图片时,返回403错误。原因目前未知!) 改用 w 阅读全文

posted @ 2019-07-17 17:31 Simple-Sir 阅读(622) 评论(0) 推荐(0)

HTTP 状态码整理
摘要: 阅读全文

posted @ 2019-07-09 10:56 Simple-Sir 阅读(203) 评论(0) 推荐(0)

导航