06 2019 档案
BeautifulSoup
摘要:安装BeautifulSoup 1.Linux 系统上的安装: sudo apt-get install python-bs4 2.Mac系统 pip install beatifulsoup4 3.Windows系统 pip install beatifulsoup4 html = urlopen 阅读全文
posted @ 2019-06-10 15:36 Little_Raccoon 阅读(175) 评论(0) 推荐(0)
爬虫requests库
摘要:response.text 返回的是一个 unicode 型的文本数据 response.content 返回的是 bytes 型的二进制数据 为什么请求需要带上header? 模拟浏览器,欺骗服务器,获取和浏览器一致的内容 header的形式:字典 用法:requests.get(url,head 阅读全文
posted @ 2019-06-03 20:41 Little_Raccoon 阅读(172) 评论(0) 推荐(0)
爬虫贴吧
摘要:import requests class TiebaSpider: def __init__(self,tieba_name): self.tieba_name = tieba_name self.url_temp = "https://tieba.baidu.com/f?kw="+tieba_name+"&ie=utf-8&pn={}" ... 阅读全文
posted @ 2019-06-03 20:17 Little_Raccoon 阅读(249) 评论(0) 推荐(0)