BeautifulSoup
摘要:安装BeautifulSoup 1.Linux 系统上的安装: sudo apt-get install python-bs4 2.Mac系统 pip install beatifulsoup4 3.Windows系统 pip install beatifulsoup4 html = urlopen
阅读全文
posted @
2019-06-10 15:36
Little_Raccoon
阅读(175)
推荐(0)
爬虫requests库
摘要:response.text 返回的是一个 unicode 型的文本数据 response.content 返回的是 bytes 型的二进制数据 为什么请求需要带上header? 模拟浏览器,欺骗服务器,获取和浏览器一致的内容 header的形式:字典 用法:requests.get(url,head
阅读全文
posted @
2019-06-03 20:41
Little_Raccoon
阅读(172)
推荐(0)
爬虫贴吧
摘要:import requests class TiebaSpider: def __init__(self,tieba_name): self.tieba_name = tieba_name self.url_temp = "https://tieba.baidu.com/f?kw="+tieba_name+"&ie=utf-8&pn={}" ...
阅读全文
posted @
2019-06-03 20:17
Little_Raccoon
阅读(249)
推荐(0)