摘要: 创建并显示原始内容 其中的lxml第三方解释器加快解析速度 import bs4 from bs4 import BeautifulSoup html_str = """ <html><head><title>The Dormouse's story</title></head> <body> <p 阅读全文
posted @ 2019-06-02 22:12 大浪淘沙、 阅读(347) 评论(0) 推荐(0)
摘要: 基本模型 请求与响应 import urllib.request as urllib2 request=urllib2.Request('http://www.zhihu.com') response=urllib2.urlopen(request) html=response.read() pri 阅读全文
posted @ 2019-06-02 19:18 大浪淘沙、 阅读(304) 评论(0) 推荐(0)
摘要: import urllib2 源地址 在python3.3里面,用urllib.request代替urllib2 import urllib.request as urllib2 import cookielib 源地址 Python3中,import cookielib改成 import http 阅读全文
posted @ 2019-06-02 17:28 大浪淘沙、 阅读(806) 评论(1) 推荐(0)