2019 年 6月 2 日随笔档案 - 大浪淘沙、

2019年6月2日

摘要：创建并显示原始内容其中的lxml第三方解释器加快解析速度 import bs4 from bs4 import BeautifulSoup html_str = """ <html><head><title>The Dormouse's story</title></head> <body> <p 阅读全文

posted @ 2019-06-02 22:12 大浪淘沙、阅读(347) 评论(0) 推荐(0)

python网络爬虫（4）结构与基本概念

摘要：基本模型请求与响应 import urllib.request as urllib2 request=urllib2.Request('http://www.zhihu.com') response=urllib2.urlopen(request) html=response.read() pri 阅读全文

posted @ 2019-06-02 19:18 大浪淘沙、阅读(304) 评论(0) 推荐(0)

python网络爬虫（3）python爬虫遇到的各种问题（python版本、进程等）

摘要： import urllib2 源地址在python3.3里面，用urllib.request代替urllib2 import urllib.request as urllib2 import cookielib 源地址 Python3中，import cookielib改成 import http 阅读全文

posted @ 2019-06-02 17:28 大浪淘沙、阅读(806) 评论(1) 推荐(0)

大浪淘沙、

不积跬步无以至千里，不积小流无以成江海，骐骥一跃不能十步，驽马十驾功在不舍。

公告